Add new comment

4
Feb

Interessante. Questionamentos e sugestões:

  • Por que abstenção vale 0.5 ao invés de um voto a menos no cálculo da média? Não que seja inadequado, tem sentido pensar assim, mas sei que eu já me abstive em votações apenas porque elas nada tinham a ver com o que eu representava, ou por não ter coletado informações o suficiente dos representados, e eu não pretendia que isso significasse algo como "apóio igualmente os dois lados". A rigor, eu prefiro ver "abstenção" (nulo) e "tanto faz" (branco) como coisas diferentes. Talvez manter duas contas em paralelo seja algo interessante. Já vi que mudaram a faixa no código para ir de -1 a 1 ao invés de 0 a 1, mas o efeito de distorção na média continua o mesmo. Melhor dizendo, usando o código que vi no partidos.py:

            vi = (1*voto.sim + 0*voto.abstencao -1*voto.nao) / (voto.sim + voto.nao + voto.abstencao)

    considera o voto em abstenção como branco. Se considerasse o voto como nulo, teríamos:

            vi = (1*voto.sim -1*voto.nao) / (voto.sim + voto.nao)

    faltou dizer que os dados são de alguma forma normalizados. Não entrei em detalhes no código para ver como são normalizados, mas imagino que o processo seja o de igualar a norma de cada vetor a 1.

  • Partidos com diferente número de votantes poderiam ser caracterizados com diferentes graus de confiança (significância). Isto me parece importante.
  • O cálculo da similaridade como projeção é algo bastante comum (lembro de ter usado isso em redes neurais), mas acho que há algumas considerações a serem feitas sobre o significado dessa medida. Por que o uso de ângulos (a projeção em vetores normalizados é a medida do cosseno do ângulo entre os vetores) seria mais eficaz que uma medida linear (e.g. metade do módulo da diferença entre os vetores normalizados)? Se não me engano tem uma passagem no livro do Haykin de redes neurais que faz uma comparação nessa direção.
  • Retirar o PDC eu não acho bom. Melhor inserir outras agregações do que substituir as que já existem.
  • Eu não diria "o voto parece ser realmente mais partidário do que individual" para esses dados, como consta nas conclusões. Para saber isso creio que seja necessária no mínimo uma medida da variância, interna aos votos do partido, a ser considerada amostral (o denominador desse caso torna a variância indeterminada no caso de partido com apenas um voto). Realmente acho que faltou uma ANOVA, ou pelo menos uma medida de significância dos estimadores.
  • Citou demais o PSOL. Não é problema ser enfático nos percentuais encontrados, entretanto há passagens que mereciam ser evitadas, como a colocação "[PSol] é um partido pequeno, tipicamente antissistema" presente na notícia da Gazeta do Povo. Para a notícia e a ferramenta serem laicas, tanto faz quem o que é o PSOL, assim como a ideologia do partido.
  • No texto do PoliGNU eu evitaria dizer que "a faixa de 60% ainda não caracteriza partidos aliados". Um número não é uma faixa (embora eu tenha entendido que o recado se refere à associação entre PSOL, PSDB e DEM), e dizer "não caracteriza" é problemático por o texto incluir uma caracterização um tanto quanto arbitrária do que é uma aliança (concordância a partir de 90%). Eu realmente acho que todos (100%) dos partidos são "aliados" de certa forma, mas isso é outro assunto. O que a faixa de 50% "mais um" a 100% diz é que na maioria das votações os partidos defenderam o mesmo voto, e mesmo que fosse 100%, isso não necessariamente significaria que há aliança entre os partidos (por mais que percentuais altos sejam convincentes). Creio que os 60% caracterizam uma concordância em cerca de metade das dimensões do espectro político, e uma discordância na outra metade, mas discordo que concordância implica em aliança.