Análise gráfica das votações da câmara dos deputados

Português, Brasil

Autores:

Leonardo Leite, http://www.ime.usp.br/~leofl/
Saulo Trento, Engenheiro eletricista

INTRODUÇÃO

Em nosso primeiro post [1] apresentamos uma comparação numérica entre a atuação dos partidos na câmara dos deputados baseada nas votações realizadas na câmara. Este primeiro post rendeu inclusive uma matéria [2] no jornal A Gazeta do Povo, do Paraná.

Neste novo post apresentaremos 1) uma nova análise realizada de forma gráfica; 2) uma correção do cálculo da semelhança, o que resultará em novos valores; e 3) a interpretação correta para os valores das semelhanças.

ANÁLISE GRÁFICA

Anteriormente obtivemos resultados de semelhanças entre partidos dois a dois: podíamos dizer a semelhança entre PT e PSDB, entre PT e PV, entre PV e PSDB, e assim por diante. Mas muito mais emocionante do que uma tabela cheia de números é um gráfico que mostre isso!

Mas tínhamos um grande problema: como representar todas essas semelhanças em um gráfico ao mesmo tempo? Note que uma primeira ideia ingênua é fazer com que a semelhança obtida seja proporcional à distância entre os partidos no gráfico. Mas na verdade fica impossível desenhar todos os partidos num mesmo plano dessa forma! Se o leitor não acredita, tente desenhar no papel quatro pontos A, B, C e D obedecendo as seguintes distâncias: AB=AC=AD=BC=BD=CD=1. Isso não é possível no plano, mas no espaço com três dimensões teríamos simplesmente o tetraedro regular. Ora, nossos vetores pertencem a um espaço de 92 dimensões!

Dado esse problema, um de nós (o Saulo, que não participou do projeto até o primeiro post) sugeriu o uso da análise de componentes principais, ou PCA [3] na sigla em inglês. Trata-se de uma técnica de análise exploratória de dados, utilizada por exemplo em data minning para a extração de significado de grandes quantidade de dados, em cujas situação a análise manual seria inviável. Daremos mais detalhes técnicos sobre o PCA na próxima seção.

E eis que aplicando o PCA obtivemos o seguinte resultado:

Figura 1 - Resultado gráfico da análise de componentes principais sobre as votações dos parlamentares na câmara dos deputados

Você pode também obter o gráfico em formato SVG clicando aqui (ou no anexo do post).

Atenção, os dados de entrada para essa análise foram as mesmas 92 votações utilizadas no último post.

Nesta análise a intenção era colocar todos os partidos, mas deixamos alguns de fora, pois são pequenos partidos (PRTB, PRP, PSL, e PHS com 1 deputado, e PMN, com 2 [4]) que estiveram totalmente ausentes em pelo menos alguma votação. Essa característica causa dificuldades matemáticas em nossa análise, e por isso eles foram excluídos.

COMO ISTO FOI FEITO // Álgebra linear!

A entrada do algoritmo PCA é um conjunto de vetores, que no nosso caso são os vetores de votações (cada partido possui um vetor, em que cada posição representa uma votação e cada valor representa a posição média do partido em relação à votação daquela posição).

O que algoritmo faz na verdade é uma mudança de base, resultando em uma base ortogonal, de forma que os vetores resultantes apresentem a seguinte propriedade: o desvio padrão entre os valores da primeira coordenada (na nova base) dos diversos vetores é máximo. O desvio padrão entre os valores da segunda coordenada é máximo desde que o segundo vetor da base seja ortogonal ao primeiro. Ou seja, se tomarmos um conjunto A formado pelos primeiros elementos de cada vetor da saída do PCA, e um conjunto B formado pelos segundos elementos de cada vetor da saída do PCA, teremos que o desvio padrão entre os elementos de A é maior que o desvio padrão dos elementos de B. Portanto, os vetores da nova base, chamados "componentes principais" são ordenados de forma que o primeiro deles é na direção da maior dispersão dos dados, o segundo segue a maior dispersão ortogonal ao primeiro e assim por diante.

Isso na prática quer dizer que as diferenças mais significativas entre os partidos foram acumuladas nas primeiras dimensões! Com isso, utilizamos as duas primeiras dimensões do vetor de cada partido para definir sua posição em um plano bi-dimensional (nosso gráfico).

Assim, é como se nosso gráfico fosse uma espécie de sombra bi-dimensional de um conjunto de dados multi-dimensionais (no nosso caso 92 dimensões). No entanto não é uma sombra qualquer, mas sim a sombra projetada de um ângulo que nos mostra muito bem o que queremos enxergar. De forma análoga, pense na sombra de uma pessoa: ao meio-dia a sombra da pessoa é aproximadamente um círculo em baixo dela, o que é uma má aproximação (pois estamos projetando segundo as direções x e y, sendo que a informação mais significativa está na altura, no eixo z), mas em outros horários já teremos sombras que revelam a forma humana.

INTERPRETAÇÃO DA ANÁLISE GRÁFICA // Política!

A primeira coisa importante a se dizer, é que a posição de cada partido foi totalmente definida pela análise PCA com base na comparação mútua entre as votações de todos os partidos.

Os significados dos eixos obtidos podem ser por nós atribuídos tendo em vista o resultado. Ou seja, após uma inspeção manual é nossa interpretação que diz que:

  • O eixo horizontal está relacionado ao apoio ao governo, indo da situação (lado esquerdo) para a oposição (lado direito).

  • O eixo vertical está relacionado à ideologia, indo da esquerda (cima) para a direita (baixo).

Outro fato importante vindo da análise PCA é que a primeira dimensão é a mais representativa. No nosso caso, esta “primeira dimensão” corresponde ao nosso eixo horizontal, o que quer dizer que a semelhança entre os partidos, i.e. a maneira de cada partido votar, é definida mais em função do apoio que cada partido dá ao governo do que por suas próprias ideologias. Isso pode ser enxergado através da observação de que o espectro de apoio ao governo (largura do gráfico) é bem mais amplo do que o espectro "ideológico" (altura do gráfico). Mais especificamente, a primeira componente explica 73% da variância, e a segunda explica 9,6%.

Alguns pontos notáveis:

  • O PT está na “extrema situação”, o que é o resultado mais sensato possível, já que é o partido do governo; mas note que na nossa modelagem matemática nada induzia a isso, logo este resultado foi realmente uma demonstração de incrível poder da análise PCA!

  • Se retirarmos o PSOL, o PT se mantém como o partido mais ideologicamente à esquerda (embora dentro de um espectro ideológico bem mais reduzido).

  • O PSOL se caracteriza como um partido radicalmente diferente de todos os demais.

  • O PV também aparenta ser um caso atípico, porém com posições mais “centralizadas”, mas se afastando o suficiente para justificar a candidatura própria em oposição ao PT.

  • Existem poucos partidos realmente de oposição atuando na câmara. O maior bloco de oposição é o conjunto PSDB, DEM e PPS.

  • Dentro do bloco do governo (Figura 2), o PDT é o partido mais opositor, embora seja (ou “por ser”?) o partido de origem da presidenta!

  • Dentro do bloco do governo, notamos que PP, PSC e PMDB estão mais ideologicamente à direita. Isto pode representar uma tentativa de manter uma mínima identidade ideológica, uma vez condicionado o apoio de forma geral ao governo.

Figura 2 - Mesmo gráfico da análise PCA focada no "bloco próximo ao governo"

NOVO RESULTADO NA ANÁLISE NUMÉRICA

Na análise anterior a posição de um partido sobre uma votação era representado com um número de 0 a 1, em que 0 representava “todos os deputados do partido votaram não”, enquanto que 1 representava “todos os deputados do partido votaram sim” (o valor 0,5 poderia significar a abstenção dos parlamentares ou a divisão de opiniões dos parlamentares do partido).

No entanto, ao rever os métodos observamos que utilizar uma faixa de -1 a 1 resultaria em resultados mais justos do que utilizar a faixa de 0 a 1, no caso de a medida de semelhança ser o produto escalar. No último post, o leitor Danilo sugeriu nos comentários que investigássemos também a medida linear de distância, e vamos aproveitar para discorrer sobre a diferença entre estas duas medidas através do exemplo a seguir:

Sejam quatro partidos A, B, C e D, e três proposições x, y e z. O partido A foi unânime nas três votações, dizendo sim para x e não para y e z, o que representamos assim com as escalas 0 a 1 (sem linha) e -1 a 1 (com linha):

 

a = (1,0,0); a'= (1,-1,-1)
 
Analogamente, os outros partidos votaram como segue:
 
b = (0,1,0); b'= (-1,1,-1)
c = (0,0,0). c'=(-1,-1,-1)
d = (0,1,1); d'=(-1,1,1)

Comparando com o partido A, é nítido que o partido D é o mais ortogonal: votou o contrário do A em todas as proposições. Gostaríamos que a semelhança entre eles fosse zero. Já o partido C votou como A em duas proposições e diferiu apenas em uma, e B diferiu de A em duas. Observe as semelhanças abaixo (calculadas com o produto escalar) e note como a escala entre 0 e 1 não reflete estas observações. Ao lado, mostramos também a distância em linha reta entre os dois vetores, que traz mais informação: por exemplo a distância maior está entre os partidos A e D, que discordam em tudo:

 

sem(a,b) = 0 % dist(a,b) = 1,41
sem(a,c) = 0 % dist(a,c) = 1
sem(a,d) = 0 % dist(a,d) = 1,73
 
Já na escala entre -1 e 1 temos:
 
sem(a',b') = 33% dist(a',b') = 2*1,41 = 2,82
sem(a',c') = 67% dist(a',c') = 2*1 = 2,00
sem(a',d') = 0% dist(a',d') = 2*1,73 = 3,46

A medida de distância simplesmente foi multiplicada por dois. Já a semelhança tal como medida pelo produto escalar nos trouxe informações interessantes: a semelhança entre A e D resultou zero, o que nos diz imediatamente que os dois discordam sempre. É fácil ver que para ter 100% dois partidos teriam que concordar sempre, e a semelhança de A com B e C mostra valores graduais. Concluímos que o valor obtido com o produto escalar apresenta uma interpretação mais direta do que a distância linear, em termos de porcentagens. Essa interpretação será explorada com mais detalhes na próxima seção.

Contudo, uma observação interessante é que o resultado da análise gráfica (resultado da PCA) é o mesmo tanto para os antigos vetores de votações, quanto para os novos vetores agora apresentados. Isso acontece justamente porque na PCA estamos tratando das distâncias (e posições relativas) entre os partidos, e não propriamente dos ângulos. Para a PCA, a posição da origem (o zero) não faz diferença (pois ela é reposicionada na média no início da análise, afim de colocar em evidência as diferenças). O resultado visual que temos no gráfico reflete as distâncias lineares entre os partidos, e nada tem a ver com os ângulos.

Após efetuar tal alteração, obtivemos uma nova lista de semelhança entre os partidos. Confira a nova lista de semelhança entre os partidos clicando aqui.

O efeito observado foi de que maneira geral os partidos se aproximaram, ou seja, eles todos são mais parecidos ainda do que supunha a análise anterior. No entanto os “agrupamentos de partidos” se mantiveram os mesmos, como por exemplo: o PSDB continua sendo mais próximo ao DEM do que ao PT.

INTERPRETAÇÃO DOS VALORES NUMÉRICOS DAS SEMELHANÇAS

Um problema da análise anterior, é que o valor obtido de semelhança (aquela porcentagem) não tinha uma interpretação direta. Por exemplo, dada a semelhança de 43% entre PT e PSDB, o que significa esse 43%?

Alguém poderia ser tentado a dizer que o PSDB apoiou o PT em 43% das propostas analisadas. Mas na verdade não é bem isso... o resultado era apenas uma quantificação para dar a ideia desse nível de apoio, mas a interpretação não era tão direta.

Com o novo método apresentado na seção anterior para o cálculo da semelhança, formulamos uma interpretação mais concreta para os números.

A interpretação nem sempre é direta porque os partidos têm nuances nas votações, e nem sempre votam "em bloco" (diremos que o partido vota "em bloco" quando todos do partido votam igual em uma votação). Contudo é possível explicar com palavras simples em alguns casos particulares.

O caso particular mais simples é o caso em que os dois partidos, A e B, votam sempre em bloco, em todas as votações. Neste caso, o valor 43% é a porcentagem de votações em que os dois partidos concordaram, e o complemento, 57%, é a porcentagem em que discordaram.

Um caso particular menos restritivo é o caso em que um dos partidos, por exemplo o partido A, sempre vota em bloco, mas o partido B pode apresentar divisões internas em algumas questões. Vamos supor que o partido B tenha 4 parlamentares, e que em certo período foram feitas 25 votações. Neste caso, houveram 100 votos do partido B, 4 para cada uma das 25 votações. O número 43% nos diz então que 43 destes 100 votos foram concordantes com a opinião do partido A (que tem sempre uma opinião única nas votações), e os demais votos foram discordantes.

No caso geral em que também o partido A apresenta divisões internas, uma interpretação em palavras do valor 43%, que seja ao mesmo tempo correta e completa, começa a ficar mais complicada. No exemplo acima, como há 25 votações, cada uma delas corresponde a 4% do total. Para as votações mais simples de analisar, em que os dois partidos, A e B, votaram em bloco, ou eles concordaram plenamente ou discordaram plenamente. Se concordaram soma-se 4% na semelhança entre os dois, e se discordaram não se soma nada. Para uma votação em que, por exemplo, os 4 parlamentares de B se dividiram, apenas 3 concordando com A enquanto que o quarto discordou, somamos apenas 3%. Para as votações em que ambos os partidos se dividiram, a porcentagem a somar seria:

 

4% * (%Asim * %Bsim + %Anão * %Bnão)
 
Onde o 4% = (100%) / (Número de votações) representa a semelhança máxima que pode ser advinda daquela votação; se houvessem 100 votações cada votação "valeria" apenas 1%. A fórmula acima funciona, é claro, também nos casos particulares em que há votações em bloco.
 
Exemplo: Em uma dada votação os votos se distribuíram como segue:
 
A votou sim sim sim sim não -> representado na álgebra por (1+1+1+1-1)/5 = 0,6
B votou não sim não não -> representado na álgebra por (-1+1-1-1)/4 = -0,5
4% * (%Asim * %Bsim + %Anão * %Bnão) = 4% * (.8*.25 + .2*.75) = 4% * (.2 +.15) =1,4%
 
No produto escalar, esta coordenada (votação) irá contribuir com 0,6*-0,5 = -0,3. Como o mapeamento é 0% para -1 e 100% para +1, a contribuição seria 35% do máximo que se pode atingir, o que mostra que os dois jeitos de pensar (com a álgebra ou com as porcentagens) são equivalentes.

PRÓXIMOS PASSOS

  • Questionar a câmara porque os web services retornaram apenas 27 das 693 proposições votadas em 2011. A totalidade desses dados seria importante para obter um resultado mais preciso!

  • Obter dados de anos anteriores, o que possibilitará uma “análise temporal”. Idealmente esses dados devem ser desde 1988.

  • Obter dados sobre os partidos com ministérios em cada ano, assim podemos relacionar o apoio ao governo nas votações da câmara com a ceção de ministérios para esses partidos.

  • Analisar que votações contribuem mais para os primeiros componentes principais, afim de descobrir (automatica- e matemagicamente) quais são as questões "polêmicas", que causam mais divergências na câmara.

  • Avaliar as dispersões internas entre os partidos.

  • Incluir o tamanho dos partidos na representação gráfica.

REFERÊNCIAS

[1] Primeiro post sobre o camaraws: http://projeto/camaraws/análise-automatizada-da-semelhança-entre-os-partidos-políticos

[2] Matéria no jornal Gazeta do Povo sobre o camaraws: http://www.gazetadopovo.com.br/vidapublica/conteudo.phtml?tl=1&id=1217527&tit=Fidelidade-a-toda-prova

[3] Análise de componentes principais (PCA): http://en.wikipedia.org/wiki/Principal_component_analysis

[4] Tamanho das bancas dos partidos na câmara: http://www2.camara.gov.br/deputados/liderancas-e-bancadas

 

21 comments

14
fev

Prezados.Muito bacana a análise. A The Economist usa um sistema semelhante (eu creio) para categorizar o volume (tamanho das bolhas) e a conexão entre os comentários e noticias, vale dar uma olhada, porque acrescenta uma dimensão a mais à análise.Uma observação:"O eixo horizontal está relacionado ao apoio ao governo, indo da situação (lado direito) para a oposição (lado esquerdo)."Acredito que seja o contrário, não? Governo da direita para a esquerda. Abraço e parabéns! HMC

14
fev

Muito interessante a idéia. :-) ... Um amigo ficou confuso com o texto abaixo, confesso que eu também. Não seria o contrário?‎"O eixo horizontal está relacionado ao apoio ao governo, indo da situação (lado direito) para a oposição (lado esquerdo)." Dúvida: Já tinha visto mapas perceptuais usando analise MDS, porque você escolheu PCA? Não sou estatístico, mas gosto de saber os conceitos para aplicar em marketing.Obrigado, 

 

14
fev

Leonardo,Novamente parabéns. Só não entendi qual foi o parametro utilizado para definir esquerda-direita.Outra coisa, acho que a posição do PDT não se explica pela relação da presidenta com o partido. Não sei dizer o que seria, mas acho pouco provavel que seja isso.abs

14
fev

Nossa, apesar de não entender nada de PCA e dessas coisas, curti muito o estudo de vocês. Parabéns!Fiquei aqui pensando em várias coisas, de como incrementar a análise e ampliar a análise política feita através do gráfico. Acho que vocês já apontaram várias coisas bem interessantes, como incluir o tamanho dos partidos nessa análise. Daria inclusive para, a partir dessa leitura, somada ao resultado final das votações, analisar o caminho que a definição das próprias políticas caminha...Outra coisa que me chamou atenção também foi a posição do PSOL, tanto no outro artigo de vocês como neste. A pesar de ter um discurso mais à esquerda (e em algumas votações de fato votar praticamente sozinho, ou com a companhia de alguns do PT) me parece que pelo estudo de vocês pode-se deduzir que na prática concreta o PSOL fortalece mais a política de partidos como o DEM e o PSDB do que do campo governista... É inevitável lembrar da votação sobre a criação da CPMF (imposto para os mais ricos) quando o PSOL votou contra isto, porque era uma proposta do governo...Por isso fico em dúvida sobre a definição que vocês fizeram sobre os eixos... Porque se o eixo vertical é  o ideológico, fica parecendo que na prática concreta, que dá respostas à vida do povo, esquerda e direita estão próximas demais, e faz menos diferença a opção ideológica do que estar no governo ou não... não consegui encontrar uma maneira de definir melhor os eixos que vocês, mas acho que seria uma boa repensá-los...bom, é isso! mais uma vez, parabéns!

14
fev

Muito interessante, parabéns!

Eu ia sugerir exatamente o que vocês planejaram pros próximos passos: "Incluir o tamanho dos partidos na representação gráfica". A maneira mais direta que vejo é a área do círculo sendo proporcional ao tamanho do partido.

Uma outra coisa bastante interessante seria usar dados de anos anteriores, como vocês planejam, e criar um gráfico "animado", como esse do Google (http://code.google.com/apis/chart/interactive/docs/gallery/motionchart.html#Example), e ver como os partidos se movimentam com o tempo (os que mudam de ideologia, mudam de situação pra oposição, mudam de grupos, etc).

15
fev

Opa, muito legal seu trabalho e o gráfico! Fiquei curioso pra saber como você determinou a posição dos partidos no eixo ideológico; que critérios utilizou? Imagino que o PT pré-PSOL estaria bem pra cima ali né? =)

15
fev

 Obrigado pelos elogios! Respondendo às perguntas: * "O eixo horizontal está relacionado ao apoio ao governo, indo da situação (lado direito) para a oposição (lado esquerdo)." Sim, é o contrário, governo ficou no lado esquerdo no gráfico. Vamos corrigir! * Quanto ao gráfico animado que mostraria os partidos "dançando" ao longo do tempo, é uma coisa que queremos tentar assim que tivermos os dados de votações de anos anteriores. Contudo é possível que apareçam algumas dificuldades matemáticas. Falaremos sobre isso quando chegar a hora! * O motivo para termos utilizado PCA e não a análise MDS (Multidimensional Scaling) é que não conhecíamos esta última! Mas pela pesquisa rápida que fiz a respeito me parece que no nosso caso, em que os pontos estão bem localizados em um espaço N-dimensional, o resultado seria exatamente o mesmo ao fazer uma MDS com norma euclidiana e função custo igual à soma dos quadrados dos erros. Aparentemente em marketing a MDS é mais usada porque depende apenas das distâncias dois a dois, então você pode pedir para o consumidor julgar a similaridade de produtos mostrando-os dois a dois para depois, através da MDS, localizá-los nos eixos de um plano ou espaço 3D, enquanto que para fazer a PCA na mesma situação você teria que forçar respostas do consumidor ao longo de diferentes eixos definidos a priori na pesquisa (sabor, atratividade da embalagem, preço, mais/menos saudável, etc.), e então você pode acabar perdendo algum eixo no qual não tenha pensado, além de tornar a pesquisa mais maçante e as respostas menos espontâneas (imagino que marqueteiros se interessem por respostas impulsivas!). * Não vamos esquecer que a interpretação do significado dos eixos veio a posteriori. Matematicamente não há motivo para pensar que um dos eixos é mais ideológico e o outro é mais governo-oposição, e as únicas coisas que o gráfico nos diz de fato é que 1) as distâncias nele são (boas) aproximações das distâncias (euclidianas) entre as votações dos partidos (em particular trata-se da melhor aproximação possível de se conseguir em um plano); e  2) O eixo horizontal é o que explica a maior parte da variância entre os partidos (73%), e o eixo vertical é o que explica a maior parte do restante da variância (9,6% do total). Se você fosse obrigado a colocar os partidos ao longo de uma linha, de forma que as distâncias entre eles dois a dois refletissem o quão parecido eles costumam votar na câmara, bastaria projetar nosso gráfico no eixo x. Para ter mais nuances, acrescenta-se o eixo y. Há ainda outros 90 eixos, mas eles agregam cada vez menos. A rigor, isso é tudo que o gráfico nos diz! Portanto, não estávamos buscando ter um eixo governo-oposição ou um eixo ideológico ou qualquer outro: simplesmente esta é uma interpretação que salta aos olhos, o que é muito interessante! A matemática porém é completamente indiferente aos nomes que damos aos eixos que ela faz aparecer.

15
fev

 

Olá pessoal,
 
em primeiro, obrigado a todos pelos comentários!
 
Vários me apontaram o erro da definição do eixo horizontal. Já consertei no texto! Valeu galera =]
 
@macário: oi, não tentei dizer q essa era necessariamente a explicação pra posição do PDT, mas tentei frisar que era algo meio inusitado justo o PDT apresentar esta característica
 
@Lira valeu Liane =D
Sim, ainda dá pra fazer mt coisa em cima disso!
Mas sim, tanto do estudo anterior quanto desse, a conclusão é q o PSOL acaba ajudando mais o bloco do PSDB do que o campo governista. Esse exemplo da CPMF eu não conhecia, mas é um bom exemplo! Contudo, neste post fica mais visível que o PSOL ainda mentem uma certa diferença significativa simultânea a esses dois blocos (pt e psdb).
Quanto ao outro aspecto q vc levantou, é também conclusão nossa: o alinhamento situação/oposição é mais significativo do que o alinhamento esquerda/direita. Essa importância seria comparável a 73% com 10%! Vide o comentário anterior do Saulo!
Talvez pra representar isso melhor a gente até pudesse fazer o eixo vertical "comprimido", mas parece q fica valendo sua afirmação: "faz menos diferença a opção ideológica do que estar no governo ou não"
 
@Gustavo tá tudo explicado no texto! =)
É uma análise matemática das votações na câmara dos deputados.
 

 

15
fev

@leofl acho que essa parte não está explicada no texto não, onde você acha que está? =) O texto faz algumas análises relacionadas a ideologia baseadas em um dos eixos, mas não explica de que forma a ideologia foi caracterizada pelo eixo. Um exemplo:"Isso pode ser enxergado através da observação de que o espectro de apoio ao governo (largura do gráfico) é bem mais amplo do que o espectro "ideológico" (altura do gráfico). Mais especificamente, a primeira componente explica 73% da variância, e a segunda explica 9,6%."O espectro ideológico portanto estaria representado pela altura do gráfico, concorda? Isso dá sustentação às seguintes análises, entre outras:"Se retirarmos o PSOL, o PT se mantém como o partido mais ideologicamente à esquerda (embora dentro de um espectro ideológico bem mais reduzido).""Dentro do bloco do governo, notamos que PP, PSC e PMDB estão mais ideologicamente à direita. Isto pode representar uma tentativa de manter uma mínima identidade ideológica, uma vez condicionado o apoio de forma geral ao governo."Em nenhum lugar do texto existe uma explicação a respeito de que critérios foram adotados para decidir como caracterizar como eixo a ideologia. Aí vem a resposta do @Saulo:"Não vamos esquecer que a interpretação do significado dos eixos veio a posteriori. Matematicamente não há motivo para pensar que um dos eixos é mais ideológico e o outro é mais governo-oposição, e as únicas coisas que o gráfico nos diz de fato é que 1) as distâncias nele são (boas) aproximações das distâncias (euclidianas) entre as votações dos partidos (em particular trata-se da melhor aproximação possível de se conseguir em um plano); e  2) O eixo horizontal é o que explica a maior parte da variância entre os partidos (73%), e o eixo vertical é o que explica a maior parte do restante da variância (9,6% do total)."O que isso me leva a entender é que o eixo só passou a representar ideologia _depois_ que o gráfico estava pronto; se a diferença entre apoio ao governo e oposição não explica a variância restante (9,6%) algo deve ter que explicar; vocês decidiram então que seria a ideologia. Mas aí a minha curiosidade permanece, portanto, sem resposta: por que a ideologia? Que critérios foram usados para escolher a ideologia como representante desse eixo?

15
fev

s/a variância restante/a maior parte da variância restante/, claro =) (eu tinha certeza de que tinha colocado linhas com <br/> explicitamente, acabei postando uma wall of text =(

15
fev

Dica: seria legal ver as votações didivíduais e analisar o nível de fidelidade partidária dos deputados. Ou seja, trabalhar com os parlamentares, não como os partidos.m Seria algo completamente diferente, mais complexo e super interessante para analisar. Unindo os pontos da votações individuais (ou melhor, sombras das 92 dimensões), pode se obeter (em hipótese), espécies de "manchas" dos partidos.Outra coisa, o tamanho do partido é uma variável muito importante para ser dignorada na visualização, pois demonstra o poder de barganha de cada grupo, o peso maior nas votações e a correpondência política disso no processo legislativo (hipoteticamente, pequenos partidos, podem ter menos compromisso, mesmo na base de governo, não possuem ministérios e secretarias e tem pouco a perder).Parabéns pelo trabalho!  

15
fev

Olá Jorge,

 

de fato, até já no deram também essa ideia de fazer "manchas de deputados" em vez de circunferências de partidos. Espero que cheguemos lá!

Mas quanto ao tamanho do partido ser representado, acredito que já será para mais em breve.

16
fev

Olá, parabéns pelo trabalho. Muito legal. Gostaria de sugerir como parte da melhoria e se conseguir os dados de outros anos, fazer o histórico no gráfico indicando os caminhos tomados por cada partido nos últimos anos. Saudações e boa sorte!  

21
fev

Espero que cheguemos lá!

17
fev

Leonardo, parabéns pelo post. Excelente! Ter usado ACP para estudar o Congresso foi uma ótima sacada.Você poderia colocar também o total da variância explicada para os dois eixos, as vezes a ACP pode ser "pouco" explicativa, apesar de ter um gráfico de saída bacana.Outra coisa, foram mais de 600 votações, mas nem todas foram nominais, o que não entra no sistema da câmara, das nominais não foram 100.Proponho uma parceria, poderíamos fazer o mesmo estudo analisando por redes, o que acha? Se conseguirmos os dados ao longo do ano, poderíamos faze-lo animado!

21
fev

Olá Max,

em primeiro lugar, a sacada da ACP devemos ao Saulo! :)

O "total da variância explicada para os dois eixos" está no post. É de 73% para o eixo horizontal e 9,6% para o eixo vertical.

> "foram mais de 600 votações, mas nem todas foram nominais, o que não entra no sistema da câmara, das nominais não foram 100"

desculpa, não entendi sua frase... só sei que das mais de 600 proposição, só conseguimos analisar 27 proposições (mais de 90 votações)

Como assim "analisando por redes"? num saquei x)

Quanto ao gráfico animado, é o que queremos fazer! =D

17
fev

Notei que em https://github.com/leonardofl/camaraws/blob/master/resultados/semelhanca... o partido PSB está duplicado, sendo comparado com cada partido duas vezes, e com ele próprio no final da lista.Não acho que mude nada nos resultados, mas fica aí o aviso.Parabéns pelo trabalho, gostei muito. 

17
fev

Achei a origem desta duplicação: vetores.py, linha 14. 

21
fev

Nossa, muito obrigado Marcos! Vamos corrigir isso!

Legal, esta é a ideia toda do software livre, permitir que a comunidade encontre erros e participe do desenvolvimento =)

20
jul

O trabalho ficou show de bola!
Pena que quem entende tudo isso, no universo "povo brasileiro", são duas minorias desse país varonil: os menos de 1% que têm acesso à educação superior de qualidade (ainda assim me questiono se realmente a totalidade do 1% entende esse trabalho), mas que são totalmente deixados de lado pelo governo; e os tradicionais grupos ricos que realmente dão as cartas nesse país (situação da qual a maioria massacrante daquele "povo brasileiro" se convence, erroneamente, de que não há como reverter esse quadro).
Mas para graduandos, graduados e pós-graduados, esse trabalho é muito interessante e de leitura obrigatória, independente das opiniões ideológicas. Vamos ver se a galera entende. Poderia ser uma mudança de rumo desse país.
Valeu!

7
ago

Oi Carlos,

obrigado pelos elogios!

Acho que parte desse nosso trabalho é a crença na mudança de paradigmas, quem sabe juntar o "saber popular" com o "saber científico" e com o "saber digital", e fazer sair dai algo de diferente. Levar a cultura hacker além do submundo da tecnologia. Não que isso seja fácil, mas se não começarmos nunca chegaremos lá né?!

Abraços!

Comentar