Análise gráfica das votações da câmara dos deputados

Update: O projeto hoje se chama Radar Parlamentar e transformou-se numa ferramenta interativa que pode ser utilizada em: http://radarparlamentar.polignu.org

Autores:

Leonardo Leite, http://www.ime.usp.br/~leofl/
Saulo Trento, Engenheiro eletricista

INTRODUÇÃO

Em nosso primeiro post [1] apresentamos uma comparação numérica entre a atuação dos partidos na câmara dos deputados baseada nas votações realizadas na câmara. Este primeiro post rendeu inclusive uma matéria [2] no jornal A Gazeta do Povo, do Paraná.

Neste novo post apresentaremos 1) uma nova análise realizada de forma gráfica; 2) uma correção do cálculo da semelhança, o que resultará em novos valores; e 3) a interpretação correta para os valores das semelhanças.

ANÁLISE GRÁFICA

Anteriormente obtivemos resultados de semelhanças entre partidos dois a dois: podíamos dizer a semelhança entre PT e PSDB, entre PT e PV, entre PV e PSDB, e assim por diante. Mas muito mais emocionante do que uma tabela cheia de números é um gráfico que mostre isso!

Mas tínhamos um grande problema: como representar todas essas semelhanças em um gráfico ao mesmo tempo? Note que uma primeira ideia ingênua é fazer com que a semelhança obtida seja proporcional à distância entre os partidos no gráfico. Mas na verdade fica impossível desenhar todos os partidos num mesmo plano dessa forma! Se o leitor não acredita, tente desenhar no papel quatro pontos A, B, C e D obedecendo as seguintes distâncias: AB=AC=AD=BC=BD=CD=1. Isso não é possível no plano, mas no espaço com três dimensões teríamos simplesmente o tetraedro regular. Ora, nossos vetores pertencem a um espaço de 92 dimensões!

Dado esse problema, um de nós (o Saulo, que não participou do projeto até o primeiro post) sugeriu o uso da análise de componentes principais, ou PCA [3] na sigla em inglês. Trata-se de uma técnica de análise exploratória de dados, utilizada por exemplo em data minning para a extração de significado de grandes quantidade de dados, em cujas situação a análise manual seria inviável. Daremos mais detalhes técnicos sobre o PCA na próxima seção.

E eis que aplicando o PCA obtivemos o seguinte resultado:

Figura 1 - Resultado gráfico da análise de componentes principais sobre as votações dos parlamentares na câmara dos deputados

Atenção, os dados de entrada para essa análise foram as mesmas 92 votações utilizadas no último post.

Nesta análise a intenção era colocar todos os partidos, mas deixamos alguns de fora, pois são pequenos partidos (PRTB, PRP, PSL, e PHS com 1 deputado, e PMN, com 2 [4]) que estiveram totalmente ausentes em pelo menos alguma votação. Essa característica causa dificuldades matemáticas em nossa análise, e por isso eles foram excluídos.

COMO ISTO FOI FEITO // Álgebra linear!

A entrada do algoritmo PCA é um conjunto de vetores, que no nosso caso são os vetores de votações (cada partido possui um vetor, em que cada posição representa uma votação e cada valor representa a posição média do partido em relação à votação daquela posição).

O que algoritmo faz na verdade é uma mudança de base, resultando em uma base ortogonal, de forma que os vetores resultantes apresentem a seguinte propriedade: o desvio padrão entre os valores da primeira coordenada (na nova base) dos diversos vetores é máximo. O desvio padrão entre os valores da segunda coordenada é máximo desde que o segundo vetor da base seja ortogonal ao primeiro. Ou seja, se tomarmos um conjunto A formado pelos primeiros elementos de cada vetor da saída do PCA, e um conjunto B formado pelos segundos elementos de cada vetor da saída do PCA, teremos que o desvio padrão entre os elementos de A é maior que o desvio padrão dos elementos de B. Portanto, os vetores da nova base, chamados "componentes principais" são ordenados de forma que o primeiro deles é na direção da maior dispersão dos dados, o segundo segue a maior dispersão ortogonal ao primeiro e assim por diante.

Isso na prática quer dizer que as diferenças mais significativas entre os partidos foram acumuladas nas primeiras dimensões! Com isso, utilizamos as duas primeiras dimensões do vetor de cada partido para definir sua posição em um plano bi-dimensional (nosso gráfico).

Assim, é como se nosso gráfico fosse uma espécie de sombra bi-dimensional de um conjunto de dados multi-dimensionais (no nosso caso 92 dimensões). No entanto não é uma sombra qualquer, mas sim a sombra projetada de um ângulo que nos mostra muito bem o que queremos enxergar. De forma análoga, pense na sombra de uma pessoa: ao meio-dia a sombra da pessoa é aproximadamente um círculo em baixo dela, o que é uma má aproximação (pois estamos projetando segundo as direções x e y, sendo que a informação mais significativa está na altura, no eixo z), mas em outros horários já teremos sombras que revelam a forma humana.

INTERPRETAÇÃO DA ANÁLISE GRÁFICA // Política!

A primeira coisa importante a se dizer, é que a posição de cada partido foi totalmente definida pela análise PCA com base na comparação mútua entre as votações de todos os partidos.

Os significados dos eixos obtidos podem ser por nós atribuídos tendo em vista o resultado. Ou seja, após uma inspeção manual é nossa interpretação que diz que:

  • O eixo horizontal está relacionado ao apoio ao governo, indo da situação (lado esquerdo) para a oposição (lado direito).

  • O eixo vertical está relacionado à ideologia, indo da esquerda (cima) para a direita (baixo).

Outro fato importante vindo da análise PCA é que a primeira dimensão é a mais representativa. No nosso caso, esta “primeira dimensão” corresponde ao nosso eixo horizontal, o que quer dizer que a semelhança entre os partidos, i.e. a maneira de cada partido votar, é definida mais em função do apoio que cada partido dá ao governo do que por suas próprias ideologias. Isso pode ser enxergado através da observação de que o espectro de apoio ao governo (largura do gráfico) é bem mais amplo do que o espectro "ideológico" (altura do gráfico). Mais especificamente, a primeira componente explica 73% da variância, e a segunda explica 9,6%.

Alguns pontos notáveis:

  • O PT está na “extrema situação”, o que é o resultado mais sensato possível, já que é o partido do governo; mas note que na nossa modelagem matemática nada induzia a isso, logo este resultado foi realmente uma demonstração de incrível poder da análise PCA!

  • Se retirarmos o PSOL, o PT se mantém como o partido mais ideologicamente à esquerda (embora dentro de um espectro ideológico bem mais reduzido).

  • O PSOL se caracteriza como um partido radicalmente diferente de todos os demais.

  • O PV também aparenta ser um caso atípico, porém com posições mais “centralizadas”, mas se afastando o suficiente para justificar a candidatura própria em oposição ao PT.

  • Existem poucos partidos realmente de oposição atuando na câmara. O maior bloco de oposição é o conjunto PSDB, DEM e PPS.

  • Dentro do bloco do governo (Figura 2), o PDT é o partido mais opositor, embora seja (ou “por ser”?) o partido de origem da presidenta!

  • Dentro do bloco do governo, notamos que PP, PSC e PMDB estão mais ideologicamente à direita. Isto pode representar uma tentativa de manter uma mínima identidade ideológica, uma vez condicionado o apoio de forma geral ao governo.

Figura 2 - Mesmo gráfico da análise PCA focada no "bloco próximo ao governo"

NOVO RESULTADO NA ANÁLISE NUMÉRICA

Na análise anterior a posição de um partido sobre uma votação era representado com um número de 0 a 1, em que 0 representava “todos os deputados do partido votaram não”, enquanto que 1 representava “todos os deputados do partido votaram sim” (o valor 0,5 poderia significar a abstenção dos parlamentares ou a divisão de opiniões dos parlamentares do partido).

No entanto, ao rever os métodos observamos que utilizar uma faixa de -1 a 1 resultaria em resultados mais justos do que utilizar a faixa de 0 a 1, no caso de a medida de semelhança ser o produto escalar. No último post, o leitor Danilo sugeriu nos comentários que investigássemos também a medida linear de distância, e vamos aproveitar para discorrer sobre a diferença entre estas duas medidas através do exemplo a seguir:

Sejam quatro partidos A, B, C e D, e três proposições x, y e z. O partido A foi unânime nas três votações, dizendo sim para x e não para y e z, o que representamos assim com as escalas 0 a 1 (sem linha) e -1 a 1 (com linha):

 

a = (1,0,0); a'= (1,-1,-1)
 
Analogamente, os outros partidos votaram como segue:
 
b = (0,1,0); b'= (-1,1,-1)
c = (0,0,0). c'=(-1,-1,-1)
d = (0,1,1); d'=(-1,1,1)

Comparando com o partido A, é nítido que o partido D é o mais ortogonal: votou o contrário do A em todas as proposições. Gostaríamos que a semelhança entre eles fosse zero. Já o partido C votou como A em duas proposições e diferiu apenas em uma, e B diferiu de A em duas. Observe as semelhanças abaixo (calculadas com o produto escalar) e note como a escala entre 0 e 1 não reflete estas observações. Ao lado, mostramos também a distância em linha reta entre os dois vetores, que traz mais informação: por exemplo a distância maior está entre os partidos A e D, que discordam em tudo:

 

sem(a,b) = 0 % dist(a,b) = 1,41
sem(a,c) = 0 % dist(a,c) = 1
sem(a,d) = 0 % dist(a,d) = 1,73
 
Já na escala entre -1 e 1 temos:
 
sem(a',b') = 33% dist(a',b') = 2*1,41 = 2,82
sem(a',c') = 67% dist(a',c') = 2*1 = 2,00
sem(a',d') = 0% dist(a',d') = 2*1,73 = 3,46

A medida de distância simplesmente foi multiplicada por dois. Já a semelhança tal como medida pelo produto escalar nos trouxe informações interessantes: a semelhança entre A e D resultou zero, o que nos diz imediatamente que os dois discordam sempre. É fácil ver que para ter 100% dois partidos teriam que concordar sempre, e a semelhança de A com B e C mostra valores graduais. Concluímos que o valor obtido com o produto escalar apresenta uma interpretação mais direta do que a distância linear, em termos de porcentagens. Essa interpretação será explorada com mais detalhes na próxima seção.

Contudo, uma observação interessante é que o resultado da análise gráfica (resultado da PCA) é o mesmo tanto para os antigos vetores de votações, quanto para os novos vetores agora apresentados. Isso acontece justamente porque na PCA estamos tratando das distâncias (e posições relativas) entre os partidos, e não propriamente dos ângulos. Para a PCA, a posição da origem (o zero) não faz diferença (pois ela é reposicionada na média no início da análise, afim de colocar em evidência as diferenças). O resultado visual que temos no gráfico reflete as distâncias lineares entre os partidos, e nada tem a ver com os ângulos.

Após efetuar tal alteração, obtivemos uma nova lista de semelhança entre os partidos. Confira a nova lista de semelhança entre os partidos clicando aqui.

O efeito observado foi de que maneira geral os partidos se aproximaram, ou seja, eles todos são mais parecidos ainda do que supunha a análise anterior. No entanto os “agrupamentos de partidos” se mantiveram os mesmos, como por exemplo: o PSDB continua sendo mais próximo ao DEM do que ao PT.

INTERPRETAÇÃO DOS VALORES NUMÉRICOS DAS SEMELHANÇAS

Um problema da análise anterior, é que o valor obtido de semelhança (aquela porcentagem) não tinha uma interpretação direta. Por exemplo, dada a semelhança de 43% entre PT e PSDB, o que significa esse 43%?

Alguém poderia ser tentado a dizer que o PSDB apoiou o PT em 43% das propostas analisadas. Mas na verdade não é bem isso... o resultado era apenas uma quantificação para dar a ideia desse nível de apoio, mas a interpretação não era tão direta.

Com o novo método apresentado na seção anterior para o cálculo da semelhança, formulamos uma interpretação mais concreta para os números.

A interpretação nem sempre é direta porque os partidos têm nuances nas votações, e nem sempre votam "em bloco" (diremos que o partido vota "em bloco" quando todos do partido votam igual em uma votação). Contudo é possível explicar com palavras simples em alguns casos particulares.

O caso particular mais simples é o caso em que os dois partidos, A e B, votam sempre em bloco, em todas as votações. Neste caso, o valor 43% é a porcentagem de votações em que os dois partidos concordaram, e o complemento, 57%, é a porcentagem em que discordaram.

Um caso particular menos restritivo é o caso em que um dos partidos, por exemplo o partido A, sempre vota em bloco, mas o partido B pode apresentar divisões internas em algumas questões. Vamos supor que o partido B tenha 4 parlamentares, e que em certo período foram feitas 25 votações. Neste caso, houveram 100 votos do partido B, 4 para cada uma das 25 votações. O número 43% nos diz então que 43 destes 100 votos foram concordantes com a opinião do partido A (que tem sempre uma opinião única nas votações), e os demais votos foram discordantes.

No caso geral em que também o partido A apresenta divisões internas, uma interpretação em palavras do valor 43%, que seja ao mesmo tempo correta e completa, começa a ficar mais complicada. No exemplo acima, como há 25 votações, cada uma delas corresponde a 4% do total. Para as votações mais simples de analisar, em que os dois partidos, A e B, votaram em bloco, ou eles concordaram plenamente ou discordaram plenamente. Se concordaram soma-se 4% na semelhança entre os dois, e se discordaram não se soma nada. Para uma votação em que, por exemplo, os 4 parlamentares de B se dividiram, apenas 3 concordando com A enquanto que o quarto discordou, somamos apenas 3%. Para as votações em que ambos os partidos se dividiram, a porcentagem a somar seria:

 

4% * (%Asim * %Bsim + %Anão * %Bnão)
 
Onde o 4% = (100%) / (Número de votações) representa a semelhança máxima que pode ser advinda daquela votação; se houvessem 100 votações cada votação "valeria" apenas 1%. A fórmula acima funciona, é claro, também nos casos particulares em que há votações em bloco.
 
Exemplo: Em uma dada votação os votos se distribuíram como segue:
 
A votou sim sim sim sim não -> representado na álgebra por (1+1+1+1-1)/5 = 0,6
B votou não sim não não -> representado na álgebra por (-1+1-1-1)/4 = -0,5
4% * (%Asim * %Bsim + %Anão * %Bnão) = 4% * (.8*.25 + .2*.75) = 4% * (.2 +.15) =1,4%
 
No produto escalar, esta coordenada (votação) irá contribuir com 0,6*-0,5 = -0,3. Como o mapeamento é 0% para -1 e 100% para +1, a contribuição seria 35% do máximo que se pode atingir, o que mostra que os dois jeitos de pensar (com a álgebra ou com as porcentagens) são equivalentes.

PRÓXIMOS PASSOS

  • Questionar a câmara porque os web services retornaram apenas 27 das 693 proposições votadas em 2011. A totalidade desses dados seria importante para obter um resultado mais preciso!

  • Obter dados de anos anteriores, o que possibilitará uma “análise temporal”. Idealmente esses dados devem ser desde 1988.

  • Obter dados sobre os partidos com ministérios em cada ano, assim podemos relacionar o apoio ao governo nas votações da câmara com a ceção de ministérios para esses partidos.

  • Analisar que votações contribuem mais para os primeiros componentes principais, afim de descobrir (automatica- e matemagicamente) quais são as questões "polêmicas", que causam mais divergências na câmara.

  • Avaliar as dispersões internas entre os partidos.

  • Incluir o tamanho dos partidos na representação gráfica.

REFERÊNCIAS

[1] Primeiro post sobre o camaraws: https://polignu.org/camaraws/análise-automatizada-da-semelhança-entre-os-partidos-políticos

[2] Matéria no jornal Gazeta do Povo sobre o camaraws: http://www.gazetadopovo.com.br/vidapublica/conteudo.phtml?tl=1&id=1217527&tit=Fidelidade-a-toda-prova

[3] Análise de componentes principais (PCA): http://en.wikipedia.org/wiki/Principal_component_analysis

[4] Tamanho das bancas dos partidos na câmara: http://www2.camara.gov.br/deputados/liderancas-e-bancadas

 

Português, Brasil

56 comments

14
fev

Prezados.Muito bacana a análise. A The Economist usa um sistema semelhante (eu creio) para categorizar o volume (tamanho das bolhas) e a conexão entre os comentários e noticias, vale dar uma olhada, porque acrescenta uma dimensão a mais à análise.Uma observação:"O eixo horizontal está relacionado ao apoio ao governo, indo da situação (lado direito) para a oposição (lado esquerdo)."Acredito que seja o contrário, não? Governo da direita para a esquerda. Abraço e parabéns! HMC

29
mai

Ótima análise. Nunca imaginei usar PCA pra estudar política, eu uso pra estudar Astrofísica hahaha.
Voc6e acabou de deixar a política mais interessante e fácil de entender. Quanto ao gráfico eu sugeriria trocar os eixos para que o horizontal represente a ideologia esquerda pra esquerda e direita pra direita (mais intuitivo) e o eixo-vertical representando o distanciamento do governo, quanto mais longe da origem mais distante do governo. E por favor né, você que faz exatas, como faz um gráfico sem desenhar e nomear eixos na imagem? Cadê seu orientador? rsrsrs

6
set

Como destacamos no texto, o gráfico não tem eixos desenhados porque ele não possui eixos definidos.

O Gráfico não foi construído com base em dois eixos fixos e "temáticos".

Apenas na foto mostrada é que nós identificamos (a posteriori) essa relação (em nosso ponto de vista), mas com a mesma análise com outra amostra, de outros períodos, essa questão dos "eixos" (espectro ideológico e governoXoposição) não foi identificada da mesma maneira. Isso é inerente do PCA.

14
fev

Muito interessante a idéia. :-) ... Um amigo ficou confuso com o texto abaixo, confesso que eu também. Não seria o contrário?‎"O eixo horizontal está relacionado ao apoio ao governo, indo da situação (lado direito) para a oposição (lado esquerdo)." Dúvida: Já tinha visto mapas perceptuais usando analise MDS, porque você escolheu PCA? Não sou estatístico, mas gosto de saber os conceitos para aplicar em marketing.Obrigado, 

 

14
fev

Leonardo,Novamente parabéns. Só não entendi qual foi o parametro utilizado para definir esquerda-direita.Outra coisa, acho que a posição do PDT não se explica pela relação da presidenta com o partido. Não sei dizer o que seria, mas acho pouco provavel que seja isso.abs

5
jun

Exatamente foi a minha mesma dúvida. Quanto ao eixo oposição-situação é objetiva a quantificação (votações no parlamento), já quanto ao outro eixo esquerda-direita, ficou carente de explanação esse critério. Isto realmente é um trbalho muito importante e digno de aplausos. Como sugestão, além desta anterior, interessante seria incluir partidos-referência em âmbito internacional (democrats, republicans, afora os europeus) e fazer um gradiente internacional dos partidos. O problema são os critérios direita e esquerda, que não sei se apenas as bandeiras tradicionais de cada grupo seria suficiente, porque ainda assim haveria ingerência subjetiva.

6
set

Conforme exposto no texto, essa questão dos "eixos" foi uma análise feita com base no gráfico e a posteriori, essas informações de "Oposição x Situação" e "Esquerda x Direita" não fazem parte dos cálculos que levaram ao gráfico.
Tanto é assim que se vocês acessarem o site (radarparlamentar.polignu.org) poderão ver esse gráfico ao longo do tempo, e lá perceberam que essa relação de eixos não existe no nosso gráfico de maneira geral.

Quanto a comparar "com o mundo", não temos como fazer porque não temos votações em comum entre o parlamento brasileiro e de outros países que nos permitam essa comparação com a técnica que estamos utilizando, seria apenas por inferências subjetivas - que tentamos evitar.

14
fev

Nossa, apesar de não entender nada de PCA e dessas coisas, curti muito o estudo de vocês. Parabéns!Fiquei aqui pensando em várias coisas, de como incrementar a análise e ampliar a análise política feita através do gráfico. Acho que vocês já apontaram várias coisas bem interessantes, como incluir o tamanho dos partidos nessa análise. Daria inclusive para, a partir dessa leitura, somada ao resultado final das votações, analisar o caminho que a definição das próprias políticas caminha...Outra coisa que me chamou atenção também foi a posição do PSOL, tanto no outro artigo de vocês como neste. A pesar de ter um discurso mais à esquerda (e em algumas votações de fato votar praticamente sozinho, ou com a companhia de alguns do PT) me parece que pelo estudo de vocês pode-se deduzir que na prática concreta o PSOL fortalece mais a política de partidos como o DEM e o PSDB do que do campo governista... É inevitável lembrar da votação sobre a criação da CPMF (imposto para os mais ricos) quando o PSOL votou contra isto, porque era uma proposta do governo...Por isso fico em dúvida sobre a definição que vocês fizeram sobre os eixos... Porque se o eixo vertical é  o ideológico, fica parecendo que na prática concreta, que dá respostas à vida do povo, esquerda e direita estão próximas demais, e faz menos diferença a opção ideológica do que estar no governo ou não... não consegui encontrar uma maneira de definir melhor os eixos que vocês, mas acho que seria uma boa repensá-los...bom, é isso! mais uma vez, parabéns!

30
mai

Parabéns aos envolvidos no estudo, muito interessante a modelagem feita para tentar explicar o comportamento dos partidos políticos brasileiros. Só não entendi o que o Lira quis dizer sobre a CPMF ser imposto sobre os mais ricos. Durante a vigência do tributo citado, ele incidiu sobre qualquer movimentação financeira (exceto aplicações e resgates em fundos de investimento e CDB's/RDB's), portanto incidia sobre quaisquer lançamentos em conta corrente, ou até mesmo em poupança, eram taxados. Incidia sobre o pagamento de salários efetuados via banco! Dado o grande nível de bancarização do Brasil não entendo como este tributo possa ser classificado como "imposto para os mais ricos", visto que não havia nem ao menos progressividade na alíquota conforme o valor da transação a ser taxada. Abraços.

14
fev

Muito interessante, parabéns!

Eu ia sugerir exatamente o que vocês planejaram pros próximos passos: "Incluir o tamanho dos partidos na representação gráfica". A maneira mais direta que vejo é a área do círculo sendo proporcional ao tamanho do partido.

Uma outra coisa bastante interessante seria usar dados de anos anteriores, como vocês planejam, e criar um gráfico "animado", como esse do Google (http://code.google.com/apis/chart/interactive/docs/gallery/motionchart.html#Example), e ver como os partidos se movimentam com o tempo (os que mudam de ideologia, mudam de situação pra oposição, mudam de grupos, etc).

15
fev

Opa, muito legal seu trabalho e o gráfico! Fiquei curioso pra saber como você determinou a posição dos partidos no eixo ideológico; que critérios utilizou? Imagino que o PT pré-PSOL estaria bem pra cima ali né? =)

15
fev

 Obrigado pelos elogios! Respondendo às perguntas: * "O eixo horizontal está relacionado ao apoio ao governo, indo da situação (lado direito) para a oposição (lado esquerdo)." Sim, é o contrário, governo ficou no lado esquerdo no gráfico. Vamos corrigir! * Quanto ao gráfico animado que mostraria os partidos "dançando" ao longo do tempo, é uma coisa que queremos tentar assim que tivermos os dados de votações de anos anteriores. Contudo é possível que apareçam algumas dificuldades matemáticas. Falaremos sobre isso quando chegar a hora! * O motivo para termos utilizado PCA e não a análise MDS (Multidimensional Scaling) é que não conhecíamos esta última! Mas pela pesquisa rápida que fiz a respeito me parece que no nosso caso, em que os pontos estão bem localizados em um espaço N-dimensional, o resultado seria exatamente o mesmo ao fazer uma MDS com norma euclidiana e função custo igual à soma dos quadrados dos erros. Aparentemente em marketing a MDS é mais usada porque depende apenas das distâncias dois a dois, então você pode pedir para o consumidor julgar a similaridade de produtos mostrando-os dois a dois para depois, através da MDS, localizá-los nos eixos de um plano ou espaço 3D, enquanto que para fazer a PCA na mesma situação você teria que forçar respostas do consumidor ao longo de diferentes eixos definidos a priori na pesquisa (sabor, atratividade da embalagem, preço, mais/menos saudável, etc.), e então você pode acabar perdendo algum eixo no qual não tenha pensado, além de tornar a pesquisa mais maçante e as respostas menos espontâneas (imagino que marqueteiros se interessem por respostas impulsivas!). * Não vamos esquecer que a interpretação do significado dos eixos veio a posteriori. Matematicamente não há motivo para pensar que um dos eixos é mais ideológico e o outro é mais governo-oposição, e as únicas coisas que o gráfico nos diz de fato é que 1) as distâncias nele são (boas) aproximações das distâncias (euclidianas) entre as votações dos partidos (em particular trata-se da melhor aproximação possível de se conseguir em um plano); e  2) O eixo horizontal é o que explica a maior parte da variância entre os partidos (73%), e o eixo vertical é o que explica a maior parte do restante da variância (9,6% do total). Se você fosse obrigado a colocar os partidos ao longo de uma linha, de forma que as distâncias entre eles dois a dois refletissem o quão parecido eles costumam votar na câmara, bastaria projetar nosso gráfico no eixo x. Para ter mais nuances, acrescenta-se o eixo y. Há ainda outros 90 eixos, mas eles agregam cada vez menos. A rigor, isso é tudo que o gráfico nos diz! Portanto, não estávamos buscando ter um eixo governo-oposição ou um eixo ideológico ou qualquer outro: simplesmente esta é uma interpretação que salta aos olhos, o que é muito interessante! A matemática porém é completamente indiferente aos nomes que damos aos eixos que ela faz aparecer.

15
fev

 

Olá pessoal,
 
em primeiro, obrigado a todos pelos comentários!
 
Vários me apontaram o erro da definição do eixo horizontal. Já consertei no texto! Valeu galera =]
 
@macário: oi, não tentei dizer q essa era necessariamente a explicação pra posição do PDT, mas tentei frisar que era algo meio inusitado justo o PDT apresentar esta característica
 
@Lira valeu Liane =D
Sim, ainda dá pra fazer mt coisa em cima disso!
Mas sim, tanto do estudo anterior quanto desse, a conclusão é q o PSOL acaba ajudando mais o bloco do PSDB do que o campo governista. Esse exemplo da CPMF eu não conhecia, mas é um bom exemplo! Contudo, neste post fica mais visível que o PSOL ainda mentem uma certa diferença significativa simultânea a esses dois blocos (pt e psdb).
Quanto ao outro aspecto q vc levantou, é também conclusão nossa: o alinhamento situação/oposição é mais significativo do que o alinhamento esquerda/direita. Essa importância seria comparável a 73% com 10%! Vide o comentário anterior do Saulo!
Talvez pra representar isso melhor a gente até pudesse fazer o eixo vertical "comprimido", mas parece q fica valendo sua afirmação: "faz menos diferença a opção ideológica do que estar no governo ou não"
 
@Gustavo tá tudo explicado no texto! =)
É uma análise matemática das votações na câmara dos deputados.
 

 

15
fev

@leofl acho que essa parte não está explicada no texto não, onde você acha que está? =) O texto faz algumas análises relacionadas a ideologia baseadas em um dos eixos, mas não explica de que forma a ideologia foi caracterizada pelo eixo. Um exemplo:"Isso pode ser enxergado através da observação de que o espectro de apoio ao governo (largura do gráfico) é bem mais amplo do que o espectro "ideológico" (altura do gráfico). Mais especificamente, a primeira componente explica 73% da variância, e a segunda explica 9,6%."O espectro ideológico portanto estaria representado pela altura do gráfico, concorda? Isso dá sustentação às seguintes análises, entre outras:"Se retirarmos o PSOL, o PT se mantém como o partido mais ideologicamente à esquerda (embora dentro de um espectro ideológico bem mais reduzido).""Dentro do bloco do governo, notamos que PP, PSC e PMDB estão mais ideologicamente à direita. Isto pode representar uma tentativa de manter uma mínima identidade ideológica, uma vez condicionado o apoio de forma geral ao governo."Em nenhum lugar do texto existe uma explicação a respeito de que critérios foram adotados para decidir como caracterizar como eixo a ideologia. Aí vem a resposta do @Saulo:"Não vamos esquecer que a interpretação do significado dos eixos veio a posteriori. Matematicamente não há motivo para pensar que um dos eixos é mais ideológico e o outro é mais governo-oposição, e as únicas coisas que o gráfico nos diz de fato é que 1) as distâncias nele são (boas) aproximações das distâncias (euclidianas) entre as votações dos partidos (em particular trata-se da melhor aproximação possível de se conseguir em um plano); e  2) O eixo horizontal é o que explica a maior parte da variância entre os partidos (73%), e o eixo vertical é o que explica a maior parte do restante da variância (9,6% do total)."O que isso me leva a entender é que o eixo só passou a representar ideologia _depois_ que o gráfico estava pronto; se a diferença entre apoio ao governo e oposição não explica a variância restante (9,6%) algo deve ter que explicar; vocês decidiram então que seria a ideologia. Mas aí a minha curiosidade permanece, portanto, sem resposta: por que a ideologia? Que critérios foram usados para escolher a ideologia como representante desse eixo?

15
fev

s/a variância restante/a maior parte da variância restante/, claro =) (eu tinha certeza de que tinha colocado linhas com <br/> explicitamente, acabei postando uma wall of text =(

27
set

Opa, então talvez não esteja claro no texto mesmo. Mas a resposta é "não escolhermos a ideologia como eixo". Após termos o resultado gráfico, olhamos o gráfico e vimos "nossa! o eixo vertical parece o eixo da ideologia!"

15
fev

Dica: seria legal ver as votações didivíduais e analisar o nível de fidelidade partidária dos deputados. Ou seja, trabalhar com os parlamentares, não como os partidos.m Seria algo completamente diferente, mais complexo e super interessante para analisar. Unindo os pontos da votações individuais (ou melhor, sombras das 92 dimensões), pode se obeter (em hipótese), espécies de "manchas" dos partidos.Outra coisa, o tamanho do partido é uma variável muito importante para ser dignorada na visualização, pois demonstra o poder de barganha de cada grupo, o peso maior nas votações e a correpondência política disso no processo legislativo (hipoteticamente, pequenos partidos, podem ter menos compromisso, mesmo na base de governo, não possuem ministérios e secretarias e tem pouco a perder).Parabéns pelo trabalho!  

15
fev

Olá Jorge,

 

de fato, até já no deram também essa ideia de fazer "manchas de deputados" em vez de circunferências de partidos. Espero que cheguemos lá!

Mas quanto ao tamanho do partido ser representado, acredito que já será para mais em breve.

16
fev

Olá, parabéns pelo trabalho. Muito legal. Gostaria de sugerir como parte da melhoria e se conseguir os dados de outros anos, fazer o histórico no gráfico indicando os caminhos tomados por cada partido nos últimos anos. Saudações e boa sorte!  

21
fev

Espero que cheguemos lá!

17
fev

Leonardo, parabéns pelo post. Excelente! Ter usado ACP para estudar o Congresso foi uma ótima sacada.Você poderia colocar também o total da variância explicada para os dois eixos, as vezes a ACP pode ser "pouco" explicativa, apesar de ter um gráfico de saída bacana.Outra coisa, foram mais de 600 votações, mas nem todas foram nominais, o que não entra no sistema da câmara, das nominais não foram 100.Proponho uma parceria, poderíamos fazer o mesmo estudo analisando por redes, o que acha? Se conseguirmos os dados ao longo do ano, poderíamos faze-lo animado!

21
fev

Olá Max,

em primeiro lugar, a sacada da ACP devemos ao Saulo! :)

O "total da variância explicada para os dois eixos" está no post. É de 73% para o eixo horizontal e 9,6% para o eixo vertical.

> "foram mais de 600 votações, mas nem todas foram nominais, o que não entra no sistema da câmara, das nominais não foram 100"

desculpa, não entendi sua frase... só sei que das mais de 600 proposição, só conseguimos analisar 27 proposições (mais de 90 votações)

Como assim "analisando por redes"? num saquei x)

Quanto ao gráfico animado, é o que queremos fazer! =D

17
fev

Notei que em https://github.com/leonardofl/camaraws/blob/master/resultados/semelhanca... o partido PSB está duplicado, sendo comparado com cada partido duas vezes, e com ele próprio no final da lista.Não acho que mude nada nos resultados, mas fica aí o aviso.Parabéns pelo trabalho, gostei muito. 

17
fev

Achei a origem desta duplicação: vetores.py, linha 14. 

21
fev

Nossa, muito obrigado Marcos! Vamos corrigir isso!

Legal, esta é a ideia toda do software livre, permitir que a comunidade encontre erros e participe do desenvolvimento =)

20
jul

O trabalho ficou show de bola!
Pena que quem entende tudo isso, no universo "povo brasileiro", são duas minorias desse país varonil: os menos de 1% que têm acesso à educação superior de qualidade (ainda assim me questiono se realmente a totalidade do 1% entende esse trabalho), mas que são totalmente deixados de lado pelo governo; e os tradicionais grupos ricos que realmente dão as cartas nesse país (situação da qual a maioria massacrante daquele "povo brasileiro" se convence, erroneamente, de que não há como reverter esse quadro).
Mas para graduandos, graduados e pós-graduados, esse trabalho é muito interessante e de leitura obrigatória, independente das opiniões ideológicas. Vamos ver se a galera entende. Poderia ser uma mudança de rumo desse país.
Valeu!

7
ago

Oi Carlos,

obrigado pelos elogios!

Acho que parte desse nosso trabalho é a crença na mudança de paradigmas, quem sabe juntar o "saber popular" com o "saber científico" e com o "saber digital", e fazer sair dai algo de diferente. Levar a cultura hacker além do submundo da tecnologia. Não que isso seja fácil, mas se não começarmos nunca chegaremos lá né?!

Abraços!

29
mai

Muito interessante a análise. Eu gostaria de fazer uma pergunta. Se bem entendi, o gráfico tem dois eixo: um horizonta; outro vertical. O primeiro eixo, na interpretação de vocês, revela dois pólos (governo, do lado esquerdo, oposição, do lado direito); o segundo eixo revela dois outros pólos (esquerda acima, direita abaixo). Depois vocês dizem que é o eixo horizontal (governo-oposição) que explica a maior parte da variação entre os partidos. No entanto, a oposição (lado direito do eixo horizontal) tem claro perfil ideológico também (além de representar uma histórica aliança política no Brasil). Nesse sentido, oposição e ideologia não estão juntos? Ou seja, o comportamento de PSDB, DEM e PPS não é definido por serem oposição e por serem de direita?

6
set

Dado que essa análise de eixos ("situação x oposição" e "esquerda x direita") só vale para esta foto, e não para todas as nossas análises (ver as outras em http://radarparlamentar.polignu.org), Sim, essa leitura de que PSDB, DEM e PPS são oposição e estão no mesmo espectro ideológico faz sentido sim.

29
mai

Genial! Análise muito bem feita, precisa e criativa. Interessante ver a transparência dos dados do governo dando bons frutos.

1
jun

Parabéns, ótimo trabalho. Gostaria de sugerir uma animação que demonstrasse estas mudanças ao longo dos anos. Abraços.

6
set

Esta animação pode ser conferida em:

http://radarparlamentar.polignu.org

2
jun

Toda essa teoria pra mostrar que o PSOL é um partido diferenciado?!?! Não é o que o partido demonstra com a oposição burra e amargurada que faz no dia-dia da política nacional. Eu como eleitora posso dizer, maior arrependimento dos ultimos tempos ter votado num vereador desse partido....

6
set

Na realidade esta análise foi feita em cima dos dados brutos das votações, sem intenção de provar nenhuma teoria específica. Inclusive os dados e análises estão disponíveis e criamos uma ferramenta (http://radarparlamentar.polignu.org) para que cada pessoa possa fazer sua análise e tecer suas teorias de forma independente, sinta-se à vontade!

2
jun

Muito boa a análise!!! Que novos frutos sejam colhidos e sementes espalhadas!! Parabéns!!!

2
jun

É um dos trabalhos científicos mais importantes que li nos últimos tempos e de forma surpreendente trazendo "luzes" num dos campos mais obscuros do nosso país que é a política partidária.
Parabéns ao pessoal do PoliGNU principalmente aos autores do texto Leonardo Leite e Saulo Trento.
Airton Cerqueira Leite, sou membro da ONG RAPS (Rede de Ação Política pela Sustentabilidade), ou seja, uma ONG com sede aqui em São Paulo onde se discute exatamente a ética na política partidária do Brasil.
SP, 2 de junho de 2014

4
jun

Como vocês definiram ideologicamente ?Como vocês definiram se uma ''lei'' é de direita ou de esquerda?
Abraços

6
set

"Ideologicamente" foi utilizado dentro do contexto tradicional colocado, mas sem muita especificidade, dado que a análise dos dados que gerou o gráfico não levou esse critério em consideração, essa utilização da terminologia foi feita apenas como uma análise posterior do resultado final.
Nós não classificamos nenhuma "lei" de forma alguma. Para a análise dos dados e geração do gráfico não foi utilizado nenhum critério ou avaliação de subjetividade das votações e dos votos, apenas analisamos a semelhança ("Sim", "Não", "Abstenção", "Obstrução") sem julgar o que o "Sim" representa em cada votação.... poderia ser "Abobrinha", "Banana", "Maçã" e "Jabuticaba" no lugar das variáveis anteriores e o resultado seria o mesmo, pois só analisamos quem votou igual a quem ou diferente de quem.

2
mar

A definição do eixo esquerda-direita não foi explicada. Como foi feito esse mapemanto no eixo? Se não foi atribuído nenhum valor pras votações que possam ser relacionadas a esquerda ou direita então esse segundo eixo pode representar outros aspectos, correto? como explicar tecnicamente mas de forma acessível como a distribuição nesse eixo foi realizada?

23
mar

Conforme exposto nos comentários e também no texto, em nenhum momento é definida essa avaliação de esquerda e direita na análise dos dados e geração do gráfico. Esta é uma inferência que pode (ou não) ser realizada por quem lê o gráfico. Nós não realizamos ou utilizamos qualquer definição destes conceitos políticos/sociológicos/ideológicos no tratamento dos dados.

4
jun

Antes de mais nada, parabéns, mesmo pelo projeto. É uma das coisas que me deixa empolgado.
Continuem e que mais dados sejam abertos.

Dito isso, tem uma inferência sendo feita a partir desse gráfico, aqui e na mídia, que está errada. De que o eixo vertical representaria a variação entre esquerda e direita. Sinceramente não sei o que ela representa, mas é muito pouco provável que seja isso. Digo isso, porque o fato é que o governo, qualquer governo, em qualquer época do mundo, tem uma posição ideológica que vai ser encaixada em um ponto do espectro esquerda/direita, portanto, votar com o governo é votar com a esquerda ou a direita, a não ser em um hipotético e inexistente governo completamente de centro.
Mesmo a interpretação do eixo horizontal como governo/oposição é razoavelmente problemática, porque é uma inferência feita a partir de um dado do senso comum que "PT é governo e PSDB é oposição", apesar de provavelmente correta.
Talvez conseguir atrair gente da área de humanas para ajudar a interpretar os resultados (principalmente se o projeto evoluir para algum nível de análise qualitativa dos projetos votados) seja o melhor caminho.

6
set

Sim, concordo com essa problematização das inferências feitas. Por esse motivo que nenhuma dessas inferências é utilizada para o cálculo do posicionamento dos partidos, isso foi algo que foi identificado depois que todo resultado matemático já havia sido computado e o gráfico gerado.

Inclusive, se você observar os outros gráficos na ferramenta que criamos (radarparlamentar.polignu.org), poderá perceber que essa identificação de eixos não existe sempre em todos os recortes e casas legislativas.

E estamos abertos a colaborações e análises políticas mais elaboradas! =)

5
jun

Acredito que o objetivo é o de comparar atuação partidária, percalços de projetos que tem barramento político (a velha guerra partidária de não se aprovar um projeto de um partido opositor) e medir futuramete o político individualmente. De qualquer forma,só posso parabenizar e agradecer o estudo! Divulguem e talvez melhoremos os votos nas urnas.

5
jun

Qual pesquisa séria não colocaria o governo acima, a esquerda na esquerda, etc... ? qual pesquisa séria não distinguiria o que é liberal, conservador, progressista e estatista ? esquerda-direita é uma besteira, principalmente porque ninguém "de direita" faria tantas homenagens a Cuba e a Coréia do Norte.

5
jun

Quais os critérios usados pra determinar o que é direita e o que é esquerda ? isso não é uma pesquisa, é uma PIADA.

6
set

Caro visitante, peço que leia novamente o texto com um pouco mais de atenção e perceba que critérios subjetivos não foram utilizados para os cálculos e para geração do gráfico, essa é UMA das MUITAS possíveis interpretações do gráfico resultante.

5
jun

Muitíssimo interessante este estudo! Parabéns a todos os participantes! A metodologia matemática me parece estar perfeita, no entanto sempre tendo a tomar um pouco de cuidado quando vejo esses estudos matemáticos e por isso acho extremamente relevante a questão levantada, por duas vezes, a respeito da classificação dessas 92 variáveis com relação a ideologia política. Novamente venho a dizer que os meta-dados estão impecáveis e não duvido do poder e, talvez, nem do resultado. Porém gostaria de uma melhor explicação sobre estes critérios classificativos neste quesito, para não incorrer no possível erro de estar acreditando no resultado simplesmente por ele se ajustar, de alguma forma, ao que conhecemos - o que seria erroneo, ja que estaríamos ajustando a realidade à pesquisa e não o oposto. Mas acho que uma breve explicação sobre isso acabaria com essa problemática.

6
set

Muito obrigado pelos comentários.

Sendo direto na resposta ao seu questionamento, nós não realizamos qualquer tipo de classificação das votações, ou dos votos, para efeitos de cálculos e geração do gráfico. De forma simplificada e resumida, para os cálculos e geração do gráfico nós apenas comparamos os votos dos parlamentares, se eles votaram de forma igual ou diferente, independente do "significado subjetivo" do voto dado.

Essa análise ideológica/política/subjetiva foi realizada apenas após todos os resultados e cálculos já finalizados. Espero que tenha esclarecido um pouco melhor.

Abraços.

5
jun

Parabéns pela idéia, só tenho uma sugestão a fazer: embora tradicionalmente em PCA se organize o eixo de maior variabilidade na horizontal e por isso o fato de ser governo ou não tenha ido para a horizontal, eu acho melhor o eixo ideológico ficar na horizontal por razões históricas (esquerda e direita hehehe), assim, sugiro que você façam uma rotação dos PCA (e talvez também um espelhamento do eixo governismo).
Outra coisa pra melhorar a apresentação para fins políticos: o raio do círculo poderia ser proporcional à raiz quadrada do número de deputados.

6
set

Obrigado pelo comentário.

Quanto ao eixo, não nos preocupamos com essa "localização" pois em diferentes análises eles "mudam", apenas nesta "foto" da análise é que encontramos esses dois eixos tão bem definidos, em outras eles não se apresentam tão claramente. (Pode verificar em: http://radarparlamentar.polignu.org).

Quanto à sugestão do raio do círculo, se não me engano é o que estamos utilizando na ferramenta que construímos (link anterior).

Abraços

Comentar