Dados públicos, eleições e netcidadania: o que a Rússia pode ensinar ao Brasil?

Please enable / Bitte aktiviere JavaScript!
Veuillez activer / Por favor activa el Javascript![ ? ]

Receba os artigos diretamente no seu email


Há pouco mais de um mês, em 4/12, a Rússia promovia suas eleições legislativas. Desde então se tem ouvido várias acusações de fraude, algumas delas baseadas em vídeos que, claro, vieram parar na Internet. Como este aqui, que mostra uma suposta falsificação de cédulas eleitorais e que foi transmitido por emissoras de TV de todo o mundo.

Bem menos atenção mereceu uma suposta prova estatística de fraude eleitoral, divulgada por um blogueiro russo. A “prova” – um gráfico que agrupa as seções eleitorais de acordo com o comparecimento às urnas – aponta para um número absurdamente alto de seções com índice de comparecimento de 100%.

russia

Note que, à direita do eixo horizontal (x), próximo ao índice de 100% de presença, a linha dá um salto – o que, segundo o blogueiro, evidenciaria a fraude. É que a natureza aleatória dos motivos que levam alguém a não votar no dia da eleição deveria fazer com que a série de números de comparecimento por seção eleitoral seguisse o padrão de uma distribuição normal, cujo gráfico lembra a forma de um sino (ver exemplo abaixo, produzido artificialmente no Excel).

Distribuição normal

A conclusão do blogueiro é que, se a distribuição não é do tipo normal, algo “não aleatório”, ou intencional, deve ter acontecido – e intencional aqui, na interpretação da oposição russa, significa o preenchimento fraudulento de cédulas de votação no lugar dos eleitores ausentes.

No Brasil
E no caso do Brasil, como seriam esses gráficos? Revelariam eles fatos atípicos como no caso da Rússia? Bem, graças aos dados detalhados que o Tribunal Superior Eleitoral (TSE) oferece em seu site, qualquer cidadão pode encontrar a resposta – desde que tenha  razoável conhecimento de ferramentas de tratamento de dados.

>>> Leia também: Banda larga no Brasil, pior que a da Etiópia? De jeito nenhum!

A mina de ouro aqui é o Boletim de Urna, uma seção que traz dados sobre quem recebeu votos em quais seções. O Numeralia partiu dos dados do 1.o turno das Eleições 2010 para coletar os totais de eleitores registrados, comparecimentos e ausências, por zona e seção eleitoral, Estado por Estado. A partir daí, construímos, no Excel, tabelas...

de distribuição de frequência que mostram, para cada faixa de porcentual de comparecimento (graduada em 0,5%), o total de seções eleitorais que nela se enquadram.

O principal desafio foi lidar com a grande massa de dados do TSE. Só o arquivo do Estado de São Paulo tem 13,3 milhões de linhas, e o Excel trabalha no máximo com 1 milhão. Por isso, apelamos para o banco de dados MySQL: consolidamos os dados por seção eleitoral via comando “Select Distinct” e usamos o Excel apenas como front end, por meio de uma conexão ODBC.

Todo esse trabalho resultou em um gráfico para cada Estado, nos moldes do produzido pelo blogueiro russo. O de São Paulo, por exemplo, lembra muito nosso exemplo de curva da distribuição normal:

sp

Outros gráficos, no entanto, apresentaram traçados um tanto bizarros. O do Amazonas, por exemplo, apresenta dois pontos máximos, enquanto o de Alagoas é particularmente interessante por não ter ponto máximo bem definido.

am

al

Os dados do TSE não permitem ir muito longe na criação de hipóteses que expliquem essas diferenças de níveis de abstenção entre as seções eleitorais, mas convidam a interessantes exercícios de data mining – seu nível de detalhamento permite, por exemplo, descobrir, para as urnas do Amazonas com índice de comparecimento entre 70% e 80% (o intervalo do primeiro ponto máximo), quais foram os candidatos locais mais votados.

Conclusão: não dá para dizer que a Rússia serve de exemplo ao Brasil em termos de transparência  – e a língua, aqui, representa um senhor obstáculo a um observador estrangeiro -, mas os blogueiros russos, por sua atitude, certamente têm alguma coisa a ensinar sobre cidadania na web.

A coleção completa dos gráficos para cada Estado do País produzidos pelo Numeralia pode ser vista no SlideShare, no link abaixo.

Brasil histograma de comparecimento no primeiro turno das eleições 2010, por estado

View more presentations from ronesan

Fonte:Numeralia