dados abertos no estadão: o basômetro

O Estadão sai na frente dos jornais brasileiros ao seguir uma lógica já aplicada em alguns dos maiores jornais do mundo, como o Guardian ou o New York Times: jornalismo em bases de dados abertas. O site lançou uma ferramenta interativa que permite cruzar dados públicos, antes de difícil acesso, em separado, e inacessíveis até então da maneira visual como o Estadão apresenta em seu site: é o basômetro, que apresenta quais parlamentares votam mais de acordo com o governo ou com a oposição; ou seja, mede a taxa de governismo dos deputados (quem é mais base de governo ou não).

Mas não apenas foi gerada uma ferramenta de visualização complexa e de utilidade incontestável – o que já seria um avanço em relação ao jornalismo interativo praticado na internet -, mas toda a programação está aberta, disponível a quem quiser avançar pelos códigos em outras searas.

A equipe do Estadão Dados explica:

Os códigos e os dados no Basômetro estão disponíveis no Github e no Google Docs ( votos deputados em 2012 , votos deputados em 2011 , lista de votações na Câmara , votos senadores (2011 e 2012) , votações Senado ).

O Basômetro se inspirou no projeto Camaraws, de Leonardo Leite e Saulo Trento (PoliGNU – Grupo de Estudos de Software Livre da Poli-USP), que usou os resultados de votações na Câmara dos Deputados para avaliar o grau de semelhança entre os partidos (veja aqui).

O Estadão Dados é uma equipe formada por jornalistas, programadores e designers: José Roberto de Toledo, Daniel Bramatti, Eduardo Malpeli e Amanda Rossi. No projeto do Basômetro, colaboraram também Carlos Lemos, Bruno Lupion e Ricardo Periago. O Basômetro também recebeu valiosas contribuições de Fabio Sales, diretor de Arte do Grupo Estado.

A equipe também nos enviou um breve texto detalhando o processo de criação, e explicando a façanha. Atenção para uma opção já comum entre os maiores desenvolvedores, mas no Brasil pouco explorada, que é a opção por códigos alternativos ao Action Script (Flash), que rodem também em ipads, iphones, e demais equipamentos móveis.

Quando o Basômetro começou a ser criado, os resultados das votações nominais do Congresso estavam disponíveis nos sites da Câmara e do Senado apenas como arquivos isolados – um para cada votação. Não havia ainda uma visão agregada de todas as votações. Por isso, uma das primeiras etapas do trabalho foi selecionar os dados, organizá-los e limpá-los – só na Câmara, trabalhamos com mais de 50 mil linhas de dados. Todas as ferramentas que utilizamos neste processo são livres e gratuitas, como o Open Office e o Google Refine.

Ao mesmo tempo, a equipe começou a desenhar e a testar formas visuais de apresentar a informação, que permitissem ao usuário tirar conclusões rápidas, mas também possibilitasse que ele aplicasse diversos tipos de filtros para realizar análises pessoais. Por exemplo, escolher o período de tempo analisado, o partido, o estado ou o parlamentar. A ferramenta foi escrita em Javascript. A escolha da linguagem objetivou deixar a tecnologia acessível aos desenvolvedores de web. Além disso, o Javascript permite que a ferramenta rode em todas as plataformas computadores, tablets, smartphones.

Um dos princípios do Estadão Dados é a transparência. Por isso, todos os dados e códigos estão disponíveis (no Google Docs e no GitHub) e podem ser reutilizados livremente.

Visualização de dados em mapas no jornalismo do New York Times

Por Felipe Lavignatti

Os dados dos censos produzidos pelo IBGE podem ser incrivelmente detalhados e difíceis de visualizar – e é aí que entra o trabalho dos bons jornalistas do século 21. Com recursos de interatividade e de visualização de dados e

m mapas, é possível comparar cidades em diversos aspectos sociais e econômicos. No Brasil, esses dados sempre são mostrados na imprensa com gráficos em barra ou linha, de maneiras simples e sem muita criatividade. Quando transpostos para um mapa, então, os dados nunca mostram todos os graus das diferenças que as pesquisam apontam.

Nos EUA, os dados disponíveis pelo censo norte-americano foram usados pelo The New York Times para criar um mapa de etnias dos cidadãos americanos: negros, brancos, asiáticos ou latinos, conforme cada um se identifica. A solução comum neste tipo de mapas seria mostrar uma cor predominante para cada cidade, conforme for a maioria de seus habitantes. o NYT fez diferente, e representou as etnias por micro-regiões, chegando a identificar quase cada quadra.

Peguemos Manhattan, acima, por exemplo. Colocar uma cor só ali seria uma informação errada. É interessante notar que na parte sul da ilha temos uma predominância de brancos, enquanto na parte norte – a mais pobre – temos muito mais negros e hispânicos. No sul, em Chinatown, temos muito mais pontos representando os asiáticos.

Os sites jornalísticos brasileiros poderiam criar algo do tipo com dados do Censo brasileiro. Seria interessante notar essas diferenças em um nível maior do que somente de cidades para cidades, mas perceber como os bairros de distinguem.

Facebook

Na mesma semana, outro mapa que também chamou a atenção foi o do Facebook, mostrando a navegação entre os usuários. Na verdade nem é bem um mapa, mas sim uns pontos para cada lugar onde há alguém com uma conta no Facebook.

Para perceber isso, basta verificiar a Rússia, cujo norte não está sequer desenhado no mapa, pois não há usuários ali. O Brasil mostra como o Facebook é muito mais popular nos grandes centros. O Centro-Oeste quase não tem linhas. Aqui no Brasil o Orkut ainda reina absoluto, o que pode explicar esses vazios.