Infografia interativa de código aberto

Fizemos aqui na Casa da Cultura Digital (CCD, daqui pra frente) uma infografia interativa que merece algumas linhas. Primeiro, trata-se de um trabalho do nascente grupo que chamamos de Núcleo de Infografia e Visualização de Dados da CCD.

Havíamos realizado alguns trabalhos já antes, para a revista Teoria e Debate e outros jobs. Dessa vez, unimos a agência de jornalismo Pública (Natália Viana, Ana Aranha, Fabiano Angélico), a equipe de design e desenvolvimento da Cardume, e com ajuda dos jornalistas da Scarlett (eu e Felipe Lavignatti) chegamos num modelo inovador, em que os dados todos da infografia são públicos, o código da infografia é aberto, e tudo foi usado de maneira criativa, com mapas livres, e tecnologia desenvolvida na CCD.

Com a palavra, Miguel Peixe, desenvolvedor da Cardume:

A navegação pelos dados do infográfico usa como base de dados uma planilha do Google Docs, interpretada em CSV e transformada dinamicamente em JSON para processamento em JavaScript. Ou seja, mesmo que não seja o caso de o infográfico ser atualizado, ao modificar a planilha do Google Docs, o infográfico interpreta automaticamente. Isso pode ser replicado para outros infográficos, basta estabelecer uma estrutura de cabeçalho para a planilha e alterar o código para interpretá-la corretamente.
Para cada categoria de irregularidade (cidade, programa do governo e tipo de irregularidade) fora criada uma outra planilha. Utilizando o recurso de Pivot Table do Google Docs isso foi feito automaticamente, sem precisar caçar quais são e escrever uma a uma. Dessa forma pudemos trabalhar com diferentes taxonomias dentro das irregularidades sem tomar muito recurso do sistema.
Falando especificamente da criação da planilha de cidades pude acrescentar valores que permitiram a geolocalização dentro dos mapas. A mesma planilha servindo como taxonomia de irregularidade e informação geolocalizada. Eu tinha apenas o nome da cidade e o estado, valores insuficientes para uma geolocalização, que precisa de latitude e longitude. Para resolver isso encontrei uma solução desenvolvida pelo pessoal da MapBox, um script que intepreta uma coluna, busca através de uma API pelos valores de lat-long da cidade e cria duas novas colunas preenchidas com esses valores. De forma simples e rápida tive minhas cidades mapeadas e prontas para serem usadas.
O mesmo script utilizado para geolocalizar as cidades também me permite exportar os dados em formato GeoJSON, interpretado pela tecnologia de visualização de mapas Modest Maps (com a extensão Wax e Markers.js) e pelo TileMill, software utilizado para fazer o design dos mapas.
Como eu gosto de fuçar nas coisas e gastar pouco com isso, me aventurei em fazer o nosso próprio servidor de mapas ao invés de utilizar o serviço que o MapBox oferece. Talvez isso seja história para outro relato.
Em breve, a Casa da Cultura Digital deve lançar uma oficina de mapas e usos de tecnologias livres. Se alguém tiver interesse, por favor deixe um comentário e email de contato.

Visualização de dados em mapas no jornalismo do New York Times

Por Felipe Lavignatti

Os dados dos censos produzidos pelo IBGE podem ser incrivelmente detalhados e difíceis de visualizar – e é aí que entra o trabalho dos bons jornalistas do século 21. Com recursos de interatividade e de visualização de dados e

m mapas, é possível comparar cidades em diversos aspectos sociais e econômicos. No Brasil, esses dados sempre são mostrados na imprensa com gráficos em barra ou linha, de maneiras simples e sem muita criatividade. Quando transpostos para um mapa, então, os dados nunca mostram todos os graus das diferenças que as pesquisam apontam.

Nos EUA, os dados disponíveis pelo censo norte-americano foram usados pelo The New York Times para criar um mapa de etnias dos cidadãos americanos: negros, brancos, asiáticos ou latinos, conforme cada um se identifica. A solução comum neste tipo de mapas seria mostrar uma cor predominante para cada cidade, conforme for a maioria de seus habitantes. o NYT fez diferente, e representou as etnias por micro-regiões, chegando a identificar quase cada quadra.

Peguemos Manhattan, acima, por exemplo. Colocar uma cor só ali seria uma informação errada. É interessante notar que na parte sul da ilha temos uma predominância de brancos, enquanto na parte norte – a mais pobre – temos muito mais negros e hispânicos. No sul, em Chinatown, temos muito mais pontos representando os asiáticos.

Os sites jornalísticos brasileiros poderiam criar algo do tipo com dados do Censo brasileiro. Seria interessante notar essas diferenças em um nível maior do que somente de cidades para cidades, mas perceber como os bairros de distinguem.

Facebook

Na mesma semana, outro mapa que também chamou a atenção foi o do Facebook, mostrando a navegação entre os usuários. Na verdade nem é bem um mapa, mas sim uns pontos para cada lugar onde há alguém com uma conta no Facebook.

Para perceber isso, basta verificiar a Rússia, cujo norte não está sequer desenhado no mapa, pois não há usuários ali. O Brasil mostra como o Facebook é muito mais popular nos grandes centros. O Centro-Oeste quase não tem linhas. Aqui no Brasil o Orkut ainda reina absoluto, o que pode explicar esses vazios.

Os infográficos das eleições do Estadão

O Estadão realizou um belo trabalho de infog

rafias durante a cobertura das eleições presidenciais de 2010. O resultado foi uma visualização fácil, em tempo real, que mostrava o crescimento de cada candidato da maneira que o usuário achasse melhor. Pedro Doria, Editor-Chefe de Conteúdos Digitais do jornal, contou como fizeram este trabalho para os jornalistas que estão na rede Online News Association – Brasil. Agora publicamos aqui no Jornalismo Digital.org

Pedro Doria:

Usamos os shapefiles do IBGE para produzir o mapa com os municípios a partir dos dados que o TSE enviava ao vivo.

Produzimos também dois outros mapas dedicados às cidades de São Paulo e Rio, dividido por Zonas Eleitorais.

http://www.estadao.com.br/especiais/o-2-turno-na-capital-paulista-zona-a-zona,123645.htm

http://www.estadao.com.br/especiais/o-2-turno-na-cidade-do-rio-de-janeiro-zona-a-zona,123646.htm

Neste caso foi mais complicado porque não existem shapefiles dos municípios divididos por Zona. (Nota: durante as eleições de 2008, para mapear as regiões de São Paulo, a equipe passou pelos mesmos problemas. As divisões feitas pelos correios, por exemplo, não correspondem às divisões do TRE) Tivemos que descobrir quem sabia fazer isso e encomendar.

No fim, começamos a trabalhar no projeto dos mapas em agosto para tê-los prontos para o dia do primeiro turno. Como queríamos ter mapas bastante detalhados de como o Brasil e as duas maiores capitais votaram ainda durante a contagem de votos, precisamos receber os XMLs que o TSE enviava, processá-los para inserir num banco de dados e rodar nosso software no banco, não nos arquivos simples.

Foi um trabalho que uniu a TI, a equipe de arte do Estadão.com.br e a arte do Estadão, pois queríamos já no dia seguinte à eleição publicar estes mapas no jornal. E assim foi: a concorrência tinha mapas que pintava os estados cada um de uma cor chapada, nós mostramos um quadro bem mais complexo para nossos leitores. [Evidentemente, a turma se recuperou para o segundo turno… =)]

No final, o projeto foi tocado pelo José Roberto Toledo, jornalista especializado em estatísticas, e a Gabriela Allegro, minha editora de arte no site.

Por que os mapas? Bem… porque desconfiávamos que, imitando a imprensa americana, todo mundo ia querer produzir mapas com ‘blue states’ e ‘red states’, mostrando que estados eram tucanos, que estados eram petistas e quais (se algum) eram verdes. Nos EUA, no entanto, o vencedor em um estado leva todos os votos do Colégio Eleitoral. Esta divisão faz sentido. No Brasil, em que o voto de um eleitor no Amazonas tem rigorosamente o mesmo peso do de um eleitor paulistano, a divisão não mostra nada e até engana. Faz parecer que existe uma divisão geográfica onde não há.

Como já escrevi em outra mensagem, eu acho que o Brasil está dividido, sim. E desconfio que exista um componente geográfico nesta divisão. Mas estes mapas mostram que, de simples, a divisão não tem nada.