dados abertos no estadão: o basômetro

O Estadão sai na frente dos jornais brasileiros ao seguir uma lógica já aplicada em alguns dos maiores jornais do mundo, como o Guardian ou o New York Times: jornalismo em bases de dados abertas. O site lançou uma ferramenta interativa que permite cruzar dados públicos, antes de difícil acesso, em separado, e inacessíveis até então da maneira visual como o Estadão apresenta em seu site: é o basômetro, que apresenta quais parlamentares votam mais de acordo com o governo ou com a oposição; ou seja, mede a taxa de governismo dos deputados (quem é mais base de governo ou não).

Mas não apenas foi gerada uma ferramenta de visualização complexa e de utilidade incontestável – o que já seria um avanço em relação ao jornalismo interativo praticado na internet -, mas toda a programação está aberta, disponível a quem quiser avançar pelos códigos em outras searas.

A equipe do Estadão Dados explica:

Os códigos e os dados no Basômetro estão disponíveis no Github e no Google Docs ( votos deputados em 2012 , votos deputados em 2011 , lista de votações na Câmara , votos senadores (2011 e 2012) , votações Senado ).

O Basômetro se inspirou no projeto Camaraws, de Leonardo Leite e Saulo Trento (PoliGNU – Grupo de Estudos de Software Livre da Poli-USP), que usou os resultados de votações na Câmara dos Deputados para avaliar o grau de semelhança entre os partidos (veja aqui).

O Estadão Dados é uma equipe formada por jornalistas, programadores e designers: José Roberto de Toledo, Daniel Bramatti, Eduardo Malpeli e Amanda Rossi. No projeto do Basômetro, colaboraram também Carlos Lemos, Bruno Lupion e Ricardo Periago. O Basômetro também recebeu valiosas contribuições de Fabio Sales, diretor de Arte do Grupo Estado.

A equipe também nos enviou um breve texto detalhando o processo de criação, e explicando a façanha. Atenção para uma opção já comum entre os maiores desenvolvedores, mas no Brasil pouco explorada, que é a opção por códigos alternativos ao Action Script (Flash), que rodem também em ipads, iphones, e demais equipamentos móveis.

Quando o Basômetro começou a ser criado, os resultados das votações nominais do Congresso estavam disponíveis nos sites da Câmara e do Senado apenas como arquivos isolados – um para cada votação. Não havia ainda uma visão agregada de todas as votações. Por isso, uma das primeiras etapas do trabalho foi selecionar os dados, organizá-los e limpá-los – só na Câmara, trabalhamos com mais de 50 mil linhas de dados. Todas as ferramentas que utilizamos neste processo são livres e gratuitas, como o Open Office e o Google Refine.

Ao mesmo tempo, a equipe começou a desenhar e a testar formas visuais de apresentar a informação, que permitissem ao usuário tirar conclusões rápidas, mas também possibilitasse que ele aplicasse diversos tipos de filtros para realizar análises pessoais. Por exemplo, escolher o período de tempo analisado, o partido, o estado ou o parlamentar. A ferramenta foi escrita em Javascript. A escolha da linguagem objetivou deixar a tecnologia acessível aos desenvolvedores de web. Além disso, o Javascript permite que a ferramenta rode em todas as plataformas computadores, tablets, smartphones.

Um dos princípios do Estadão Dados é a transparência. Por isso, todos os dados e códigos estão disponíveis (no Google Docs e no GitHub) e podem ser reutilizados livremente.

Um relato do Newscamp 2010

Foto: Coletivo UARA (buy cialis online

hotos/flimultimidia” target=”_blank”>mais fotos aqui)

A edição de 2010 do Newscamp atraiu muito mais do que apenas jornalistas para discutir jornalismo na internet. Advogados, músicos, acadêmicos, graduandos e graduados, blogueiros, além dos próprios jornalistas e vários profissionais de várias outras áreas da comunicação participaram durante dois dias da desconferência que aconteceu durante o Fórum da Cultura Digital Brasileira. Todos compartilharam experiências e deram início a alguns projetos coletivos.

O modelo de desconferência é permitir mais do que simples apresentações de uma mesa e debates: é um encontro aberto, onde todas as pessoas falam e participam com ideias que não morrem no evento. Para acompanhar um pouco do que foi discutido e apresentado, listamos abaixo algumas das conversas.

Formação, financiamento do jornalismo online e outros assuntos foram os primeiros a entrar na discussão, logo na manhã de segunda-feira. Aqui tem alguns depoimentos sobre.

Jornalismo colaborativo

Há controvérsias sobre como nomear o jornalismo em que o público participa de alguma maneira: colaborativo, participativo, cidadão, grassroots. O Rafael Sbarai (Veja), colocou no blog De Repente a apresentação que acabou não fazendo, mas que tem muito do debate que foi feito. A Ana Brambilla também falou sobre isso, grande pesquisadora do tema que é. Mas para além do debate semântico, também há quem diz fazer jornalismo colaborativo e apenas abre uma caixa de comentários numa reportagem. Há quem vá mais longe e discuta a pauta com o público, ou tente realizar reportagens com ajuda do cidadão na apuração.

Ana Brambilla conversou com o fundador do OhMyNews, que deixou de ser um veículo colaborativo em setembro, depois de 10 anos de experiências nesse sentido. Muitos viram isso com preocupação, de que o modelo estaria em decadência. Ana contou que o argumento deles é que não havia um público bem definido para o veículo colaborativo internacional, já que a tentativa era cobrir o mundo todo. Sem isso, o financiamento também ficava prejudicado. A avaliação é que o colaborativo funciona, mas principalmente para notícias locais.

Data driven journalism

O debate sobre jornalismo em base de dados também começou com polêmicas sobre o próprio nome da discussão. Seria todo jornalismo digital um jornalismo feito sobre base de dados, uma vez que os bits estão organizados assim?, argumentava a pesquisadora Caru Schwingel. Para ela, seria melhor falar em webjornalismo.

Pedro Valente, do Yahoo! (ouça entrevista dele aqui), contou que começou a investigar programação como jornalista porque queria ele mesmo tentar subir suas páginas para a internet. Hoje ele é um jornalista que entende de programação e que não gosta de rótulos. As fronteiras entre funções e profissões andam cada vez menos claras.

Durante o NewsCamp, Pedro Markun e Daniela Silva, da Esfera, empresa que faz parte da Casa da Cultura Digital, fizeram uma oferta de uma microbolsa de R$ 2 mil para projetos que trabalhem a abertura de dados. “Pode ser qualquer coisa, desde um curso para que jornalistas aprendam programação, até projetos que contratem um designer, ou um programador, para ajudar a realizar um trabalho”. Mais infos sobre a microbolsa, aqui.

Também surgiu ali uma proposta mais concreta: o jornalista Marcelo Soares (MTV), especialista em RAC (reportagem com com auxílio do computador, outro nome que gerou polêmica), organizou uma planilha com todas as obras do PAC. A ideia seria tentar construir o que já foi feito nos EUA, que é uma interface colaborativa de acompanhamento das obras do governo. Nenhuma redação tem capacidade para investigar todas as 2.600 obras, mas os cidadãos poderiam. Cada um poderia ser uma uma espécie de fiscal do PAC. A Esfera de um lado (Markun e Dani Silva), a FLi Multimídia de outro (Andre Deak e Felipe Lavignatti), que são algumas das empresas integrantes da Casa da Cultura Digital que estavam no NewsCamp, decidiram que vão levar adiante o projeto e integrá-lo a rede Transparência HackDay. Quem quiser participar desse projeto, junte-se à rede aqui.

Link do grupo de discussão, a rede ThackDay.

Link do site do projeto Transparência Hacker.

Abaixo, a Rede Brasil Atual fez um resumo do resultado do Newscamp:

http://www.redebrasilatual.com.br/radio/programas/jornal-brasil-atual/jornalismo_era_digital.mp3/view

E aqui tem um videozinho do que rolou: http://www.vimeo.com/16856964

E eis também alguns dos que acompanharam o #newscamp pelo Twitter (quem quiser indicar o site ou o blog, avise na caixa de comentários):

@alzimar
@anabrambilla (Terra)
@andredeak (Jornalismo Digital.org)
@caru (Cásper Líbero)
@ceila (Desabafo de Mãe)
@danielabsilva (Esfera)
@diegocasaes (Global Voices)
@emiliomoreno
@fabiomalini
@gilmar_
@juba7
@lavignatti (Jornalismo Digital.org)
@lucianosb
@lueba
@magalyprado (Cásper Líbero)
@markun (Esfera)
@nannirios
@pedrovalente (Yahoo!)
@rafaelsbarai (Veja.com)
@tsavkko