Post on 08-Mar-2016
description
1
MARIANA SANTOS
Las posibilidades de la visualización de datos
Les voy a hablar de la experiencia que yo he vivido en The Guardian. Para resumir, lo
primero que debo decirles es que no hay una sola persona que pueda hacer de todo,
no es algo así como llegar a un periódico y decir: “Consígueme a un chico que haga
visualización de datos”. No, no es así, por lo menos en mi unidad es un trabajo de
equipo en el que se necesita, al menos, un periodista, un diseñador y un
desarrollador.
Una parte del equipo está conformada por la gente de datos que cuenta con
los periodistas y los desarrolladores que buscan datos, buscan la historia, buscan el
contenido. Ellos en conjunto con los diseñadores van a pensar cómo contar la
historia, porque, por un lado, se puede contar una historia con el tema que surge de
inmediato, pero, por otro lado, hay más historias que se pueden contar a partir de
allí. Entonces, el trabajo con el diseñador es muy importante en cuanto la elección de
la narrativa y la forma visual de contar. En mi caso particular todos mis trabajos son
para online, no hago print, pero trabajo mucho con los de print porque hay un montón
de proyectos que vienen de print y renacen para ir a online, lo que te da otras
oportunidades.
La sala de prensa de The Guardian es un espacio muy iluminado, lleno de
vidrios, y muy grande en el que todas las personas trabajan en open space1. Como
sabrán, no somos un diario privado, sobrevivimos gracias al fondo Scott Trust2, de
ahí que se esté pensando en nuevos proyectos o nuevas formas de sustentabilidad
como las Guardian Masterclasses, que son cursos y talleres de capacitación para
periodistas, diseñadores y personas que quieran hacer periodismo de investigación,
long form writing, entre otras cosas, pues el dinero en algún momento se va a acabar.
Ahora bien, The Guardian se mantiene gratis, todos los accesos son gratuitos, no
tenemos paywall, y nuestro editor quiere seguir así, pero es necesario reinventarse y
nosotros como periodistas también debemos reinventar nuestras historias, porque no
podemos continuar en el esquema de texto seguido de una foto; con el medio digital
hay que empezar a hacer cosas distintas.
Para que se hagan una idea de cómo se manejan los dineros en The Guardian
tenemos 170 desarrolladores; hace un año y medio éramos 40 y ahora somos 170. De
manera que hay mucha inversión en desarrollo, todos los productos se hacen en casa
y sé que no se puede contar con esta clase de inversiones en cualquier periódico, es
algo que nosotros tenemos las suerte de tener.
1 Open Space Technology (Tecnología del Espacio Abierto): es una técnica o metodología de diálogo o de trabajo abierto para grupos grandes o pequeños, en la que todas las personas colaboran, se autoorganizan, se apropian de los resultados, conviven, hablan y trabajan. 2 El Fideicomiso Fondo Caritativo Scott es un presupuesto anual creado para apoyar proyectos relacionados con el periodismo independiente, la ética periodística, la alfabetización mediática y la capacitación de periodistas en el Reino Unido y en el extranjero.
2
Cómo contar una historia
Quiero hablarles de uno de los trabajos que realizamos en el diario y que pasó de
print a online. La historia de los gastos del Gobierno es en general muy aburrida, es
algo de lo que las personas hablan todo el año y es, en cierta medida, un tema fuerte
porque es muy duro que corten los dineros para las pensiones, para las escuelas, etc.
Así que como pueblo nos duele directamente nuestra patria.
Todo empieza con el acceso a la información. El Gobierno publica la
información en PDF, es decir, podemos encontrar todos los gastos públicos por
secciones, uno va al sitio oficial y descarga la información. Ahora bien, si usted es
una persona especializada en análisis de datos y en análisis de manejo de dineros
pues va a entenderlo todo, pero si es una persona común que no entiende mucho de
matemáticas y gastos esta historia del PDF no le dirá mucho. Entonces, nuestro
trabajo es traducir esto para que pueda tocar a las personas y estas puedan entender
lo que sucede y, por ende, se sientan interesados en explorar y en elegir.
Primero realizamos el trabajo en print. Se llama “Atlas de gastos del
Gobierno3” y es una opción para visualizar y elegir con pelotas las diferentes
secciones y gastos del Gobierno. Claro, se ha hablado mucho de que las pelotas no
son la forma más intuitiva para identificar distintos tamaños de información, pero a
nosotros nos funcionó muy bien, pues fue clara la jerarquización y diferenciación de
la información por intensidad de colores y tamaños de las pelotas. De hecho, el
Gobierno imprimió el Atlas en tamaño gigante y lo expuso en sus oficinas para que
todos pudieran verlo, pues se presentaban allí todas las informaciones y toda la
distribución de los gastos públicos por departamentos.
Para esclarecer un poco el proceso les voy a explicar lo siguiente. The
Guardian tiene tres equipos principales de diseño. Está el equipo de diseño de print,
que son aquellos que hacen cosas de última hora, es decir, si hoy renunció el papa hay
que hacer algo para publicar en un par de horas. Luego, encontramos el design team,
que hace todo el diseño para online, como botones o layouts, cosas muy básicas y
rápidas, de alrededor de tres días de producción interactiva. Finalmente, está el
interactive team que es el equipo en el que yo estoy, allí hacemos cosas más largas, de
tres semanas o más, lo que hace que no podamos asistir a breaking news, aunque en
ocasiones hay cosas que son del breaking news y que merecen algo más desarrollado
que tomará varias semanas. Por ejemplo, con el papa hicimos algo muy rápido para el
mismo día de la renuncia, pero después el interactive team tuvo dos o tres semanas de
desarrollo, antes de la elección del nuevo papa, en el que hicimos un trabajo más
desarrollado sobre los perfiles de cada uno de los papables.
Retomando el trabajo de los gastos del Gobierno, lo que hicimos después de
la publicación en print fue hacer la parte interactiva del Atlas del impreso, en el que
el usuario podía explorar cada pelota de la que se desplegaban subcategorías y
contendidos para mirar cuánto dinero se iba a cortar y cuánto dinero se quedaba en
cada uno de los departamentos. Claro, siempre hay pros y contras en cada una de las
opciones. En el print el lector puede ver toda la pantalla y comparar todos los
3 Public spending by UK’s central government departments, 2010-2011
3
sectores, mientras que en el digital el usuario puede entrar en un departamento y
explorar dentro este, pero pierde un poco the hole picture.
Más adelante mi equipo hizo un juguete4, es decir, se contó la historia a
través de un juego para que el utilizador se entretuviera y no solamente leyera para
informarse, sino que a su vez se sintiera entretenido y relajado. Entonces, realizamos
otra vez el mismo proceso, lo separamos por departamentos y después invitamos al
usuario a ponerse en los zapatos de los encargados de la distribución de los dineros
públicos, así se le preguntaba al usuario cómo realizaría él los cortes de presupuesto.
Luego de realizado el corte, a través de una curaduría editorial, el usuario podía
copiar el link y enviárselo a sus amigos por Tweeter o Facebook y así empezar una
conversación con una base más sólida de entendimiento.
Los disturbios de Inglaterra
Los disturbios de Inglaterra fueron un suceso muy fuerte en el que las personas
salían a la calle y de repente a través de teléfonos BlackBerry empezaron a incentivar
crímenes de toda índole, desde poner fuego en las calles, en las casas y en los coches,
hasta incendiar las casas de grandes compañías como Sony. Uno de nuestros
periodistas fuertes de investigación, que se llama Paul Lewis, estaba mirando la
reacción de las redes sociales con los twitter que se lanzaban y en ese momento se
tomó la decisión de seguir esta red social para ver lo que pasaba. Lewis fue la persona
en el medio que intentaba mirar si la información era correcta o no. Este ha sido, tal
vez, el evento más tuiteado de historia con alrededor de 2.6 millones de tweets5.
Luego del seguimiento inicial de Lewis The Guardian pensó que solamente
con Twitter no se podía hacer el seguimiento, así que se le pidió a las personas que se
conectaran a través de Facebook, Twitter o The Guardian Log in y nos contaran lo
que estaba sucediendo en sus calles, que nos enviaran fotografías y demás elementos.
Ahí creamos una barrera porque ya no se trataba solamente de decir tonterías, sino
que había un esfuerzo que le iba a tomar a las personas un tiempo. Después el mapa
adquirió popularidad y los usuarios podían mirar muy cercano al tiempo real lo que
estaba ocurriendo; cliqueaban y abrían una ventana con las informaciones. Al tercer
día del suceso hicimos una reflexión en print y mapeamos con las cosas más fuertes e
importantes del hecho, pues teníamos un espacio limitado. Al final, con todo este
mundo de tweets y con la participación social, Paul Lewis llegó a mi equipo y nos dijo:
“Mira, tengo 2.6 millones de tweets, ¿qué podemos hacer? Eso sí, tenemos que ver
cómo estudiar los datos, porque no todo es verdad”.
Los riots ya habían pasado, pero teníamos que ver cómo íbamos a investigar
todo aquello que se había generado desde la población. En ese momento una
universidad estaba interesada en desarrollar un algoritmo matemático que estudiara
el tweet, es decir, que revelara si un tweet era positivo o negativo. Entonces, si alguien
tuiteaba “los riots fueron al zoológico, abrieron las jaulas de los leones y hay un león
que se está comiendo a las personas” y yo respondía diciendo “sí, sí, claro” el
4 Gamification: contar una historia a través de un juguete. 5 How riot rumours spread on Twitter
4
algoritmo miraba y afirmaba que yo estaba de acuerdo, pues “sí, sí, claro” son
palabras positivas. Sin embargo, esto no era así, porque la lengua humana tiene
ironía, metáforas e intersecciones al hablar que los tweets y el algoritmo matemático
no entendían porque no hablan, no son humanos, no tienen emociones y
sentimientos. De manera que una semana y media antes de lanzar el proyecto con
este algoritmo miramos que habían muchos tweets de este estilo, es decir, que no eran
positivos, sino negativos. Así que estudiamos las relaciones entre tweets y
descubrimos que todo estaba mal. Lo que hicimos fue poner a los estudiantes y
académicos que estaban desarrollando el algoritmo a revisar uno por uno para que
pudiésemos poner el estudio6.
Grandes oportunidades para desafiar nuestra creatividad
Lo que les voy a comentar ahora es para que se den cuenta de que solamente porque
es The Guardian no quiere decir que todo va súper bien. The Guardian quiere llamar
la atención del mundo para que lo vean, así que invierte mucho dinero en la plata
física y en la expansión en los países de habla inglesa, por ejemplo, ahora hay oficinas
en Australia. Entonces, cuando se dio lo de los Juegos Olímpicos de 2012 en el diario
pensaron que todo el mundo iba a mirar hacia nosotros porque estábamos en
Londres. En ese momento yo era la última de la línea y les propuse que trabajáramos
en conjunto los de comercial, editorial y desarrollo para así tener ideas fuertes,
porque iba a ser una oportunidad magnífica y si lo hacíamos un año antes tendríamos
aún más tiempo y se trabajaría sin presiones. Alrededor de 100 personas se
apuntaron para la realización del proyecto, pero dos días antes de empezar la jefa del
proceso me dice: “Mariana, quita eso, no podemos hacerlo; no tenemos Project
Manager”. Claro, yo en todo caso pensaba que podíamos tener ideas, que podíamos
llevar a cabo un preproceso, pero no, la orden fue acabar con todo y yo no podía
hacer nada porque corría el riesgo de que me despidieran. Todo esto se los cuento
para decirles que no dejen que el proceso interrumpa sus ideas y si las personas
tienen ganas de trabajar háganlo, no interesa que no sea perfecto al inicio, las ideas
son, justamente, un inicio para tener algo fuerte.
Lo que finalmente hicimos fue una interfase exploratoria, varios miembros
del equipo aprendieron a hacer 4D y en conjunto con un fotógrafo que había
realizado fotografías 3sixty hicieron un mapa 3D interactivo para que las personas
pudieran ver lo que sucedía dentro de las instalaciones en las que se realizarían los
Olímpicos7. Ahora bien a 3 o 4 meses de los Olímpicos aún no había Project Manager
y la persona responsable del tema llegó a nuestro equipo y nos dijo: “Hagan lo que
quieran, pero hagan algo”. Claro, lo primero que pensé es que si no nos hubieran
detenido tiempo atrás en ese momento habríamos contado con muchas ideas para
llevar a cabo.
Otro de los proyectos que nos gustó mucho fue el interactivo que realizamos
para que las personas pudieran ver en tiempo real lo que sucedía con los juegos y con
6 Vea una explicación detallada del proceso y el resultado del estudio en el video It was a war, and we had the police scared 7 London 2012: A virtual reality tour of the Olympic & Paralympic Games
5
las tablas de medallas. Ahí tuvimos un reto, puesto que la BBC tenía todos los
derechos de las imágenes de video y nosotros no podríamos utilizar nada de video,
entonces tuvimos que pensar en cómo contar las historias sobre Olímpicos en real
time y sin video. Pues bien, creamos el Second Screen8, un portal en el que el usuario
podía elegir fotos, tweets, guardian comentarios, tablas de medallas, etcétera en real
time. También podían ver cosas que pasaron antes navegando en la línea de tiempo e
incluso hicimos un juego9, era algo a modo de broma ya que teníamos toda la libertad
de proponer, así que hicimos un ATS Game con los datos de todos los records de
corredores o nadadores que han jugado o han sido campeones olímpicos. Entonces, el
usuario jugaba con personas que habían sido campeonas de otros países y en otros
años, y después, para entrar en más locura, el usuario podía desbloquear la opción de
“animal” y elegir a un león o una pantera. Así que comparábamos las habilidades de
los humanos con las de los animales, por ejemplo, la velocidad del hombre con la de
un caballo. Cabe señalar que para ello llamamos al Instituto de Biología para saber
con exactitud las habilidades de los animales que pusimos en el juego.
Quiero finalizar hablándoles de una experiencia personal en mis primeros
años en el diario, del primer trabajo que realicé cuando era interna. Antes de llegar a
The Guardian yo trabajaba en Universal Music haciendo animación para TV y para
musicales, así que cuando me entregaron una base de datos de cosas que se iban a
utilizar en dos años, una base de datos sobre los Juegos Olímpicos, intenté aplicar
mis conocimientos previos utilizando tipografías y elementos más cercanos a The
Guardian y contar la historia de los datos con estilo grafico. En ese momento yo
trabajaba por las mañanas en WikiLeaks y por las noches me dedicaba al proyecto de
los datos, pues era lo que realmente sabía hacer y quería mostrar en el diario que yo
sabía hacer más cosas, estaba muy entusiasmada y trabajé con la ilusión de que les
gustara mucho10. Pues bien, cuando termine estaba súper encantada, debo decir que
el director artístico me ayudó muchísimo, y les entregué el trabajo para que pudieran
publicarlo, aún faltaban dos años para los Olímpicos, y me dijeron: “Mira, nosotros
nunca habíamos hecho eso. No sabemos si vamos a poder publicarlo, a las personas
no les van a gustar”. ¡No podía creerlo! No había dormido en semanas ¿y no lo iban a
publicar? Bueno, me resigné y entre tanto me hice parte del staff y empecé a hacer
más cosas con visualización de datos. En ese punto ya no le preguntaba al editor si
podía o no publicar algo, simplemente lo hacía y como el video es algo tan fácil de
compartir y de mirar, siempre y cuando sea de menos de 2 minutos, se empezaron a
generar un montón de cosas. Al paso de dos años, en el año de los Juegos Olímpicos
de Londres, publicaron mi trabajo, pero se quedó dos años guardadito. Por supuesto,
solamente después de que The New York Times empezó a hacer videos The Guardian
pensó: “Si ellos hacen, nosotros también podemos hacerlo”. Así que, además publicar
mi trabajo, hablaron conmigo para que realizara visualizaciones por mes. Entonces,
es un poco difícil luchar con los pre-supuestos y la mentalidad de un periódico muy
grande que tiene que ser bueno y no puede fallar.
8 Olympics Second Screen: archive edition 9 Could you be a medallist? Find out with our brilliant retro interactive 10 Olympics 2012 in numbers – animation
6
Mi conclusión es trabajen en equipo. Aquí en Latinoamérica me parece que
las personas son muy amables y humildes, pero en Londres es común que los
editores piensen que lo saben todo, así que si ponen el ego tranquilito las cosas se
procesarán mucho mejor. Piensen siempre que toda la gente que trabaja con ustedes
tiene muchas ganas y mucha pasión, y que cuando todos se involucran los proyectos
son mayores y mucho más fuertes.
JUAN DIEGO LÓPEZ
La experiencia de una unidad de visualización de datos –
El caso de La Nación de Argentina
Recuerdo que a finales del 2009 me llamaron a una reunión en la que me dijeron:
“Ché, empecemos a hacer cosas con datos”. Esto me pareció buenísimo pero el
problema era qué íbamos a hacer. Así que, como imaginarán, fue un año de muchas
reuniones entre periodistas, diseñadores y editores para empezar a pensar en algunos
proyectos de datos. Finalmente, en el 2010 empezamos el proyecto de subsidios a
colectivos11 en el que trabajó un periodista del papel de la edición económica, tres
personas de sistemas y una agencia externa que generó el micrositio de subsidio a
colectivos. Luego, el equipo de datos de La Nación empezó con mucho miedo y
despacito a involucrar más gente, y entre tanto con el equipo de realización
multimedia y diseño interactivo nos planteábamos: “Nosotros podemos generar
visualizaciones bonitas y atractivas para el lector, pero nos tienen que dar algo más”.
De manera que para trabajar partimos del modo en el que esas visualizaciones le
ayudarían a los periodistas a entender y a encontrar historias.
Para mí la visualización de datos es una manera sencilla de mostrar datos
complejos, que le sirve tanto al lector, pues le ayuda a asimilar y a entender los datos,
como a los periodistas, pues les ayudan a encontrar datos, a transmitir mayor
información en menor tiempo, facilita además el trabajo de análisis y les permiten
descubrir nuevas historias. A este respecto, les quiero hablar del proyecto de
declaraciones juradas12, en el que decidimos mostrar las declaraciones juradas del
Gabinete Nacional Argentino. Allí, el reto era transformar estos documentos
aburridos, complejos e insípidos en un producto didáctico y amigable para el lector,
porque de nada nos servía mostrar los papeles de archivo.
Lo primero que tuvimos que hacer fue conseguir los datos, es decir, solicitarle
a la Oficina de Anticorrupción Argentina las declaraciones juradas de cada uno de los
miembros del Gabinete. Una vez las obtuvimos, que por cierto nos costó mucho
trabajo, las agrupamos en 3 categorías para poder hacer el análisis de información
personal, de los cargos y de los bienes de cada integrante. Luego de esto la pregunta
fue, ¿cómo visualizamos la información? Entonces, el equipo de diseño interactivo y
de visualizaciones planteó que la manera más fácil de hacerlo era agrupar los datos
por color, unos colores que se apegaran al diseño del diario y al diseño de la pagina, y
que, además, debíamos trabajar fuertemente desde lo icnográfico.
11 Los subsidios a colectivos en Argentina 12 Los bienes de los funcionarios, en una news application de La Nación
7
Más adelante, el interrogante fue, ¿y cómo navegamos en esta marea de
información? Pues bien, el primer desafío que se nos presentó fue qué funcionario
elegir, es decir, darle la posibilidad a la gente de que hiciera la elección a través de
fotografías, para ello generamos un cabezal fotográfico. La otra opción que
concebimos fue creada para aquellas personas que no conocían la cara del
funcionario, entonces elaboramos un listado que aparecía a modo de drop down.
Después de esto generamos 2 niveles de lectura. El primero desde lo iconográfico,
que a través de un primer vistazo la gente pudiera saber cuántas propiedades,
cuántos bienes (autos, motos, casas) tenía el funcionario y, el segundo nivel,
mostraba esa información con mayor complejidad. El trabajo también fue dividido y
en él mostrábamos dos declaraciones juradas de cada funcionario; la que hizo cuando
ingresó a trabajar en el Gabinete Nacional y la del año actual. Por ejemplo, con la
declaración de la presidenta Cristina Fernández de Kirchner tuvimos un desafío muy
grande, pues presentaba mucho crecimiento patrimonial a causa del fallecimiento de
su marido, Néstor Kirchner. Por ende, muchas propiedades eran herencia y eso
también debíamos mostrarlo gráficamente. Lo que además hicimos en el caso de ella
fue generar una nota aparte contando cómo fue el crecimiento del patrimonio, pues
estaba en parte vinculado a la herencia de los bienes de su marido.
Ahora bien, nosotros también programamos y, a diferencia de The Guardian,
solo tenemos un programador. Así que todo el proceso fue en este sentido un desafío
muy grande. Trabajamos con gente de minería de datos, una profesión desconocida
para mí hasta hace un año y medio o dos, programamos con Ruby on Rails para
integrar la base de datos y en la parte de diseño trabajamos con HTML5, CSS3 y
JavaScript. Estas son la clase de cosas que considero un periodista debería conocer,
claro, no demasiado, pero sí tener una base.
Ahora, como les contaba más atrás, en este proyecto trabajamos de la mano
un periodista, que se incorporó sobre el final del proyecto y quien interpretó algunos
datos mientras se construía la visualización y generó algunas notas; tres personas de
diseño, que diseñaron la interfase; una persona de data mining y una persona de
programación. Más adelante se integraron algunos periodistas y colaboradores que
ayudaron a hacer el data entry de las declaraciones juradas y los pedidos de
información.
Tardamos cuatro meses en llevar a cabo el proyecto, porque nuestro equipo
trabajaba para datos y para la actualización de noticias. Un ejemplo, cuando tuvimos
la suerte de tener al primer papá argentino tuvimos que dejar de lado todo lo que
estábamos haciendo y pasar a todo el equipo de diseño y programación a generar
piezas relacionadas con Francisco. Claro está que ese suceso no fue paralelo al de las
declaraciones juradas, pero quiero ejemplificar de algún modo la dinámica que
tuvimos al realizar el proyecto.
Juegos Olímpicos de Londres 2012
Ahora quisiera hablarles de otros ejemplos de visualización de datos. A nosotros nos
pasó algo parecido a lo que le pasó a The Guardian y es que se nos vinieron encima
8
los Juegos Olímpicos y debíamos hacer algo. Entonces, generamos un micrositio13
con distintos elementos y conectado a redes sociales como Twitter y Facebook.
Paralelamente, conseguimos, por las buenas relaciones que tenemos con la gente de
The Guardian, una base de datos con atletas y la cantidad de medallas que habían
ganado. En ese momento nuestro desafío en la visualización fue que teníamos una
base de datos de 29,217 registros que fueron traducidos y que en el momento de
chequear nos generaron errores; aparecía que Argentina tenía alrededor de 100
medallas de oro, lo que es mentira. Pues bien, los datos estaban diciendo que los
deportes colectivos generaban medallas individuales, es decir, Argentina tenía 22
medallas de oro por los 22 futbolistas que ganaron años atrás y lo mismo sucedía con
el equipo de basketball y el de hockey, así que generábamos mucha medallas por
deportes colectivos, cuando en realidad teníamos una medalla. Una vez subsanado
eso pudimos arreglar la base, les avisamos a los amigos de The Guardian y quedamos
todos contentos.
Es pertinente aclarar que esa falla la descubrimos cuando el equipo de
deportes vio la visualización, ellos nos alertaron de que algo andaba mal, pues para
ellos era imposible que el deporte argentino tuviera esa esta cantidad de medallas.
Ahí pudimos entender el problema y pudimos solucionarlo. Más adelante, generamos
las visualizaciones pertinentes14.
Otro inconveniente que tuvimos fue en la visualización de la cantidad de
medallas en hombres y mujeres15. Cuando el equipo deportivo vio el pico que había
en hombres en los Juegos Olímpicos de Amberes descubrió que había un error.
Empezamos a investigar y lo que pasó en esos Juegos Olímpicos fue que se
incorporaron también muchos deportes colectivos; entonces, hubo un pico muy
grande en la cantidad de medallas.
Los viajes de Boudou y el Proyecto Censo 2001-2010
Quiero hablarles de algo que está sucediendo en Argentina, tenemos un
vicepresidente que, en general, es noticia. Lo que nos pasó en este caso fue que
encontramos mediante ordenes de pago de viáticos en el Senado de la Nación que
había solapamiento de viajes del vicepresidente. Allí el desafío era cómo mostrar esos
viajes. Nosotros hicimos un relevamiento de más de 30,000 documentos entre
decretos y resoluciones, y cuando visualizamos la información encontrábamos que
era claro el solapamiento, pero que esa visualización no era del todo adecuada para la
edición impresa, pues teníamos los documentos realizados por la gente de sistemas
en tamaño gigante, pero no sabíamos cómo mostrarlos, así que se nos ocurrió
agrupar los datos mensualmente.16
13 Juegos Olímpicos. Londres 2012 14 Estadísticas olímpicas a lo largo de la historia. 15 Cantidad total de medallas en hombres y en mujeres 16 Los viajes de Boudou: expedientes incompletos y "sin rastro" en el Senado y Boudou, sobre sus viajes: "Si se compara con la gestión de Cobos, surgen cosas interesantes"
9
Finalmente, lo que les quiero mostrar es el Proyecto Censo 2001-201017. El
objetivo era visualizar los datos en crudo y las variaciones porcentuales entre el año
2001 y el año 2010 por departamento en el país. Lo bueno era que teníamos mucho
research hecho por varias versiones de censo que hubo en Estados Unidos y muchas
críticas, sobre todo de Alberto Cairo, a cómo estaban generadas las visualizaciones.
Entonces, tuvimos el tiempo para analizar todos esos datos y pensar en la
visualización. En el sitio uno puede elegir por tres grandes grupos que son:
población, hogares y vivienda. Y dentro de cada ítem el usuario puede ir filtrando
mayor cantidad de información. Además, si se pasa el mouse sobre el mapa del
departamento se puede ver la variación porcentual entre 2001 y 2010 de cada
departamento.
Les muestro esto porque es el primer mapeo de censo en Latinoamérica y
porque en este proyecto no participó ningún periodista y a mí eso me parece muy
curioso. En el equipo trabajaron dos programadores, un líder de proyecto y un
diseñador, pero no hubo ningún periodista. Y cuál es el desafío que yo creo que
tienen los periodistas al trabajar con las visualizaciones: encontrar historias. El
equipo de datos, el equipo de diseño y el equipo de programación pueden hacer un
trabajo excelente y pueden mostrar visualizaciones súper complejas o súper claras,
pero para mí el desafío del periodista con las visualizaciones de datos es encontrar la
historia colateral que los datos dan, creo que ahí está el gran desafío que por lo
menos yo encuentro en el diario cada día.
MIRIAM FORERO
ZoomOnline, construir y manejar una base de datos
ZoomOnline18 es una base de datos que está pensada para ser desarrollada por
periodistas, que es el equipo que trabaja en ella en Consejo de Redacción, y para los
periodistas, que son los asociados de esta misma organización. La primera pregunta a
este respecto sería por qué hacer una base de datos y, de hecho, fue lo que nos
preguntamos al momento de desarrollarla. En ese entonces empezamos a ver por qué
realizarla y por qué sería necesaria. Primero, porque gran parte de la información
pública en Colombia y en otros países está dispersa, por ejemplo, para el proyecto
que realizamos sobre regalías y ola invernal fue necesario acudir a muchas entidades
y solicitar, a través de derechos de petición, información publica para el proyecto,
para poder concatenar las cifras que tenía una entidad con las que tenía otra.
Por otra parte, la información pública es lejana, es decir, hay mucha
información que está centrada en Bogotá, en las oficinas de las entidades a nivel
nacional que se encuentran en la capital. Entonces, si un periodista de otra ciudad
quiere saber cuál es la lista de financiadores de la campaña de su alcalde, tiene que
recurrir al Consejo Nacional Electoral que está en Bogotá y que tiene la información,
principalmente, en formularios diligenciados a mano y en fotocopias en sus archivos.
17 Proyecto Censo 2001-2010 18 ZoomOnline
10
Esto no es verdadero acceso a la información para un periodista que vive en una
ciudad lejana a Bogotá.
De otro lado, gran parte de la información es ilegible. A este respecto,
recuerdo el primer tipo de información con el que arrancamos la base de datos, hablo
de las declaraciones de intereses particulares de los congresistas. Este Registro de
Intereses Particulares es un documento que deben llenar los senadores o
representantes a la Cámara al momento de su posesión, en él declaran cualquier tipo
de interés que puedan tener por sus negocios, por su familia, etc. Ahora bien, la ley es
muy general en esto, pues no especifica que quienes lo diligencien deberían decir qué
intereses puedan tener sus conyugues o aquellos con quienes hayan trabajado, si se
han vinculado anteriormente con el sector privado, entre otras cosas, lo que hace que
los registros sean de menos de dos renglones y digan, en su mayoría: “no tengo
ningún interés”, con letra y números de cédula ilegibles. Así pues el primer trabajo
que hicimos para lanzar la base de datos fue tratar de interpretar eso, identificar al
menos los nombres y las cedulas para saber quién era el que había llenado el
documento y asignárselo al congresista correspondiente.
La otra razón para hacer una base de datos, y que responde al otro servicio
que prestamos con ZoomOnline, es que muchos periodistas desconocen la gran
cantidad de información que pueden obtener en línea, hay mucha información incluso
en páginas web colombianas sobre antecedentes de todo tipo. Por ejemplo,
información sobre profesiones (abogados, arquitectos, médicos, ingenieros), sobre las
afiliaciones al Sistema de Seguridad Social de una persona, sobre las multas que
pueda tener, sobre su licencia de tránsito, si tiene propiedades en el extranjero, etc.
Entonces, hay mucha información que se puede encontrar en línea y que, a veces, por
desconocimiento no es aprovechada. En este punto me parece pertinente comentar
que, además de tener esta información recolectada en la base de datos, en Consejo de
Redacción hacemos capacitaciones para que los periodistas puedan conocer estas
herramientas.
Con las reflexiones anteriores comenzó ZoomOnline en el 2009, fue lanzada
oficialmente en el Encuentro de Periodismo de Investigación de 2010, pero todo el
trabajo empezó el año anterior y, actualmente, tenemos más de 2.000.000 de datos en
la base de datos. Estos datos están clasificados por aéreas y de esa mezcla de
diferentes temas obtenemos cosas muy útiles. Por ejemplo, tenemos la información
de financiadores electorales y candidatos, pero, como mencioné anteriormente, este
es un tema difícil de manejar y es por eso que debemos ir por partes. Actualmente,
tenemos dos de campañas presidenciales, más o menos seis de alcaldías y varias más
de campañas del congreso y candidatos, de modo que tenemos largos listados de
candidatos a las elecciones territoriales y presidenciales. En cuanto al Congreso
tenemos información de las UTL, del equipo de trabajo legislativo de cada
congresista y de sus intereses particulares. Tenemos, además, información sobre
funcionarios de la rama judicial, los de las altas cortes, es decir, allí están registrados
todos aquellos que se han visto involucrados con el que llamamos el Carrusel de las
Pensiones en la rama judicial. A su vez, contamos con información de funcionarios,
diplomáticos, contralores municipales y departamentales, etc. Del mismo modo, hay
información de antecedentes, actualmente, tenemos a todas las personas que han sido
11
extraditadas en el país hasta diciembre del 2012 y también personas que tienen
antecedentes fiscales, es decir, que son o han sido sancionadas por la Contraloría. En
una sección que es reciente agregamos datos sobre municipios y departamentos, por
ejemplo, tenemos giros y proyectos sobre regalías, es decir, todo el dinero que ha
recibido cada municipio y cada departamento, además contamos con las cifras de la
ola invernal, esto es, sus damnificados, la ayuda que recibieron los proyectos de cada
departamento, etc. Finalmente, contamos con algunos listados de profesiones porque
son los que más fácilmente tienen procesos de contratación pública.
Ahora bien, y luego de conocer todo lo que tenemos, la pregunta es, ¿qué
podemos hacer con todo eso? Pues bien, tenemos varias opciones. La primera de ella
es hacer los cruces de información, esto funciona de la siguiente manera: un
periodista asociado a Consejo de Redacción solicita en su investigación un volumen
de datos relacionados con los temas que está manejando y nos da esa información, lo
que hacemos es cruzar la base de datos del asociado con los más de dos millones de
registros que tiene ZoomOnline y ahí es donde empiezan a aparecer las
coincidencias.
Un ejemplo es el de la revista Semana19, en esa investigación trabajaron los
asociados Carlos Eduardo Huertas y Catalina Lobo Guerrero, y la información que
nos enviaron fue un listado de personas en el país a los que el Estado les había
asignado terrenos baldíos. Se supone que estos terrenos deben ser entregados a
campesinos de bajos recursos cuyo único medio de subsistencia es la tierra en la que
viven hace años y de la que trabajan; sin embargo, al hacer el cruce con ZoomOnline
apareció que muchas personas de la lista eran profesionales tales como: abogados,
arquitectos e ingenieros. Ahí se generó la primera duda, pues se suponía que debían
ser campesinos que vivían de explotar la tierra. También, se encontraron muchas
personas que tenían actividad política, esto es, que habían sido candidatos a varias
elecciones presidenciales.
Otra utilidad de la base de datos es que parte de la información que contiene
tiene un dato geográfico; me dice, por ejemplo, dónde se graduó una persona, dónde
fue jurado de votación en las elecciones, dónde fue candidato, etc. Siguiendo con el
caso anterior, al cruzar las informaciones no coincidían con el lugar en el que le
habían entregado los terrenos baldíos a estas personas, de hecho, estaban lejanos.
Ese cruce demostró en gran parte las inconsistencias y las irregularidades que estaba
investigando y denunciando Semana en ese momento. Y el proceso en general es un
ejemplo de aquello que hablaba Brant Houston al afirmar que una base de datos
ayuda a poner contextos y a corroborar una investigación que, además, se fortalece
con reportería y con muchísimos más métodos.
A ese caso de cruce de gran cantidad de información se le suma una
publicación del diario El País de Cali en la que también trabajaron asociados de
Consejo de Redacción. En ese caso lo que investigaron fue lo que estaba pasando con
el dinero que el Ministerio de Educación le entregaba a Buenaventura, el principal
puerto del país, para que los estudiantes que no tenían o no alcanzaban a tener un
cupo en el sector público pudieran ser inscritos en un colegio privado20. Lo que
19 Fraude agrario histórico: ¡Qué tierrero! 20 Así fue el robo que amigos del exsenador Martínez hicieron a alumnos en Buenaventura
12
encontró el periódico fueron una gran cantidad de inconsistencias, pues se estaban
desviando enormes cantidades de ese dinero que enviaba el Ministerio de Educación.
Allí nuestra labor fue realizar el cruce de la información de los representantes legales
de esos colegios particulares que estaban obteniendo el dinero con la base de datos y
apareció que muchos, siendo representantes legales de colegios privados, estaban
inscritos en el Sisben, que es el sistema de salud subsidiada en Colombia. Además de
ello, también se encontró que uno de estos sujetos era representante legal y dueño de
una fundación, que tenía una actividad política importante y que en Antioquia tenía
un historial de irregularidades en contratación pública.
Entre otras de las utilidades de la base de datos está la de descubrir
coincidencias y relaciones entre una persona y otra, pero de manera individual y no
con grandes cantidades de información. A esto se le suma que a través de la base de
datos se puede obtener información para construir un perfil de una persona o de una
empresa. Del mismo modo, la base de datos le permite a los usuarios seguir el dinero
de municipios y departamentos, por ejemplo, en cuanto al tema de regalías y ola
invernal la base de datos en el Valle del Cauca arroja datos de suspensión de los giros
por regalías en 2008, porque el departamento no reportó información. Además da los
proyectos y los giros de regalías que ha recibido dicho departamento. Asimismo, en
cuanto a la ola invernal da información sobre los damnificados, las cédulas que
salieron no válidas de fallecidos en el registro de damnificados, las cifras de la ayuda
humanitaria de los proyectos que se empezaron a desarrollar allá, el dinero que
recibió el departamento, etc. Es, sin duda, bastante información de contexto para
poder investigar, tanto la ola invernal como las regalías.
Finalmente, una herramienta que tiene la base de datos es una especie de
repositorio de bases de datos externas, es decir, enlazamos también a otras bases de
datos que consideramos son útiles para los periodistas. Actualmente, tenemos un
total de 140 bases de datos registradas en esta sección, son enlaces a páginas en
Colombia o en otros países del mundo en las que uno puede averiguar si una persona
tiene propiedades o empresas en el exterior o antecedentes fiscales disciplinarios aquí
en Colombia.
Después de todo esto se preguntarán, cómo superar los obstáculos. Pues bien,
si parte de la información está escrita a mano y en fotocopias, como las de
financiación electoral, lo que se debe hacer es una digitación muy cuidadosa; en
nuestro caso contratamos digitación que se revisaba, es decir, una persona digitaba y
otra revisaba lo digitado para evitar errores. Además, tomamos la decisión de no
digitar el valor de la donación de cada aportarte porque era una información tan
delicada que con un cero de más o un cero de menos le cambiábamos totalmente las
dimensiones a la información. Lo que hicimos para suplir esto fue ingresar listados
de aportantes que, a través de una profundización de los reportes de financiación, le
permitían al periodista saber cuánto podía aportar cada persona.
Otro inconveniente muy común es que las entidades públicas entregan miles
de datos impresos o en PDF, cuando lo que el periodista necesita es un Excel. ¿Qué
solución hay ahí? Existen unos programas y hay bastantes software que convierten
PDF a Word y PDF a Excel. Hay también un sistema que se ha vuelto muy común,
y que incluso muchos escáner tienen, hablo del reconocimiento de caracteres, es
13
decir, reconoce el texto que hay en un impreso y al escanearlo lo convierte en texto.
A este respecto, les recomiendo un programa que tuvimos en Consejo de Redacción y
que nos ayudó a convertir los PDF a Word o a Excel, se llama wondershare pdf
converter.
Otra de las dificultades que pueden encontrar en el camino son los posibles
errores en la información. Ya lo decía Brant Houston al afirmar que todas las bases
de datos tienen errores o información basura. Nuestra solución ha sido realizarle una
revisión exhaustiva a cada tabla de datos que nos entregan, para evitar publicar
errores. Otra solución ha sido citar directamente de la fuente, esto es, que en la base
de datos se puede saber de donde vino cada información, para poder ir a esa entidad o
a esa fuente y corroborar cualquier dato que el periodista necesite.
Finalmente, es posible que se encuentren con los obstáculos de acceso a la
información, que como periodistas debemos conocer a profundidad. Lo que hemos
hecho a este respecto es conocer la normatividad del país, es importante que desde
nuestra profesión sepamos cuál es la legislación sobre acceso a la información; qué se
puede mantener en secreto y qué no, y dar la pelea. Por ejemplo, cuando les
solicitamos información a las entidades que manejan los listados de ingenieros,
abogados, médicos o contadores su respuesta inmediata fue que la información era
privada y que no nos iban a dar las listas de los profesionales registrados; sin
embargo, ellos mismos no tenían conciencia de que son una entidad de carácter
publico y que, por ende, debían entregar la información. Dimos la pelea y el Tribunal
Administrativo de Cundinamarca falló a nuestro favor.
PREGUNTAS DEL PÚBLICO
DANIEL SUÁREZ PÉREZ
¿Cómo puede un medio monetizar este tema de las visualizaciones? ¿Se puede
generar impacto a través de ellas? ¿En qué se ve reflejado?
JUAN DIEGO LÓPEZ
Yo creo que es al revés, la monetización en la experiencia de La Nación va por el
impacto que produce la visualización y no al revés. De todos modos, para darles el
ejemplo de lo que acabo de decir y el antiejemplo retomo el trabajo de Declaraciones
Juradas que lógicamente no se podía monetizar, pero tuvo más de medio millón de
visitas desde que se publicó hasta la fecha, y esto es algo bastante interesante para
los anunciantes. Ahora, algunas de las visualización que armamos para los Juegos
Olímpicos fueron pedidos de los anunciantes, por lo cual nosotros tuvimos que
trabajar en la generación de una pieza en la que quería aparecer el anunciante. Así
que creo que por el contenido o por el anunciante se puede monetizar el trabajo.
MARIANA SANTOS
En mi caso hay muchos ejemplos que pueden considerarse extraños. Uno de los
proyectos con más visitas ha sido un interactivo de regalos de navidad, en este el
usuario podía elegir para quién era el regalo, seleccionar el presupuesto que tenía y el
14
tipo de regalo que deseaba obsequiar. Otro caso es el de un artículo sobre la
comparación de armas en Siria, este artículo había tenido muchas lecturas, pero
cuando publicamos el gráfico de la comparación visual aumentó el número de vistas
en menos de una hora. Nosotros creemos que poner la información de manera visual
es muy atractivo y cuando se tienen medios y se pueden hacer cosas en redes sociales
es mucho más fácil que tenga éxito un video corto que un interactivo que dure un
montón de tiempo.
DANIEL SUÁREZ PÉREZ
Qué nos pueden decir sobre el conflicto que existe en ocasiones con el editor o con
los jefes para poder publicar. ¿La salida es independizarse o seguir adelante con esa
lucha?
MARIANA SANTOS
Mi jefe siempre ha dicho que los diseñadores y los desarrolladores tenemos que hacer
nuestra propia agencia. Pero yo pienso que no, que necesitamos a los periodistas,
porque ellos son los expertos en investigación, en recoger su material y en tener una
historia preparada, mientras que los desarrolladores y diseñadores son expertos en
hacer que esa historia se vea bonita y que les guste a las personas.
JUAN DIEGO LÓPEZ
Mi opinión es similar a la de Mariana, hay que perseverar y hay que mostrar los
trabajos. Quizás al principio sea una publicación chiquita, pero a lo largo del tiempo,
me parece, la gente se va convenciendo de que este tipo de narraciones terminan
sirviendo. Yo empecé trabajando entre el 2001 y el 2002 con videos de 320 x 2.40,
algo muy pequeño, y hoy tenemos videos en HD, no solo en La Nación sino en
muchos otros medios. Me parece que lo que hay que pensar, más allá del crédito
propio, es que nosotros trabajamos para los lectores y los que se llevan la ganancia
son ellos.
MIRIAM FORERO ARIZA
En Consejo de Redacción tenemos un área de trabajo llamada Emprendimiento, que
es precisamente para los periodistas que tienen estas inquietudes. Retomando un
poco lo que decía Mariana, si se van a ir del medio tradicional, háganlo con el
ingeniero y el desarrollador. Así se van a lograr proyectos mucho más interesantes
DANIEL SUÁREZ PÉREZ
Hay un proceso interesante en los medios de ustedes y en esa verificación de datos
que hacen con sus visualizaciones, no solo se trata de que el diseño quede bonito, eso
pasa por varios ojos. ¿Cómo es ese proceso de verificación de los trabajos?
JUAN DIEGO LÓPEZ
15
En La Nación nosotros lo dividimos en varias etapas, como si fuera un doble
comando: verificamos quienes hacemos la visualización, verifican los periodistas y
verifican quienes hacen la minería de datos. Esto también depende de qué tan largo o
no sea el trabajo, pero aún así a veces encontramos errores. En todo caso, me parece
que es la parte más importante, porque de lo contrario estarías informando mal y no
importa qué tan linda sea tu visualización, si tienes un dato incorrecto lo echas a
perder todo.
MARIANA SANTOS
En The Guardian tenemos un equipo de migración de datos que está compuesto por
un periodista principal y dos asistentes que tienen conocimientos súper fuertes de
matemática, y cuando un trabajo está listo para ser visualizado es revisado por otros
periodistas.
MIRIAM FORERO ARIZA
En mi trabajo para ZoomOnline antes de subir cualquier información a la base de
datos hacemos muchos procesos de verificación. Un método que funciona, además de
mostrarles los resultados a otras personas con una visión más limpia, es hacerse
preguntas y aprender a identificar los errores típicos que tienen las bases de datos.
Por ejemplo, una base de datos no debería tener cédulas repetidas, ahí ya puede haber
un error y es cuando entramos a verificar. Creo que es necesario ser un poquito
creativos, pensar qué tipo de error puede haber y verificar si lo hay o no.