jueves, 31 de octubre de 2013

La metadata en el centro de la investigación periodística


Ahora que sabemos que Dropbox se mete en nuestros archivos y Google comparte sus datos con la NSA y el FBI, el periodismo comienza a internalizar algunos conceptos y deberá adquirir nuevas capacidades, ya sea para evitar dejar rastros comprometedores como para poder indagar sobre fuentes anónimas.


Los datos sobre nuestros datos son la “metadata”. Y nos acompañan cada vez que dejamos un registro electrónico. Cuando sacamos una foto, con ella vienen los datos de la cámara, la hora en que fue sacada, y probablemente el nombre de quien la sacó, la geolocalización de la misma, y la detección facial que podrá tagearse. Así, tomar una foto ahora es mucho más que una simple acción: es revelar datos de uno mismo.
En la última Media Party de Hacks/Hackers Buenos Aires, Daniel Foguelman, de la empresa de seguridad InfoByte, dedicó un workshop a “descubrir y limpiar tus metadatos”. Durante el workshop, Foguelman enseñó a los periodistas a descubrir y remover información de pdfs, jpgs y htmls para evitar dejar rastros.
Es que, cuando enviamos un documento, además de su contenido, estamos dando a conocer información sobre la máquina que lo procesó y su sistema operativo. Si el software está registrado, seguramente también se encontrará su nombre en la ventana de propiedades.
Cuando mandamos un correo no sólo estamos enviando su contenido a otra persona. También estamos exhibiendo patrones de conducta, formas de relacionarse con la sociedad y con los otros.
Algo de eso encontró hace tiempo el experimento de Immersion en el MIT, que permite visualizar las cuentas de Gmail para encontrar patrones de comunicación y comportamiento. Los investigadores del MIT se inspiraron en el caso Snowden, que denunció la importancia del rastreo de metadata por parte de servicios de inteligencia estadounidenses.
Basicamente, quien tenga acceso a datos sobre las comunicaciones por Gmail podrá entender rápidamente los grupos, las relaciones, los amigos, los contactos: todo aquello que se infiere de mirar el comportamientos de estos datos.
En la conferencia del Knight-MIT Civic Media a fines de junio, en la entrada del Media Lab había una superpantalla mostrando los datos de quien se animara a poner su clave y usuario. Era muy tentador entender rápidamente cómo una máquina puede deducir rápidamente nuestras relaciones.
Los documentos de los periodistas tienen metadata; todos aquellos datos que no están dentro del contenido dejan pistas. Los documentos judiciales también tienen metadata: por ejemplo, el número del juzgado, el nombre del juez, el título y la cantidad de páginas. Sin embargo, no podemos vivir sin metadata. No podemos mandar un mail sin saber a dónde va, ni podemos sacar una foto sin saber de qué cámara es. No podemos hablar por un teléfono móvil sin que el sistema sepa dónde estamos.
Los periodistas debemos internalizar estos conceptos, puesto que alguno de estos errores pueden costar vidas, fuentes periodísticas, trabajos o gobiernos. El periodista estrella de The Guardian, Glen Greenwald, quien denunciara el caso Snowden, acaba de salir del prestigioso diario para encarar un nuevo emprendimiento financiado por Pierre Omidyar, creador de Ebay. Greenwald hablará esta semana en el encuentro de la Sociedad Interamericana de Prensa por teleconferencia bajo el título “Greenwald: el mensajero de la saga Snowden”, en Denver.
Se sabe que la metadata también puede ser fuente de investigación periodística: una forma de llegar al mensaje anónimo o una manera de conectar rastros. En el MIT, durante un hackatón organizado por Knight-Mozilla Open News, Waldo Jaquith de State Decoded y Chase Davis del New York Times encabezaron un proyecto al que nombraron Judgmental.
La idea era poder analizar textos judiciales que estaban en PDFs, encontrar la metadata automáticamente, crear una API y poder consultar los documentos interactivamente. Hicieron el prototipo en dos días del hackatón y resolvieron una forma de rastrear la metadata en documentos estatales que podrá ser usada por investigadores judiciales, basándose en encontrar las marcas de esta documentación.
Borrar la mayor cantidad de metadata a la hora de encarar una investigación periodística es una tarea ardua y engorrosa. La mejor forma de lograrlo es investigarse a uno mismo.
Puedes empezar a ver qué rastros dejas a tu paso. Haz una búsqueda en Google con tu nombre; mira la sección "información" cuando estás escribiendo o editando documentos; trata de entender cómo otras personas pueden tener acceso a tus datos; abre tus imágenes en diferentes computadoras y busca qué información estás dando a terceros.

Mariano Blejman,
Knight International Journalism Fellow 2013, es editor y emprendedor en medios especializado en periodismo de datos.


El contenido del blog "Global media innovation" sobre los proyectos y socios de los ICFJ Knight International Journalism Fellows en IJNet es financiado por la John S. and James L. Knight Foundation y editado por Jennifer Dorroh.

Premio SIP al Periodico Peruano PERUNEWS Review

Enviar por corrEo

Agencia de Prensa Lima Norte

PUCP | PuntoEdu

Biblioteca Nacional

¿A dónde se van los "periodistas" mermeleros?

LA AGENDA DIGITAL 2.0 - ONGEI /PCM