Buscando historias desde el espacio: periodistas de las Américas crean guía para analizar imágenes satelitales con inteligencia artificial

A raíz de esa pregunta surgió From Above, una guía dirigida a periodistas

Redacción

¿De qué forma se puede aprovechar la inteligencia artificial y las imágenes satelitales para encontrar posibles historias periodísticas?

Esa fue la pregunta que un grupo de periodistas del continente americano se hicieron durante su participación en el programa Collab Challenge 2021, una iniciativa global de JournalismAI y Google News Initiative que reúne a medios de varios países para desarrollar innovaciones en periodismo mediante inteligencia artificial.

A raíz de esa pregunta surgió From Above, una guía dirigida a periodistas sobre cómo usar la inteligencia artificial para identificar indicadores visuales en imágenes satelitales y desarrollar investigaciones periodísticas a partir de ellos.

Mientras que otros equipos del Collab Challenge trabajaron en el desarrollo de herramientas de inteligencia artificial aplicadas al periodismo, el equipo de From Above, conformado por Flor Coelho, de La Nación (Argentina); María Teresa Ronderos, de CLIP (Colombia); David Ingold y Shreya Vaidyanathan, de Bloomberg News (Estados Unidos); y Gibrán Mena, de Data Crítica (México), decidió enfocarse en investigar y crear una guía de trabajo que pudiera beneficiar a periodistas con poca experiencia en la materia.

“El producto fue la guía completa, también pensando en que otros periodistas de medios que no tuvieran esta experiencia previa también pudieran utilizar estas herramientas de análisis de imágenes, sobre todo en investigaciones que tienen que ver con cambios de cobertura forestal y crisis climática”, dijo a LatAm Journalism Review (LJR) Gibrán Mena, de Data Crítica.

La guía, cuyo nombre completo es From Above: Una guía para periodistas sobre el uso de IA + imágenes satelitales para contar historias, consta de ocho pasos que exploran cómo usar la visión computarizada como una forma innovadora de recopilar ideas para posibles reportajes de investigación.

El primer paso de la guía (1) es justamente pensar en historias en las que indicadores visuales puedan proveer contexto adicional o evidencias. En teoría, casi cualquier fenómeno que deje marcas visibles en la tierra y que pueda ser captado desde el espacio es propenso a ser analizado con inteligencia artificial, de acuerdo con Mena. Esto puede ir desde erosión de la tierra y deforestación, hasta la detección de narcopistas o ranchos ilegales.

Para el desarrollo de From Above, el equipo eligió investigar la deforestación por ganadería extensiva en México y Colombia.

El siguiente paso en la guía es la adquisición de los datos (2) —o en este caso, las imágenes satelitales del área de interés— en la resolución adecuada. A decir de Mena, esta es una de las etapas más complicadas, ya que para que el análisis de las imágenes sea efectivo, estas tienen que ser de una resolución de al menos 10 metros por pixel.

“Este es un gran reto al que nos enfrentamos porque […] las empresas que son dueñas de los satélites naturalmente están interesadas en hacer un modelo de negocio a partir de las imágenes. Son sumamente costosas y en algunos casos se necesita solicitarle al satélite que haga una toma específica de un área”, dijo el periodista.

Una vez adquiridas las imágenes, los siguientes pasos en la guía son el análisis técnico (3) y etiquetado (4). En estos pasos, los periodistas examinan manualmente las imágenes para encontrar indicios visibles para el ojo humano de lo que se esté buscando y los señalizan. Esta labor la deben hacer periodistas o investigadores que tengan experiencia de reporteo en campo sobre el tema de la investigación.

“La clave es cómo le enseño a una máquina cómo se ve, cuáles son los pixeles en una imagen que significan para un ojo humano deforestación provocada por ganadería, en este caso”, explicó Mena.

Estos periodistas expertos señalizan las imágenes a través de un etiquetado que consiste en dibujar polígonos sobre lo que ellos ya saben que son indicios de lo que se está buscando. Idealmente, las imágenes son de lugares que ellos conocen y en los que saben que existe el fenómeno buscado.

La señalización sirve para asociar a los pixeles información sobre lo que ahí existe, como reflectancia de colores, espectro infrarrojo, sombras y texturas, entre otros. Posteriormente se crea una base de datos basada en esa inspección visual y en datos de contexto del área analizada.

“Para lo que sirve todo este proceso es para que cuando yo analice una zona que no conozco con la información de otras zonas, se pueda detectar de manera automatizada este fenómeno”, dijo Mena.

El siguiente paso es el entrenamiento del algoritmo (5), que se hace combinando la información de la imagen satelital y la señalización realizada por humanos. Ese tipo de entrenamiento se le conoce como “entrenamiento supervisado del modelo”, en el que seres humanos proveen los criterios que el algoritmo deberá detectar en otras imágenes.

Luego viene la etapa de validación (6), en la que se afina el algoritmo para mejorar su exactitud. Según la precisión del etiquetado será el margen de error del algoritmo.

“Puede estar arriba del 90 por ciento de precisión pero también puede estar muy por debajo, dependiendo de cómo se hizo esa tarea. Siempre va a haber un margen de error y siempre va a haber una necesidad de no dar por hecho que la categorización automática es correcta, sino que debe haber un proceso de revisión posterior, una verificación humana”, explicó Mena.

El siguiente paso es el de prueba (7), en el que se ejecuta el algoritmo en imágenes nuevas y se observan los resultados. El paso final de la guía es escribir la historia (8) utilizando los datos arrojados por el algoritmo. Ya sea que estos respalden las hipótesis iniciales de la investigación o que den ideas para nuevas hipótesis o pistas para reporteo.

“La parte más importante de un proceso técnico como este no es ni la herramienta ni el lenguaje de programación, sino las discusiones que hubo de fondo entre los periodistas que estábamos participando”, dijo Mena. “Porque sin eso, el algoritmo no tiene ninguna precisión. El conocimiento de campo de los periodistas es sumamente valioso para este tipo de procesos técnicos”.

Para el desarrollo del algoritmo que se generó a partir de From Above, el equipo usó R, un software libre de análisis estadístico y gráfico que es popular entre la comunidad científica. Dicho algoritmo, así como la base de datos usada para entrenarlo, están disponibles de manera abierta en un repositorio en GitHub, de modo que cualquier periodista que desee hacer investigaciones similares pueda utilizarlos.

“El lenguaje de la guía está hecho para periodistas que están interesados en conocer qué significa realmente utilizar un algoritmo y que nunca han tenido idea de qué significa eso”, dijo Mena. “Es una innovación para que tengan acceso a estas herramientas también periodistas del sur global, de redacciones que no tienen la posibilidad de contratar a 10 programadores para resolver estos problemas de investigación”.

Actualmente, Data Crítica está poniendo en práctica la guía From Above, en una investigación periodística sobre la deforestación producida en las últimas dos décadas por el cultivo de soja en la cuenca del Paraná, en los territorios limítrofes de Argentina, Brasil y Paraguay. El proyecto está siendo desarrollado como parte del Consorcio para Apoyar el Periodismo en la Región (CAPIR), del cual Data Crítica forma parte junto con Animal Político, Armando Info, Fundación Karisma, Institute for War & Peace Reporting y Vinalnd Solutions.

Aunque aún no tiene fecha de publicación, la historia está programada para salir a la luz en julio próximo, dijo Mena.

Shreya Vaidyanathan y Gibrán Mena presentaron el proyecto durante el festival JournalismAI en diciembre de 2021. (Foto: Captura de pantalla de la transmisión en YouTube del evento)

Obtener imágenes satelitales, un reto fuera de este mundo

Como experimentaron los autores de From Above, el acceso a imágenes de alta resolución desde el espacio no es algo sencillo. Actualmente, las fotografías satelitales están más disponibles que nunca, pero imágenes en una resolución suficientemente alta para detectar objetos implican altos costos.

El equipo intentó establecer contacto con las grandes empresas dueñas de satélites o proveedoras de imágenes satelitales, como Maxar, Sentinel y Google Earth. Sin embargo, encontraron que es difícil obtener respuesta cuando se trata de proyectos pequeños.

No obstante, en su investigación encontraron que existen programas e iniciativas que permiten el acceso gratuito o a bajo costo a imágenes satelitales para organizaciones o periodistas que buscan investigar sobre la crisis climática.

“Si miras la guía, podrás darte una idea de que las imágenes satelitales se han desarrollado mucho hasta ahora, por lo que tienes muchas imágenes gratuitas disponibles en Internet gracias a los programas satelitales que cada país tiene”, dijo a LJR Shreya Vaidyanathan, miembro del equipo y periodista de Bloomberg News. “Ellos hacen estas imágenes disponibles para que la gente pueda estudiarlas o usarlas para algo, así que si alguien está cubriendo el cambio climático o una geografía específica como periodista, definitivamente puede obtener estas imágenes”.

El equipo de From Above recurrió específicamente a la plataforma Planet, una organización que opera 450 satélites en órbita y que tiene como misión registrar y distribuir imágenes y datos de la Tierra desde el espacio y monitorear los cambios visibles. A través del programa Norway’s International Climate & Forests Initiative (NICFI), en alianza con el Gobierno de Noruega, periodistas y activistas interesados en la crisis climática tienen acceso a imágenes de alta resolución.

Asimismo, contaron con la colaboración de Bellingcat, el sitio de periodismo de investigación especializado en verificación de hechos e inteligencia de fuentes abiertas, el cual tiene experiencia en el uso de geolocalización e imágenes satelitales en investigaciones. El sitio capacitó al equipo de From Above en el uso de las herramientas de Planet y les facilitó algunas imágenes satelitales de alta resolución.

Sin embargo, el equipo reconoce que, pese al apoyo de esas organizaciones y programas, el acceso a imágenes satelitales puede llegar a ser un reto difícil de enfrentar, en parte porque para investigar cambios en el terreno se requieren series de imágenes en un periodo de tiempo.

“Se necesitan las imágenes más actualizadas, por lo que si el costo es muy alto para una imagen, entonces resultará mucho más costoso comprar una todos los días o todas las semanas o todos los años, y el periodismo es, en muchos sentidos, algo que opera en el corto plazo”, dijo Vaidyanathan. “Creo que puede ser útil si tienes las habilidades para manipular imágenes gratuitas e invertir, tal vez, solo en el conjunto de habilidades para procesarlas y analizarlas, porque el dinero requerido para comprar imágenes nuevas y actualizadas creo que todavía está lejos de estar disponible para el periodismo o para las salas de redacción en general”.

Pero pese a estos retos económicos y técnicos, una de las innovaciones que trae From Above es la desmitificación de la inteligencia artificial y de los procesos de visión computarizada como elementos inalcanzables para el periodismo, según sus creadores.

Si bien los autores de la guía tienen conocimientos de periodismo de datos y programación, no tienen la formación técnica de un programador. Y aún así, desarrollaron la guía y entrenaron un algoritmo. Por tanto, para ellos resultaba fundamental que la guía sirviera como un modo de acercar a otros colegas a la inteligencia artificial de una forma accesible.

“[Los medios de países de primer mundo] tienden a hacer una separación disciplinar en las redacciones entre los aspectos técnicos y la investigación periodística. En nuestras redacciones mucho más pequeñas y con otros procesos distintos a los del norte no existe la posibilidad de hacer esta distinción y las personas que hacen programación muchas veces son los mismos periodistas, entonces sí requeríamos que la guía fuera perfectamente entendible para una persona que no tiene información técnica”, dijo Mena.

El equipo tenía la intención inicial de integrar el algoritmo en una interfaz gráfica de usuario final para facilitar su uso en las salas de redacción, pero la duración de seis meses del Collab Challenge no fue tiempo suficiente. Sin embargo, el equipo no descarta crear dicha interfaz en el futuro.

Según los periodistas involucrados, From Above sirvió para dejar registro del alcance que tiene hasta hoy la inteligencia artificial en el análisis de imágenes satelitales para contar historias, así como para sentar las bases para que ellos mismos u otros periodistas apliquen o mejoren el proceso con nuevos conocimientos.

“La parte útil de nuestra guía es simplemente decir: ‘aquí es donde se encuentra esta tecnología hasta este momento. Estos son los recursos para que puedan planear cómo cubrir sus historias de una manera que tengan un impacto”, dijo Vaidyanathan. “Con la escala a la que está creciendo el acceso a la inteligencia artificial y a las imágenes satelitales, parece que puede abrir muchas posibilidades, si no ahora, en unos pocos años”.

 

 

Publicaciones Similares