Anna Vissens: “La ciencia de datos mejora la profundidad y precisión del periodismo de investigación”
Lidera el equipo de data science del periódico británico, uno de los medios globales más identificados con la innovación y los contenidos de calidad
- 11 minutos de lectura'
La ciencia de datos es una especialidad en expansión en diferentes industrias. Uno de los aportes de su trabajo es la información estratégica que, bien utilizada, puede permitir tomar decisiones más ajustadas a las necesidades de un cliente, incluso de un consumidor de contenidos periodísticos. Es un enfoque multidisciplinario que combina principios y prácticas del campo de las matemáticas, la estadística, la inteligencia artificial y la ingeniería de computación para analizar grandes cantidades de datos.
Anna Vissens, física de formación (graduada de la National Research Nuclear University -MEPhI- de Moscú), tiene una vasta trayectoria en la creación y dirección de equipos interdisciplinarios de alto rendimiento al servicio de la industria editorial. En 2019 ingresó al equipo de Data & Insight del diario británico The Guardian, que desde entonces se ha convertido en el segundo más grande dentro del departamento de análisis de la compañía.
La ciencia de datos –un nombre que apareció por primera vez en los años 60 del siglo pasado como alternativa a la estadística y fue abrazado por los profesionales de la computación en los 90– es clave porque combina herramientas, métodos y tecnología para iluminar proyectos a partir de los datos. Esta información aplicada al trabajo de investigación profunda es clave para uno de los grandes aportes del periodismo a la sociedad de este tiempo: encontrar historias relevantes –muchas veces vinculadas a los poderes de turno– y ponerlas a disposición de la ciudadanía.
En una entrevista con LA NACION, Vissens asegura que su disciplina ha mejorado de manera significativa la profundidad y el alcance del periodismo de investigación tradicional “al permitir que los periodistas trabajen con grandes conjuntos de datos de una manera más eficiente y perspicaz”.
– ¿Cuál es la parte más divertida e interesante de tu trabajo como jefa de ciencia de datos en The Guardian?
– La parte más agradable y gratificante de mi rol es trabajar con el increíble equipo que he formado personalmente en los últimos cinco años. Tuve la oportunidad de contratar a cada miembro, y me enorgullece mucho el talento que hemos desarrollado. Obtener resultados tangibles juntos como equipo es muy satisfactorio. La parte más interesante del trabajo para mí es cuando resolvemos problemas complejos y difíciles, especialmente cuando una hipótesis se valida y conduce a soluciones impactantes. Aunque mi posición implica mucha gestión, todavía me encanta involucrarme en el trabajo práctico siempre que puedo, ya sea realizando un análisis o entrenando un nuevo modelo. Esa es la parte divertida para mí: seguir conectada con los aspectos técnicos de la ciencia de datos.
– ¿Cuál es la mayor contribución de la ciencia de datos al periodismo de investigación más tradicional, que siempre ha sido un pilar de los periódicos?
– La ciencia de datos ha mejorado significativamente la profundidad y el alcance del periodismo de investigación tradicional al permitir que los periodistas trabajen con grandes conjuntos de datos de una manera más eficiente y perspicaz. En The Guardian, colaboramos estrechamente con los equipos de Proyectos de Datos y Periodismo de Investigación. Una de nuestras principales contribuciones fue una investigación sobre participación del capital privado en las guarderías de Inglaterra. Nuestro análisis exclusivo reveló que los fondos de inversión habían duplicado y más su participación en el sector en solo cuatro años. Esta investigación proporcionó información crítica que llevó a advertencias de que la participación del capital privado podría aumentar el riesgo de cierres en el sector y agravar la escasez de guarderías asequibles en áreas desfavorecidas. Este tipo de información basada en datos aporta una nueva capa de profundidad y credibilidad al periodismo, permitiéndonos descubrir tendencias e impactos que de otro modo podrían pasar desapercibidos.
Hemos mejorado significativamente la profundidad y el alcance del periodismo de investigación tradicional al permitir que los periodistas trabajen con grandes conjuntos de datos de una manera más eficiente y perspicaz
– Está claro que una IA generativa bien entrenada puede ser muy útil para el trabajo en las redacciones. ¿Cuál es el impacto concreto en la ciencia de datos aplicada al periodismo?
– La IA generativa puede ser una herramienta poderosa en las redacciones, pero es importante recordar que la IA no es mágica y debe utilizarse como una herramienta, no como una solución. Cuando se trata de investigación periodística, la IA generativa nunca debe ser la única fuente de información, ya que no tiene conocimiento factual; simplemente predice la siguiente palabra en una secuencia basada en patrones, lo que puede introducir inexactitudes o “alucinaciones”. Sin embargo, cuando se usa correctamente, la IA puede acelerar significativamente los flujos de trabajo. Por ejemplo, hemos utilizado IA generativa en proyectos donde nos ayudó a extraer cierta información, pero cada resultado fue rigurosamente verificado por un humano antes de la publicación. El mayor impacto de la IA en la ciencia de datos aplicada al periodismo es que nos permite ahorrar tiempo en tareas rutinarias o repetitivas, permitiendo que los periodistas se centren en reportajes más creativos y profundos.
– ¿Qué aportan los perfiles profesionales más conocedores de la tecnología al periodismo, y viceversa?
– La verdadera magia ocurre cuando creamos una sinergia entre los equipos editoriales y los profesionales técnicos. Como jefa de Ciencia de Datos, en realidad reporto al jefe de Innovación en el área editorial del negocio, lo cual podría sorprender a algunos, pero refleja exactamente lo que buscamos: un vínculo cercano entre los mundos técnico y editorial. Los profesionales con conocimientos tecnológicos aportan la capacidad de manejar datos complejos, automatizar procesos y aplicar análisis avanzados para descubrir conocimientos que de otro modo podrían permanecer ocultos. Por otro lado, los periodistas aportan una mirada crítica y una comprensión profunda del contexto, la ética y la narrativa en los proyectos impulsados por datos, asegurando que la tecnología tenga un propósito significativo y preciso.
– ¿Cuál es tu opinión sobre la relación particular entre los editores y las grandes plataformas?
– Muchos editores sienten que han sido tratados de manera injusta, especialmente cuando su contenido de alta calidad ha sido utilizado para entrenar modelos como los de lenguaje de gran escala (LLM) sin la debida compensación o reconocimiento. Esto está ocurriendo en un momento en que el periodismo objetivo ya enfrenta dificultades financieras, lo que puede, en última instancia, perjudicar la democracia en todo el mundo. El auge de las redes sociales planteó un desafío importante para los editores, pero ahora enfrentamos una amenaza aún mayor con la IA generativa y otras tecnologías emergentes. Sin embargo, sigo siendo optimista de que la tecnología también puede ser parte de la solución, ayudando a los editores a sobrevivir y prosperar en este entorno rápidamente cambiante, siempre y cuando la industria luche por alianzas más justas con estas plataformas.
– ¿Cuáles crees que serán los mayores avances en el aprendizaje automático aplicado al periodismo?
– Aunque muchas redacciones ahora cuentan con científicos de datos, todavía estamos en las primeras etapas de aprovechar plenamente el potencial de los datos en el periodismo. Los mayores avances no provendrán de saltar directamente a la IA generativa, sino de dominar lo fundamental: recopilar datos de alta calidad, almacenarlos correctamente y procesarlos en los formatos adecuados. Una vez que esa base esté en su lugar, las técnicas estándar de aprendizaje automático pueden ofrecer enormes beneficios, como ejecutar campañas de marketing más eficientes o automatizar tareas como el etiquetado de contenido. Muchos ven la IA generativa como un atajo, pero es muy arriesgado confiar en eso si tu “casa de datos” no está en orden primero. Los verdaderos avances vendrán de integrar el aprendizaje automático de manera reflexiva en los flujos de trabajo de las redacciones (de manera segura y responsable) y asegurarse de que esté construido sobre una base sólida de prácticas de datos.
La IA generativa puede ser una herramienta poderosa en las redacciones, pero es importante recordar que la IA no es mágica y debe utilizarse como una herramienta, no como una solución
– ¿Consideras importante establecer alianzas con la academia y organizaciones no gubernamentales?
– Absolutamente. Una de las primeras iniciativas que lancé cuando me uní a The Guardian fue una colaboración con University College London (UCL). Cada año presentamos un proyecto a los estudiantes de doctorado del Centro de Formación en ciencia intensiva en datos de esta institución educativa. Estas colaboraciones nos permiten explorar la investigación y el desarrollo experimental, a menudo enfocándonos en la innovación a largo plazo en lugar de las necesidades comerciales inmediatas. Hicimos algunos proyectos que tuvieron un impacto directo en nuestra estrategia empresarial. Por ejemplo, en 2020 trabajamos con un investigador postdoctoral de UCL para construir modelos de base para extraer datos estructurados de artículos de recetas no estructuradas. Estos modelos han sido reentrenados desde entonces y ahora se utilizan en nuestra nueva aplicación, Feast, que brinda a nuestros lectores acceso exclusivo a las recetas de The Guardian. Esta alianza no solo aporta experiencia académica a nuestros proyectos, sino que también impacta directamente en nuestra estrategia comercial, haciendo que tales colaboraciones sean invaluables.
– ¿Cómo construye The Guardian su relación con sus lectores más leales?
– Uno de los proyectos recientes en los que trabajé personalmente implicaba analizar comentarios de lectores que decidieron dejar de apoyarnos, ya fuera a través de una suscripción a nuestra aplicación premium o donaciones. Para dar sentido al gran volumen de comentarios, apliqué técnicas de procesamiento de lenguaje natural, lo que me ayudó a descubrir patrones e ideas que habrían sido difíciles de identificar manualmente. Algunos de los hallazgos confirmaron nuestras hipótesis existentes, mientras que otros fueron sorprendentes y claramente procesables. Este tipo de análisis no solo nos ayuda a entender mejor a nuestros lectores, sino que también nos permite ajustar nuestra estrategia para mantener relaciones sólidas con nuestros seguidores más leales. Estas técnicas nos brindan las herramientas para tomar decisiones comerciales basadas en datos y mejorar continuamente la experiencia de nuestros lectores.
– En la Argentina, una de las nuevas carreras universitarias que han estado creciendo es la ciencia de datos. ¿Por qué crees que hay tanta demanda?
– La creciente demanda de educación en ciencia de datos no es única de Argentina; es una tendencia global. La IA se ha convertido en uno de los temas más discutidos hoy en día, y OpenAI ha “democratizado” el acceso a estos poderosos modelos al ponerlos a disposición de cualquier persona con acceso a internet. Como resultado, cada vez más empresas están ansiosas por utilizar estas tecnologías para resolver sus problemas comerciales. Habiendo contratado extensivamente en los últimos cinco años, definitivamente puedo ver lo recalentado que se ha vuelto el mercado laboral. Cada vez que abrimos una vacante, recibimos cientos de solicitudes. Sin embargo, he notado que, aunque la demanda es alta, la calidad de los candidatos a menudo no está a la altura. Muchos vienen a nosotros con un título de maestría en ciencia de datos de instituciones que no han sido tradicionalmente fuertes en este campo, lo que sugiere que el auge de la demanda podría estar llevando a una rápida oferta de cursos sin necesariamente mantener altos estándares.
– ¿Qué hace de The Guardian una marca reconocida e identificada con el periodismo de calidad?
– The Guardian ha ganado su reputación de periodismo de calidad gracias a su compromiso con la independencia, el reportaje en profundidad y una sólida base ética. La sala de redacción prioriza el periodismo de investigación, responsabilizando a los poderosos y arrojando luz sobre los temas que importan a nuestras audiencias y a la sociedad. Nuestra independencia editorial es un factor clave, lo que nos permite centrarnos en el reportaje sin influencias externas. También abrazamos la innovación, integrando la ciencia de datos y las tecnologías de vanguardia para profundizar nuestra narrativa, mientras seguimos asegurando la precisión y la credibilidad. Este equilibrio entre una sólida base tradicional y la innovación es parte de lo que mantiene a The Guardian a la vanguardia del periodismo de calidad.
¿Quién es Anna Vissens?
- Formación. Es física, pero trabajó casi toda su carrera en los medios de comunicación, primero como periodista y luego como científica de datos. Enseña diferentes módulos, incluidos los de ética de la IA, en la Academia Anual de IA para pequeñas redacciones de la LSE.
- Carrera. Lidera un equipo de científicos de datos en Guardian News and Media, con sede en el Reino Unido. Anteriormente trabajó en la BBC, donde en 2007 recibió un premio en reconocimiento a su éxito en la construcción y compromiso con nuevas audiencias. Su experiencia abarca Procesamiento de Lenguaje Natural, IA generativa, motores de recomendación, segmentación de audiencias, modelos de propensión y otras disciplinas.
Otras noticias de Comunidad de Negocios
Más leídas de Negocios
US$600 millones. El Banco Mundial busca potenciar la minería argentina con una inversión clave
Para competir con Amazon. Mercado Libre analiza ofrecer en el país productos traídos directamente de Estados Unidos o China
Oportunidad de expansión. Marcelo Mindlin crece en el negocio de la madera
Inversión. YPF se suma al proyecto de PAE para exportar GNL por barco