Coronavirus en la Argentina. La historia de Federico Tiberti y Mauro Infantino, los nuevos "gurús" de los datos de la pandemia
"¿Podrá ser tipo 23? El tema es que ahora toca dormir al niño y todo el quilombo. Fede puede también a esa hora". Quien lo dice es Mauro Infantino, de 39 años, y "Fede" es Federico Tiberti. El primero es ingeniero en sistemas y el segundo un argentino de 30 años radicado en Estados Unidos, donde da clases de estadísticas en la Universidad de Princeton. Fanáticos de los números, las métricas, los cálculos y las estadísticas, se conocieron a través de las redes sociales durante la pandemia del coronavirus, y fueron los primeros en alertar sobre las demoras en el registro de fallecidos por SARS-CoV-2 en el país a principios de agosto.
Tras una semana en la que el número de muertos por Covid-19 en la provincia de Buenos Aires subió más de 3500 casos por un cambio en la metodología del registro, sus gráficos y análisis del dataset (en el que figura la fecha de muerte y no la del momento en que fue cargada al sistema) volvió a poner en escena sus nombres. Programas de televisión, entrevistas periodísticas y charlas con epidemiólogos pasaron a ser parte de su rutina cotidiana que, de lunes a lunes, vuelve a arrancar a las 19.30, cuando el Ministerio de Salud sube los datos "crudos" que procesan Tiberti e Infantino.
Por primera vez, ambos dieron una entrevista juntos. En la charla con LA NACION, contaron cómo sus herramientas profesionales, que no se vinculan en forma directa a lo sanitario, los llevaron a meterse en un mundo que, en el principio de la pandemia, estaba casi vedado para todo aquel que no fuera epidemiólogo o no estuviera en el área sanitaria.
-¿Cómo surgió el interés por analizar los datos de la pandemia?
Mauro Infantino: "Yo venía siguiendo los partes diarios desde el día uno, pero no alcanzaban. No alcanzaban en el sentido de que faltaban más detalles. Estaba cansado de que me pusieran el gráfico en la cara. Si uno quería hacer análisis por edades, sexo y otras variables, con esa información no se podía. Quería poder analizar y entenderlo. Cuando sale el dataset, a mediados de mayo, dije 'tomo esos datos, hago una base de datos y va creciendo el sitio', que fue lo que ocurrió. Pero fue un bajón porque después de subirlo en mayo, pasaron más de 15 días hasta que en junio lo subieron de nuevo. Estaba cagado en las patas, hice todo este laburo para meterlo en una base de datos, para nada. Pero desde junio se hizo más periódico y en julio lo comenzaron a actualizar diariamente y ahí se pudo comenzar a computar las diferencias. Tardé unos 15 días, más o menos, en entender cómo compatibilizar el dataset con el parte diario. Después de ese tiempo, tuve que reprocesar todo y pude comenzar a ver los datos de las demoras en la carga de los fallecidos".
Federico Tiberti: "También seguía de cerca los datos de la pandemia, pero porque en el primer semestre yo estaba dando un curso de estadísticas acá en Princeton y analizaba mucho eso con los alumnos. Cuando publican el dataset, más que un proceso sistemático como el de Mauro de armar una base de datos, yo hacía análisis ad hoc sobre algún tema que me interesara evaluar. Por ejemplo, en un momento fueron las edades promedios de los diagnósticos, después la intensidad de los testeos por distritos. Lo mío era más de meterme en un tema, analizarlo y publicar unos tuits con la información. Cuando arranca el dataset también me era ininteligible al principio. Mauro le sacó la ficha antes que yo; después también le saqué la ficha yo y empezamos a notar las variaciones. Eso llevó a que me metiera en las demoras y empezamos a sacar hilos de tuits en donde mostrábamos esas situaciones. Ahí es cuando me centro en lo que respecta a la carga de fallecidos, porque era donde veía que había mayores discrepancias entre los distritos".
Tiberti remarca que su trabajo diario es con estadísticas y que lo único que hizo fue aplicar sus conocimientos cotidianos en el análisis del dataset, al que ponderó en más de una oportunidad por su riqueza informativa. En el caso de Infantino aclara que no se dedica a estadísticas, pero que su trabajo cotidiano consiste en hacer "curaduría de datos" y procesamiento de los mismos.
"Me dedico a administrar, gestionar y almacenar datos", se diferencia el ingeniero en sistemas. "Lo mío no son las estadísticas, son los datos. La pandemia me llevó a analizar los indicadores y volcarlos en gráficos o en un buscador para que las personas puedan investigar", agregó Infantino, que creó su propio sitio (https://covidstats.com.ar/) que permite analizar los datos de la pandemia en la Argentina que figuran en la base del Ministerio de Salud de la Nación.
Como el sitio fue creciendo, hago un hilo en que agrego novedades.El panorama es una mirada rápida de cada una de las áreas del país con las variables principales (casos, fallecidos, reproducción, etc.). Todas las curvas juntas.https://t.co/mC0EkdfmY91/n pic.twitter.com/807fsaQunu&— Mauro Infantino (@plenque) July 27, 2020
-¿Cómo es que comenzaron a armar estos gráficos y a trabajar juntos sin conocerse?
Infantino: "Un día, a fines de julio, cuando yo publicaba una tablita que decía solo la fecha de los muertos que se habían reportado ese día, una persona me escribe y me dice que había subido un muerto de mayo, que si no había un error. Yo le expliqué que ese muerto en el dataset del día anterior no figuraba, entonces lo habían ingresado ese día. Seguí con eso y cada día aparecían casos así. Entonces le dije a Fede: 'Mirá, mi sitio es muy lindo, pero yo no puedo hacer un gráfico de gran impacto como el que quiero hacer y vos sabés'. Lo que quería mostrar a las personas era cómo la curva crecía hacia atrás, no solo hacia adelante, como se veía en los reportes diarios. Fede tiene un manejo de herramientas para graficar esos datos mucho mejor que yo, y sacó esas animaciones que fueron las primeras que causaron impacto".
Con @plenque estuvimos mirando en detalle la demora entre los fallecimientos y su reporte y pensamos este gráfico. La animación muestra cuántos fallecimientos se agregaron en cada reporte diario, por fecha de fallecimiento. La PBA sigue reportando muertes de hace mucho tiempo. pic.twitter.com/9DSYmULtWj&— Federico Tiberti (@fedetiberti) August 7, 2020
Tiberti: "No lo conocía de antes. Vi sus estadísticas y comenzamos a charlar por mensaje privado de Twitter. Es el Tinder de los friquis, jaja. Pude ver antes de que las lanzara a cada una de las pestañas que fue sumando a su sitio por el vínculo que fuimos generando".
Para resumir las funciones de cada uno dentro de este dúo que presenta las estadísticas de la pandemia, Infantino explicó: "Cuando arrancamos le dije que yo estaba haciendo una fábrica de datos y que lo que él hacía era una boutique. De alguna manera, yo hacía muchos gráficos y datos de mi sitio, pero cuando había que armar algo especial el encargado era él, que tiene un manejo de los gráficos mucho mejor que el mío".
Los dos reconocen que la serie de gráficos animados que publicó Tiberti en su cuenta de Twitter el 7 de agosto por la tarde fue la que generó el mayor impacto y que hubo una segunda ola esta semana a raíz del cambio de metodología de medición en la Provincia de Buenos Aires y el ingreso al sistema de cientos de muertos con hasta tres meses de retraso.
Ambos reconocen que a la semana siguiente de ese posteo de agosto, los seguidores en sus cuentas de Twitter crecieron y, con ello, las preguntas, miradas, cuestionamientos o alabanzas en un país donde "la grieta" se cuela en todos los temas y la pandemia no es la excepción.
Infantino: "Mucha gente viene a mi perfil a buscar información y se aburre porque ven los gráficos y nada más. Yo no editorializo el contenido. Lo que quiero es poner a disposición los datos para que otras personas hagan sus análisis. Por eso, no creo que haya mucho interés por nosotros. Creo que, en este caso puntual, mostramos los retrasos que había en la carga de datos de fallecidos en las provincias y por eso se interesaron".
Las 442 muertes nuevas en el dataset del ministerio (que no incluyen las 3500 recién confirmadas en conferencia por PBA). 35 son de hace más de un mes (26 de ellas de CABA, con muertes de hace meses). PBA siguió con sus bloques semanales: 159 de la primera semana de septiembre. pic.twitter.com/x8UmmHpIoM&— Federico Tiberti (@fedetiberti) September 25, 2020
El procesamiento de los datos de Tiberti, cuando comenzaron a tener repercusiones, fueron puestos en tela de juicio por haber trabajado para Laura Alonso, extitular de la Oficina Anticorrupción, en la administración porteña de PRO. Sobre estas críticas, el docente universitario respondió: "Si la calidad de la objeción será esa, yo me quedo tranquilo con el ejercicio estadístico que hice. Si lo único que me pueden objetar es lo que hice hace ocho años, me quedo tranquilo. Pasa mucho eso. Obviamente posiciones políticas yo tengo y los que participamos en este tipo de análisis las tenemos. Pero hemos tenido la capacidad de generar intercambios con personas que están en lugar opuesto a mi afinidad ideológica. El problema está cuando priorizás tu alineamiento político por encima de cualquier análisis de datos".
"Si vos tenés un dato en lo que estás mostrando no es una crítica infundada. Siempre le digo lo mismo a Fede: no podría haber descubierto las demoras en la carga de fallecidos en la Provincia de Buenos Aires alguien que no tiene mirada crítica. Si no podés criticar, no vas a encontrar la noticia", sumó Infantino.
El dataset y el cambio en la medición bonaerense
"Cuando ellos publicaron el dataset creo que no se dieron cuenta de la implicancia que tenía. Es una información superdetallada y que expone todo. Si no quisieran mostrar algo, con el dataset sería imposible que lo lograran", dijo Infantino. Esto se debe a que en el dataset se ingresa con un número específico a cada persona que es sospechosa de tener el virus SARS-CoV-2, y luego su evolución. Así, por ejemplo, se pudo observar que una mujer de 60 años, identificada en el sistema de registro de coronavirus del Gobierno con el número 806.652, con su domicilio en Pilar, provincia de Buenos Aires, murió por Covid-19 el 16 de abril. Pero su muerte recién fue reportada el 3 de agosto. Es decir, 109 días después.
El ingeniero en sistemas luego habló de la polémica en torno a la carga de datos tardíos de la provincia de Buenos Aires que se dio esta semana y que derivó en un cambio en el sistema de medición y una suba de 3523 fallecidos en un solo día. "Fue muy notorio lo que pasó esta semana en la provincia y, sin el dataset, esto no lo hubiéramos sabido. Por eso tomó tanto estado público. Creo que se dieron cuenta de que no podían hacer cualquier cosa y que nadie se diera cuenta. Nadie en su sano juicio puede decir que lo que pasó es cuestión de azar", dijo Infantino.
La actualización de muertes antiguass por bloques quincenales-mensuales que viene haciendo la Provincia de Buenos Aires se ve clara en esta animación de sus últimos cinco reportes, ordenados por fecha real de fallecimiento. pic.twitter.com/7rrmTfDSp6&— Federico Tiberti (@fedetiberti) September 24, 2020
Tiberti coincidió y agregó: "Fue una semana en la que saltó a la luz toda esta estructura muy atípica de carga de datos antiguos, en bloque, que al instante tomó estado público gracias a la riqueza del dataset que impide que esto pase desapercibido".
"Creo que hubo una especie de lavado de manos de responsabilidad informativa al publicar el dataset. Como que dijeron: 'Ahí están los datos, procesen y analicen ustedes'. Lo que hicimos nosotros, y me refiero a toda la comunidad tuitera que sube sus reportes, fue terminar tomando ese lugar. Para bien o para mal", dijo Infantino.
Tiberti agregó: "El Ministerio de Salud liberó información con datos micros de muy buena calidad. Pero como publicación estadística oficial tiene estos partes diarios que son bastante ruidosos, poco informativos, de muy mala calidad porque están brindando información desactualizada y difícil de digerir. Peor: fácil de digerir equivocadamente. No hay que dejar de celebrar que estén abiertos los datos, pero faltan estadísticas oficiales de calidad".
Otras noticias de Covid
Más leídas de Sociedad
Qué pasará con el precio del boleto. La Justicia declaró nulo el aumento en el subte
Una oración para rezarle. Quién fue Francisco de Asís y por qué se lo considera santo
En todo el mundo. Por qué se celebra hoy el Día de los Animales
“Buscamos la unidad”. Ya se anticipa una masiva concurrencia a la Peregrinación a Luján, a qué hora se inicia