Números y más números
La ciencia no es inmune a las modas. A fines del siglo pasado, se atribuía a los genes una importancia determinante en cada aspecto del organismo y de la mente. Hoy se sabe que genes y ambiente tienen una influencia equivalente, salvo excepciones. Después del año 2000, las enfermedades crónicas empezaron a atribuírse crecientemente a procesos inflamatorios. Con el correr de los años, las esperanzas de grandes logros se fueron cifrando en la terapia génica, en las células madre, en la nanotecnología…
Ahora, las palabras a la orden del día son “Big Data” o ciencia de datos. De hecho, en la Facultad de Ciencias Exactas de la UBA se lanzó este año una licenciatura en esta disciplina que arrancó con cientos de inscriptos. Es un área de estudio que surgió ante la necesidad de darle una interpretación a los masivos volúmenes de información que se generan a partir de nuestra interacción con dispositivos automáticos y de estos entre sí: búsquedas en internet, uso de teléfonos celulares, GPS, redes sociales… Una mina cuyos tesoros requieren de especialistas capaces de aplicar algoritmos computacionales y estadística para extraerlos.
Pocas veces quedó tan claramente expuesta la utilidad que nos brindan y las trampas a que pueden exponernos los datos como en el año que pasó. Tal como ocurre con otros temas, la única forma de hacer inteligible esta pandemia es mediante números, comparaciones, proyecciones. Todos los días esperamos un reporte de casos notificados, muertes, internados en terapia intensiva, porcentaje de ocupación de camas a partir de los cuales puede comenzar a trazarse un mapa epidemiológico que indique tasas de aumento o descenso, o riesgo sanitario por jurisdicción que sustente el cúmulo de decisiones que afectarán desde nuestra posibilidad de procurarnos un sustento hasta el funcionamiento mismo de nuestras familias.
”La pandemia de Covid-19 mostró lo vulnerable que puede ser el mundo cuando uno carece de buenas estadísticas. En un año de incertidumbre, los números incluso pueden ser fuente de consuelo”, escribió la matemática Hannah Fry en un artículo publicado porThe New Yorker.
Sin embargo, bajo su aparente imparcialidad, los números pueden ser muy engañosos. Por poner un ejemplo frecuentado, los casos que se registran dependen de las personas que se testean y diagnostican, que a su vez varían de acuerdo con circunstancias aleatorias como la definición de caso sospechoso o la aparición de síntomas. Otro hecho discutido hasta el hartazgo es el de la influencia de la escolaridad presencial: ¿es causa de aumento de la circulación del virus o permite una mejor detección? Según cuál sea la respuesta serán las medidas que se tomen.
”Simplificar el mundo lo suficiente para que sea capturado por números implica dejar de lado muchos detalles. Estas omisiones inevitables pueden sesgar los datos. (…) Nuestras perspectivas están grabadas a fuego en lo que consideramos digno de ser contado. Como resultado, las omisiones pueden surgir incluso en los ejercicios de análisis de datos mejor intencionados”, reflexiona Fry.
Para los que tenían la esperanza de que el Big Data iba a solucionar el problema de la falta de datos, Walter Sosa Escudero, autor de Big Data, Borges y yo (Siglo Veintiuno Editores, 2020) aclara que estamos lejos de eso, porque solo podemos analizar lo que se observa y quedan afuera las decisiones que uno no toma. Para usar una metáfora borgiana, el mapa nunca será el territorio.
”Los números son un pobre sustituto de la riqueza y el color del mundo real –destaca Fry–. No pueden capturar cómo es trabajar en una unidad de terapia intensiva, ni qué se siente al perder a un ser querido por este virus. Pero es el único medio que tenemos para entender su letalidad, cómo funciona y explorar qué nos espera en el futuro”.