
¿Cuántos hombres son gay? Economía y "big data" para dar una respuesta precisa
¿Qué tan racistas somos, en realidad? ¿Los jugadores de básquet de elite vienen de hogares pobres? ¿La gente educada tiende a deprimirse más? ¿Qué porcentaje de la población masculina es homosexual? ¿Pueden servir los chistes sobre candidatos a ayudar a predecir resultados electorales?
Las preguntas del primer párrafo bien podrían pertenecer a investigaciones del profesor de Economía de Chicago Steven Leavitt, bautizado el "mago de las hipótesis testeables", quien en su libro Freaknomics –coescrito con el periodista Stephen Dubner– combinó creatividad con técnicas econométricas para responder cuestiones no habitualmente tratadas por la "ciencia maldita". Por ejemplo, si las reglas del sumo incentivan la corrupción o si hay correspondencia entre las predicciones de la teoría de los juegos y los resultados de los penales en el fútbol. Freaknomics lleva más de dos millones de ejemplares vendidos y fue traducido a 30 idiomas.
Leavitt ganó notoriedad con este enfoque, pero también un ejército de críticos: sus conclusiones están basadas en muestras que a veces no son representativas y los errores estadísticos están a la orden del día. Por caso, su trabajo sobre el vínculo entre el crimen y la legalización del aborto en los Estados Unidos fue masacrado por sus colegas en la última década. El economista de Chicago sostenía que había una relación directa entre la baja de la criminalidad en los Estados Unidos a fines de los 90 y la liberación del derecho a abortar a principios de los 70.
Seth Stephens-Davidowitz, un joven que meses atrás obtuvo su doctorado en Harvard, viene combinando creatividad en el planteo de preguntas con una base mucho más sólida para extraer conclusiones. No se nutre de pequeñas encuestas, sino de millones de datos agregados de búsquedas en Internet. Es columnista de The New York Times y científico de datos en Google. "Los economistas y los científicos sociales en general están subestimando en forma dramática el poder de las grandes fuentes de información digitales. Muy pocos papers están siendo publicados con esta metodología en revistas especializadas de prestigio; la mayor parte aparecen en diarios y en blogs. Pero los resultados que están apareciendo son sorprendentes, y este fenómeno no va a hacer otra cosa que crecer", cuenta Stephens-Davidowitz a LA NACION, por correo electrónico.
Un mes atrás, el académico utilizó millones de datos anónimos, provistos por Google, para aproximar el número real de estadounidenses varones gay. Hasta ahora, la proporción que surgía de distintas investigaciones y encuestas arrojaba cifras de entre 2 y 10 por ciento. Pero las muestras son voluntarias, y muchos homosexuales optan por no revelar sus preferencias. Por ejemplo, en los estados más tolerantes, la cantidad de hombres que se definen gay en perfiles de redes sociales es de 3%, contra 1% en los lugares más conservadores.
"Uno podría pensar que hay movilidad en este segmento hacia los lugares más tolerantes, pero este efecto no supera el 0,1 por ciento. Los números se mantienen entre estudiantes secundarios, para quienes es más difícil mudarse de estado", cuenta el investigador, que apeló a una base de información más "honesta" y masiva (y anónima, se aclara todo el tiempo): la búsqueda de pornografía gay que se hace en la intimidad del hogar, sin miradas indiscretas.
El porcentaje que surge de esta fuente es de 5%, y es el mismo tanto en estados abiertos como en locaciones más intolerantes. "El número revela que hay una considerable cantidad de varones gay que no salieron del closet aún o que permanecen en matrimonio con parejas mujeres", cuenta el científico.
Un dato de color al respecto: la palabra más tipeada en buscadores luego de "Is my husband…" ("¿Es mi marido….") es "gay", con un 12% de las búsquedas online.
Meses antes, Stephens-Davidowitz descubrió, gracias a las bases digitales masivas, una serie de características sobre los votantes que los analistas políticos habían pasado por alto en las últimas elecciones presidenciales. Por ejemplo, que el racismo sigue siendo muy fuerte en la sociedad norteamericana y que Barack Obama habría obtenido varios puntos adicionales de ventaja si no hubiera sido afroamericano (el porcentaje de gente progre que lo vota por esta condición es mucho menor). Y también halló un dato que lo sorprendió: el mejor predictor de votos del resultado final fue la cantidad de búsquedas de chistes y de burlas sobre el candidato por el cual no se iba a sufragar.
En otras investigaciones, el doctor en Economía de Harvard –que cursó su doctorado con el economista argentino Ricardo Pérez Truglia– demostró que, en forma contraria a un mito popular, los jugadores que triunfan en la elite de la NBA vienen de clase media acomodada, con buena alimentación, contención en el hogar y aprendizaje de técnicas de autodisciplina desde pequeños. Las historias de chicos de gueto con "hambre de gloria" para escapar de la pobreza, como la de LeBron James, son muy excepcionales. Pero como obtienen el grueso de la atención mediática parecen más frecuentes de lo que son.
Las grandes bases de búsqueda le sirvieron también para describir un "mapa de la depresión" en los Estados Unidos, a partir de sondeos que hace la gente en buscadores sobre síntomas, tratamientos y términos relativos a este malestar emocional. Algunos resultados: el peor mes para este flagelo en el hemisferio norte es abril y el más moderado es agosto. Previsiblemente, el peor día es el lunes, y el mejor, el sábado. North Dakota tiene el récord de depresivos y Virginia es el estado más sano en este sentido.
La gente con más recorrido académico se deprime menos, contradiciendo el cliché de que la depresión está más extendida entre las personas cultas y más analizadas. Por lejos, el frío es lo que más incide en esta enfermedad: mudarse de Chicago (que días atrás estuvo congelada, en un oficial "estado de calamidad", con 50 grados bajo cero de sensación térmica) a Honolulu, en Hawaii, en los meses más gélidos del año, tiene el doble de poderío para mitigar la depresión que el remedio psiquiátrico más efectivo del mercado, según estimó el economista respecto de las búsquedas.
"Muchos científicos sociales sacan conclusiones sobre la base de pequeñas muestras, con gente que acepta participar. Pero las bases digitales de búsqueda tienen información que cubre a la casi totalidad de la población, y los datos son mucho más honestos. Los académicos se están moviendo hacia estas fuentes en forma muy cauta y lenta, aun se sienten cómodos con la vieja metodología", cuenta Stephens-Davidowitz a LA NACION.
Según su pronóstico, los resultados se multiplicarán en economía, en ciencias políticas, en el área de salud y en muchos otros campos. "Hay enfermedades que van a ser curadas gracias a estas bases agregadas. Y hoy hay becarios en grandes compañías que pueden tener una ventana al comportamiento humano mucho más rica que los mejores investigadores del mundo, con grandes recursos para encargar encuestas. Todo se trata de hacerse las preguntas adecuadas y de saber dónde buscar."
sebacampanario@gmail.com






