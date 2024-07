Escuchar

Según los cálculos de Microsoft, unos ocho millones y medio de dispositivos fueron afectados por la desastrosa actualización del software de seguridad de CrowdStrike, el viernes. La compañía añade que eso es menos del 1% del total de las máquinas con Windows. La afirmación, que por supuesto intenta minimizar la escala del incidente, es muy discutible. El sábado, solo en Estados Unidos, todavía había miles de vuelos varados, con prácticamente todas las líneas aéreas importantes intentando resolver un problema, que, como adelantamos ese mismo día del apagón, las golpeó muy especialmente; en total, unos 5000 vuelos fueron cancelados en el mundo. ¿La razón? la actividad aerocomercial es una danza milimétricamente sincronizada que solo admite demoras breves y localizadas (debidas al clima, por ejemplo); de otro modo, colapsa. Llamó la atención, sin embargo, que la estadounidense Southwest Airlines siguiera en el aire. Esto fue porque la compañía todavía usa Windows 3.1, un sistema operativo que debió haber actualizado hace 32 años.

El cálculo de Microsoft es llamativo, además, porque daría la impresión de que “todas las máquinas con Windows” son unas 850 millones, cuando en realidad son muchas más (con lo que el porcentaje de las afectadas es menor) y, a la vez, no es tan simple hoy contar los dispositivos, porque muchos procesos corren en máquinas virtuales.

Aritmética aparte, la cantidad de máquinas impactadas constituye solo una parte del diagnóstico. Lo otro que importa es cuáles fueron las computadoras con Windows que se actualizaron en la noche del jueves al viernes y quedaron inutilizadas. Las de los particulares no fueron perjudicadas (excepto al no poder usar ciertos servicios online), por lo que la tormenta alcanzó sobre todo a equipos que cumplían alguna misión más crítica.

Aunque desde la Argentina todo pareció seguir más o menos bien (salvo para Jetsmart, Iberia y Level), Brasil sufrió más el impacto de la falla.

Husos horarios y globalización

En el detalle fino, los sistemas que se pusieron en marcha antes de las 5,27 UTC del viernes (o sea, las 2,27 de la madrugada del viernes, hora Argentina), fueron golpeados por la actualización que corrompió Windows y lo colgó, en general con pantalla azul. Los que se conectaron después de esa hora, no.

Microsoft publicó un comunicado el sábado cuyo primer párrafo aclara que no fue un “incidente de Microsoft”. Cierto, porque el responsable de no haber chequeado correctamente la actualización automática de esa noche fue CrowdStrike. Pero es muy llamativo que con cientos de miles de pasajeros varados, las primeras palabras del comunicado hayan sido para desentenderse de la responsabilidad y no para mostrar alguna empatía con los damnificados.

El comunicado contiene también links a los diferentes métodos para la remediación de este escenario, incluidos procedimientos de emergencia, como el de desconectar el disco de arranque del servidor afectado y borrar a mano los archivos asociados a la falla (los que empiezan con C-00000291 y tienen la extensión .sys, en el directorio de drivers de CrowdStrike). En otros casos, la compañía fabricante del software dañado sugería arrancar en modo a prueba de fallas para eliminar estos archivos. CrowdStrike tiene un centro de asistencia online para los afectados por la falla.

Aunque todavía no hay cifras de las pérdidas causadas por el incidente, ya es por lejos el más masivo que ha experimentado la era digital (al menos, en esta etapa de Internet; el desastre del Morris Worm, el 2 de noviembre de 1988, fue todavía más masivo, pero Internet todavía no era pública), y no fue causado por un ataque informático, sino por un error (más bien, por una cadena de errores que llevó a liberar una actualización que no había sido probada adecuadamente) en un software de terceros contratado por compañías que usan el sistema operativo de Microsoft. De hecho, el argumento de marketing de CrowdStrike es que la seguridad que provee Microsoft es mala. Al parecer, hay que presumir menos y chequear mejor las actualizaciones antes de lanzarlas al ecosistema.

A todo esto, circuló el fin de semana un meme en el que se sugería la idea de que el desastre había sido causado por un pasante. Luego lo desmintió el propio autor del posteo en las redes sociales, y de todos modos las cosas nunca son tan simples como para echarle la culpa a una persona en particular. Con todo, la pregunta más importante sigue siendo cómo una compañía de seguridad soltó un upgrade que demolió 8,5 millones de dispositivos .

El costo para los responsables ya es fuerte, con la acción de CrowdStrike, que había tenido hasta ahora una carrera estelar, abajo un 13 por ciento. La de Microsoft fue menos golpeada; un 3% tras conocerse la noticia, y se recuperó rápidamente. Mientras los administradores de sistemas, que llevan un fin de semana sin dormir, van corrigiendo la falla y reviviendo los sistemas colgados, la buena noticia es que el apocalipsis digital, ahora lo sabemos, ha sido deconstruido. Es decir, los efectos fueron puntuales, con muchas personas impactadas, pero sin un colapso completo de la civilización. En parte, por la naturaleza del fenómeno, que no tenía detrás un actor malicioso y, además, era relativamente fácil de resolver. En parte, porque lo “global” funciona en diferentes husos horarios. Los que sufrieron los efectos del apagón lo pasaron mal, cierto, pero al menos todavía tenían el resto de la infraestructura intacta.

Queda aún contar las pérdidas, pero mientras el mundo interconectado es un riesgo, porque pueden pasar estas cosas, esa interconexión es también una salvaguarda. La noticia y las soluciones de emergencia se esparcieron tan rápido que no ocurrió lo que más se tenía. Es decir, un colapso total en la mayor parte de los servicios esenciales.

Sin embargo, la concentración sigue apareciendo como un serio problema en el mundo industrializado. Los sistemas que no fueron afectados (Linux, macOS, iOS y Android, sin contar otros más de nicho) salvaron el día, pero también, insólito como pueda sonar, Windows XP, Windows 95 y hasta Windows 3.1, hace rato discontinuados, evitaron el catastrófico upgrade, que solo es para Windows 10 y 11. Dicho de otro modo, aunque al concentración ha demostrado ser muy difícil de evitar en tecnología (desde AT&T para acá, no hubo ninguna empresa grande que no ocupara una posición dominante al menos en un área durante una etapa significativa de su trayectoria), la contrapartida debería ser una responsabilidad mucho mayor con las industrias que dependen de sus sistemas. Incluidos los proveedores de aplicaciones sensibles para esos sistemas, como es el caso de CrowdStrike.

Los detalles técnicos detrás de la falla son bastante complejos y el lector interesado puede leerlos en este informe de la compañía. Con todo, ese mismo informe admite que CrowdStrike todavía “está analizando cómo ocurrió” el error que causó en primera instancia el nefasto apagón. Y eso es, de todo, lo más preocupante.