En la madrugada del lunes se cayó la plataforma de servicios en la nube de Amazon, que generó un caos online a nivel mundial; también impactó a Mercado Pago y otras billeteras virtuales
5 minutos de lectura'


Las del lunes fueron 13 horas negras para Amazon, la compañía fundada por Jeff Bezos hace 21 años y que a través de su plataforma Amazon Web Services aloja, de una u otra forma, un tercio de internet: algo falló en la configuración de los servidores de la compañía en la madrugada del lunes, y una enorme cantidad de sitios y servicios de internet dejaron de funcionar. Entre los caídos estuvieron el servicio de transacciones de Mercado Pago y de otras billeteras virtuales, ChatGPT, Perplexity, Snapchat, Fortnite y el asistente Alexa.
Sirvieron como enésimo ejemplo de cómo internet está diseñada para ser tolerante a fallas, descentralizada y más, pero hay algunos cuellos de botella insalvables y, de vez en cuando, uno de ellos se atora, como sucedió este lunes.
Amazon Web Services es un gigante de lo que se denomina “la nube”, un eufemismo para explicar lo que es, en rigor, una serie de galpones distribuidos por todo el planeta, cada uno repleto de servidores, que son computadoras muy similares a las convencionales pero de mayor capacidad, y diseñadas para trabajar al máximo todo el día, todos los días.

Cuando se usa un servicio digital (usar Mercado Pago, YouTube, Netflix, WhatsApp, etcétera) nos estamos conectando a uno de estos centros de datos, que están distribuidos por el mundo para no concentrar alguna operación en un único lugar, pero aun así hay algunas tareas que se hacen en un lugar específico, o que son controladas por los equipos de ese lugar. Si fallan, se frena todo.
Qué tiene que ver AWS con Mercado Pago
¿Y qué tienen que ver, por caso, Mercado Pago o ChatGPT con AWS? Algunas compañías montan sus servicios en servidores propios, pero para la enorme mayoría es mucho más sencillo y económico contratar a un tercero, como Amazon, Google o Microsoft, el trío que domina “la nube” (hay más jugadores, pero de participación mucho menor). Microsoft, con Azure, tiene el 20% del mercado; Google, el 13%.
Estas compañías se encargan de la gigantesca inversión en equipos, conectividad y sincronización entre centros en múltiples países, alquilan un espacio en sus servidores, proveen bases de datos y aplicaciones estándar para que esos servicios funcionen, y permiten montar una plataforma digital de alcance internacional de una forma que es más barata que hacerlo por cuenta propia, pero dejan a los clientes expuestos a este tipo de situaciones.

Así lo confirmó, por ejemplo, la compañía de Marcos Galperin en un escueto comunicado: “Mercado Libre y Mercado Pago reconocen que hubo una inestabilidad en sus aplicaciones, provocada por una falla generalizada y extendida en el sistema de AWS. Nuestros equipos están trabajando rápidamente para restablecer el sistema.”
Así, Mercado Pago funciona, pero para procesar un pago requiere acceder a un servicio que está montado en un servidor AWS, y ahí se frena todo el proceso.
De Virginia para el mundo
En este caso, los culpables son los servidores de lo que Amazon denomina US-EAST-1 Region, ubicados en Virginia (EE.UU.); es uno de los primeros lugares donde montó uno de estos centros de cómputo, y es el que dejó de estar operativo en la madrugada del lunes; un cambio en una configuración, o una actualización del software base que da vida a estos servidores hizo que los servicios montados sobre ellos dejaran de funcionar o lo hicieran mal. Es como si se cuelga Windows o MacOS: las aplicaciones que se usan quedan inaccesibles pese a que no tienen la culpa.
El indicado como principal responsable de la falla es la configuración de DNS, un sistema de doble entrada que anota direcciones inteligibles para humanos con el número IP específico del servidor que aloja ese sitio o servicio. Si falla el DNS, no hay cómo encontrarlo, salvo que se sepa el número IP, algo que no siempre es posible (ni practicable cuando se trata de miles de direcciones). En este caso, un cambio en DynamoDB, un componente de AWS que usan muchísimos sitios, lo dejó con un DNS mal configurado y, por lo tanto, inaccesible para el mundo exterior. Esto hizo caer otros servicios en cascada, afectando 113 componentes de AWS que dependían de DynamoDB para prestar servicio a los sitios y servicios alojados por Amazon.
El servicio comenzó a restablecerse en el mediodía del lunes, pero muchos sitios y plataformas digitales tuvieron problemas el resto del día, mientras los ingenieros de Amazon trabajaban a destajo para poner en orden todo el sistema.
La falla, acotada geográficamente, pero de impacto global, hizo recordar a la caída de CloudStrike a mediados de 2024. CloudStrike es una suerte de antivirus corporativo, y en esa ocasión una actualización de seguridad hizo que los equipos Windows que lo usaban se colgaran, impidiendo el funcionamiento de hospitales y aeropuertos.
Sobre la tarde del lunes, el sitio de Amazon que relata todas las tareas de mitigación que lleva a cabo la compañía todavía aclaraba que la calidad de servicio de AWS estaba "impactada", aunque en vías de recuperación y con un nivel de servicio similar al de antes de la falla.
1OpenAI se declara en “código rojo” y priorizará mejorar ChatGPT para frenar la presión de sus competidores como Google
2Los trabajos que serán un boom en el futuro, según el CEO de la compañía más valiosa del mundo
3Cómo grabar la pantalla en Windows 11
4Un estudio revela un factor insólito que aumenta los “me gusta” en las redes sociales






