Nueva York, 20 de octubre de 2025. Amazon Web Services (AWS), el pilar de la infraestructura en la nube que soporta gran parte de internet, reportó avances significativos en la recuperación de sus operaciones tras una interrupción global que dejó inoperativos miles de sitios web, aplicaciones y plataformas de alto perfil durante horas este lunes. La compañía confirmó que «sus sistemas están prácticamente de nuevo en línea», aunque un servicio clave como Lambda continúa presentando errores intermitentes, lo que prolonga el impacto en desarrolladores y empresas dependientes de su escalabilidad automática.
La falla, detectada alrededor de las 5:00 a.m. ET en la región US-EAST-1 (Northern Virginia) –la más crítica de AWS por su volumen de tráfico–, afectó servicios esenciales como S3 para almacenamiento, EC2 para cómputo y RDS para bases de datos, generando un efecto dominó en ecosistemas globales. Plataformas como Signal (mensajería encriptada), Coinbase (exchange de criptomonedas), Robinhood (trading minorista) y hasta sitios de noticias como The New York Times experimentaron caídas parciales o totales, con reportes de más de 50.000 incidencias en Downdetector a las 8:00 a.m. ET. Este incidente, el más severo desde el de diciembre de 2021 que duró 12 horas, resalta la vulnerabilidad de la dependencia concentrada en proveedores en la nube: AWS maneja el 31% del mercado global.
En un comunicado emitido a las 2:00 p.m. ET, AWS detalló: «Seguimos observando la recuperación en todos los servicios de AWS». La causa raíz se atribuye a un «error de configuración en un componente de red interna» durante una actualización rutinaria, un problema que se propagó rápidamente por la interconexión de regiones. Aunque la mitigación se inició en menos de una hora, el servicio Lambda –que permite a clientes ejecutar código sin gestionar servidores subyacentes– permanece con latencias elevadas, afectando a desarrolladores que dependen de su ejecución serverless para aplicaciones escalables como e-commerce y streaming.
El alcance global: De Wall Street a WhatsApp, el dominó de la nube
El outage no discriminó fronteras ni sectores. En Estados Unidos, donde AWS procesa el 40% de su tráfico, aerolíneas como Delta y United reportaron demoras en check-ins digitales, mientras que servicios de delivery como DoorDash y Uber Eats enfrentaron interrupciones en pedidos. En Europa, la British Library y el sitio del Parlamento del Reino Unido cayeron temporalmente, y en Asia, plataformas como Alibaba y Tencent –clientes indirectos vía integraciones– registraron picos de error del 15%. Incluso aplicaciones cotidianas como Netflix y Disney+ experimentaron buffering en regiones dependientes de AWS para contenido dinámico.
Downdetector registró picos de 100.000 reportes globales a las 9:00 a.m. ET, con el 60% concentrados en EE.UU. y el 20% en Latinoamérica, donde servicios como Mercado Libre y Rappi sufrieron caídas parciales. El impacto económico preliminar, según estimaciones de CloudZero, podría ascender a 500 millones de dólares en pérdidas por hora de inactividad, afectando a empresas con modelos de suscripción y publicidad digital. «Un minuto de downtime en AWS cuesta a Fortune 500 el equivalente a 100.000 dólares», advierte un informe de la firma, destacando cómo el 70% de las compañías S&P 500 dependen de su infraestructura.
AWS, filial de Amazon que generó 107.600 millones de dólares en ingresos en 2024 (33% del total corporativo), ha enfrentado críticas recurrentes por su centralización: el 60% de su capacidad global reside en US-EAST-1, un «punto único de falla» que ha sido causa del 40% de outages mayores desde 2017, según Gartner. La compañía ha invertido 25.000 millones de dólares anuales en redundancia, pero incidentes como este subrayan la complejidad de su ecosistema híbrido, que integra IA generativa y edge computing.
Respuesta de Amazon: Mitigación rápida, pero lecciones pendientes
Desde el dashboard de salud de AWS, actualizado cada 15 minutos, la compañía reportó a las 1:00 p.m. ET que el 95% de los servicios estaban operativos, con Lambda en «recuperación activa». «Lambda permite a los clientes escribir código nuevo para sus productos y plataformas, y el servicio gestionará automáticamente la infraestructura necesaria para implementar el código», explicó un portavoz, reconociendo que este retraso afecta a 50 millones de funciones diarias ejecutadas por clientes como Capital One y Expedia.
Amazon activó su protocolo de respuesta incidente (IRC), coordinando equipos de 500 ingenieros para reprovisionar capacidad y redirigir tráfico a regiones secundarias como US-WEST-2. A las 12:00 p.m. ET, el 80% del tráfico global se había restaurado, pero persistieron quejas en foros como Reddit y Stack Overflow sobre cachés corruptos y datos no sincronizados.
Implicaciones sectoriales: Lecciones para una economía digital frágil
Este evento resalta la fragilidad de la era digital: el 90% de las compañías Fortune 1000 usan AWS, desde Netflix (que sirvió 250 millones de horas diarias durante el pico) hasta el Departamento de Defensa de EE.UU. Las pérdidas globales podrían superar los 2.000 millones de dólares, con impactos en e-commerce (Amazon Prime afectó envíos) y finanzas (Robinhood reportó 10 millones de dólares en transacciones perdidas). En Latinoamérica, donde AWS domina el 45% del cloud público, firmas como Nubank y Mercado Pago enfrentaron caídas del 20% en transacciones.
Reguladores responden: la FTC en EE.UU. anunció una revisión de «monopolios en la nube», mientras la UE, bajo el Digital Markets Act, exige mayor transparencia en SLAs (acuerdos de nivel de servicio). AWS ofrece compensaciones automáticas por downtime superior a 5 minutos –hasta el 30% de créditos mensuales–, pero críticos como la Electronic Frontier Foundation argumentan que esto es insuficiente para PYMES, que representan el 40% de sus clientes.
A las 4:00 p.m. ET, AWS confirmó la «mitigación completa» de Lambda, cerrando el incidente. Para Amazon, con ingresos anuales de 574.800 millones de dólares en 2024, este revés es un recordatorio: en una economía donde el 80% del PIB global depende de la nube, un fallo no es solo técnico; es sistémico. La recuperación, aunque rápida, deja una pregunta abierta: ¿estamos preparados para el próximo?














