Am 20. Oktober 2025 kam es zu einer massiven, weltweiten Störung von Amazon Web Services (AWS). Innerhalb weniger Minuten waren eCommerce-Plattformen, Banking-Apps, Gaming-Services und Kommunikationsdienste für Millionen Nutzer nicht erreichbar. Besonders hart getroffen hat es Lateinamerika: Marktführer wie MercadoLibre und Fintechs in Brasilien und Argentinien waren stundenlang außer Gefecht.
Was ist passiert?
Die Wurzel der Störung lag im AWS-US-EAST-1-Region in Virginia, einem der wichtigsten Cloud-Hubs weltweit. Durch einen Fehler im Domain Name System (DNS) – konkret im Zusammenhang mit dem DynamoDB API-Endpunkt – konnten Tausende Anwendungen ihre Datenbanken nicht mehr erreichen. Das resultierte in Kettenreaktionen bei zahlreichen AWS-Services wie EC2 und S3, die wiederum zentrale Geschäftsprozesse zahlreicher Unternehmen lahmlegten.
Globale Auswirkungen – von Fintech bis Gaming
Nach Schätzungen waren mehr als 500 Unternehmen weltweit betroffen. Besonders heftig spürbar war der Ausfall bei Finanz- und Zahlungssystemen in Lateinamerika. MercadoLibre meldete massive Ausfälle im eCommerce und Zahlungsverkehr, darunter bei der brasilianischen Echtzeit-Überweisung Pix und beim argentinischen ÖPNV. Auch internationale Plattformen wie Fortnite, Snapchat, Canva und die Amazon-eigenen Dienste Alexa und Prime Video waren zeitweise nicht erreichbar.
Warum ist das Thema so kritisch?
Die Störung zeigt eindrücklich, wie zentral Cloud-Infrastrukturen und insbesondere wenige dominante Anbieter wie AWS für die globale IT geworden sind. Obwohl es regionale Datenhaltung und hohe Verfügbarkeitsversprechen gibt, können interne Fehler an wenigen Standorten weltweite Folgen haben. Experten warnen daher: Datenhoheit ist wichtig – aber Servicehoheit ist in der Cloud-Ära mindestens genauso kritisch.
Learnings für Unternehmen
-
Cloud-Strategien müssen Resilienz und Redundanz einplanen – auch zwischen Regionen und Anbietern (Multi-Cloud).
-
Kritische Dienste sollten diversifiziert und Notfall-Playbooks regelmäßig getestet werden.
-
Transparente Kommunikation und Monitoring sind im Ernstfall entscheidend, um schnell reagieren zu können.
-
Strategischer Umgang mit Cloud-Abhängigkeiten: „When AWS sneezes, half the internet catches a cold“ bringt das Risiko auf den Punkt.
Fazit
Die Störung vom 20. Oktober 2025 ist ein Weckruf für alle Organisationen: Cloud-First bedeutet auch, die Risiken systemischer Abhängigkeiten aktiv zu managen, Resilienz aufzubauen und Krisenpläne stetig zu schärfen.

Comments powered by CComment