Am 21. März 2025 kam einer der größten Verkehrsknotenpunkte der Welt für 18 Stunden zum Erliegen, nachdem in einem der Umspannwerke in North Hyde ein Feuer ausgebrochen war.

Nach dem Vorfall reagierte der Vorstandsvorsitzende von National Grid auf Vorwürfe, dass die Verantwortlichen von Heathrow gezwungen waren, den Flughafen wegen Strommangels zu schließen, indem er bestätigte, dass die beiden anderen Umspannwerke in Betrieb und voll in der Lage waren, den Flughafen mit Strom zu versorgen. Warum konnte der Flughafen dann nicht an das Stromnetz angeschlossen werden und warum dauerte es so lange, bis der Betrieb wieder aufgenommen werden konnte?

In dieser Episode spricht Richard mit Simon Gallagher, Netzexperte und Geschäftsführer von UK Network Services, einem führenden unabhängigen Beratungsunternehmen für Energienetze, über einige der Bedenken, die dieser Stromausfall in Bezug auf die Energiesicherheit des Landes aufwirft. Wie verwundbar ist ein Teil der lebenswichtigen Infrastruktur des Landes?

Kernaussagen

Die Kernaussagen rund um den Stromausfall in Heathrow lassen sich wie folgt zusammenfassen:

  • Auslöser des Stromausfalls war ein Brand in einem elektrischen Umspannwerk (North Hyde) am Rande des Flughafens Heathrow. Dieser Brand führte zum Ausfall eines Transformators und zur Beschädigung eines zweiten, wodurch die Stromversorgung des Flughafens unterbrochen wurde. Es handelte sich dabei anscheinend um einen Gerätefehler und nicht um Sabotage.
  • Trotz der Anbindung Heathrows an drei unabhängige Stromversorgungspunkte des nationalen Netzes führte der Ausfall zweier Transformatoren zu einem vollständigen Betriebsstillstand des Flughafens für 24 Stunden. Tausende Passagiere waren gestrandet, und zahlreiche Flüge mussten umgeleitet oder annulliert werden.
  • Die sicherheitskritischen Systeme des Flughafens verfügten über eine Notstromversorgung (z.B. Landebahnbeleuchtung, Flugsicherung), die auch funktionierte. Allerdings verfügte der restliche Flughafen (Terminals, Gepäckabfertigungssysteme) über keine ausreichende Notstromversorgung, was zum Stillstand führte.
  • Eine zentrale Frage ist, warum Heathrow nicht in der Lage war, die Stromversorgung schnell von den beiden verbleibenden funktionierenden Netzzugangspunkten wiederherzustellen. Die Komplexität oder Designbeschränkungen des internen Hochspannungsnetzes könnten hier eine Rolle spielen.
  • Ein Vergleich mit einem nahegelegenen Datenzentrum mit einem 4-fach höheren Stromverbrauch zeigt signifikante Unterschiede in der Resilienz. Dieses Datenzentrum, das eine ähnliche Unterbrechung der Stromversorgung erlebte, konnte den Betrieb dank umfassender Notstromaggregate (mit redundanter Sicherung) und unterbrechungsfreier Stromversorgung (USV) ohne Ausfall aufrechterhalten.
  • Im Gegensatz zu Datenzentren scheinen Flughäfen, einschließlich Heathrow, weniger stark in umfassende Notstromversorgungssysteme für den gesamten Betrieb investiert zu haben. Dies könnte auf die Reife der Branche und eine möglicherweise andere Kosten-Nutzen-Analyse zurückzuführen sein, bei der die finanziellen Auswirkungen eines Ausfalls eher externisiert werden (z.B. auf Fluggesellschaften).
  • Auch andere europäische Flughäfen hatten in der Vergangenheit ähnliche Probleme (z.B. Schiphol), haben aber teilweise bereits Maßnahmen zur Erhöhung der Resilienz ergriffen. Dubai International Airport verfügt beispielsweise über drei unabhängige Netzzugänge und umfangreiche Notstromaggregate, ähnlich den Datenzentren.
  • Obwohl der Ausfall in Heathrow gravierende Folgen hatte, betont der Experte, dass das britische Stromnetz insgesamt sehr zuverlässig ist und es sich um ein seltenes Ereignis handelte. Solche „High Impact Low Probability“-Ereignisse können jedoch Schwachstellen aufzeigen.
  • Der Vorfall wirft Fragen nach der Resilienz kritischer Infrastrukturen im Allgemeinen auf und könnte die Notwendigkeit einer Überprüfung der Notfallvorsorge und der Investitionen in Backup-Systeme verdeutlichen.

Die Kernaussagen dieser Unterhaltung sind:

  • Der Stromausfall in Heathrow war die Folge eines unvorhersehbaren Gerätefehlers in einem externen Umspannwerk, der aber aufgrund der fehlenden Redundanz und Notstromversorgung für den Gesamtbetrieb zu einem schweren Ausfall führte.
  • Es gibt einen signifikanten Unterschied in der Priorisierung von Resilienz zwischen Flughäfen und modernen Datenzentren, wobei letztere aufgrund der direkten geschäftlichen Auswirkungen von Ausfällen deutlich mehr in Backup-Systeme investieren.
  • Die Fähigkeit zur schnellen Rekonfiguration des internen Stromnetzes von Heathrow nach dem Ausfall eines Netzzugangspunktes scheint begrenzt gewesen zu sein und ist Gegenstand von Untersuchungen.
  • Obwohl das britische Stromnetz generell zuverlässig ist, zeigt der Vorfall in Heathrow die Vulnerabilität wichtiger Infrastrukturen gegenüber unerwarteten Ereignissen auf.
  • Es gibt eine wachsende Belastung des Stromnetzes durch den stark zunehmenden Energiebedarf von Datenzentren, was möglicherweise Auswirkungen auf die Netzplanung und Preisgestaltung haben könnte.

Was wir daraus für die Erhöhung der Resilienz und Robustheit von Infrastrukturen lernen können:

  • Die Bedeutung von Redundanz: Kritische Infrastrukturen sollten über mehrfache, voneinander unabhängige Versorgungspfade verfügen, nicht nur bei der Hauptversorgung, sondern auch intern und bei Notstromsystemen. Von zentraler Bedeutung sind jedoch regelmäßige Übungen und scharfe Tests! Siehe das Konzept von Chaos-Monkey: Das Chaos-Monkey-Konzept ist ein Ansatz aus dem Bereich des Chaos Engineering, das gezielt Störungen in IT-Systemen erzeugt, um deren Resilienz und Wiederherstellungsfähigkeit zu testen. Entwickelt von Netflix, simuliert das Open-Source-Tool Chaos Monkey zufällige Ausfälle, indem es beispielsweise virtuelle Maschinen in Produktionsumgebungen deaktiviert. Ziel ist es, Schwachstellen aufzudecken und sicherzustellen, dass Systeme auch unter unvorhergesehenen Bedingungen stabil bleiben. Durch diese „kontrollierten Chaos-Tests“ können Unternehmen ihre Infrastruktur proaktiv verbessern und sich auf reale Störungen vorbereiten.
  • Investitionen in umfassende Notstromversorgung: Für Infrastrukturen mit potenziell gravierenden Auswirkungen eines Ausfalls (wie Flughäfen) sollten umfassende Notstromversorgungssysteme für den gesamten Betrieb in Betracht gezogen werden, ähnlich wie bei Datenzentren. Dies kann Dieselgeneratoren, Batterie-Backup-Systeme (USV) oder eine Kombination davon umfassen, um eine unterbrechungsfreie Stromversorgung zu gewährleisten.
  • Schnelle Rekonfigurationsmöglichkeiten: Interne Stromnetze sollten so konzipiert sein, dass sie im Falle des Ausfalls einer Hauptversorgungsquelle schnell auf alternative Quellen umgeschaltet werden können.
  • Regelmäßige Tests von Notstromsystemen: Die Funktionalität von Notstromsystemen sollte regelmäßig unter realen Bedingungen getestet werden, um sicherzustellen, dass sie im Ernstfall zuverlässig funktionieren. Diese müssen aber über den reinen Test der Netzersatzanlagen hinausgehen und reale Umschaltung vorsehen.
  • Kosten-Nutzen-Analyse von Resilienzmaßnahmen: Betreiber kritischer Infrastrukturen sollten umfassende Kosten-Nutzen-Analysen durchführen, die die potenziellen finanziellen und gesellschaftlichen Auswirkungen eines Ausfalls berücksichtigen, um angemessene Investitionen in Resilienzmaßnahmen zu rechtfertigen.
  • Lessons Learned aus Vorfällen: Die Untersuchung von Ausfällen wie in Heathrow ist entscheidend, um Schwachstellen zu identifizieren und daraus Lehren für die Zukunft zu ziehen, nicht nur für den betroffenen Flughafen, sondern für ähnliche Infrastrukturen weltweit.
  • Branchenübergreifender Austausch: Der Austausch von Best Practices und technologischen Lösungen zwischen verschiedenen Branchen (z.B. Flughäfen und Datenzentren) kann zur Verbesserung der Resilienz beitragen.
  • Berücksichtigung zukünftiger Belastungen: Bei der Planung und dem Ausbau von Infrastrukturen muss der steigende Energiebedarf neuer Technologien und Industrien (z.B. Datenzentren, Elektromobilität) berücksichtigt werden, um die Stabilität und Resilienz des gesamten Netzes zu gewährleisten.

⚠️ Online-Diskussionen deuten darauf hin, dass es bei den Auswirkungen auf Heathrow weniger um die Dauer des Stromausfalls geht (dem Berichten zufolge sehr kurz war), sondern eher um „einen“ Stromausfall, der die IT-Systeme lahmlegte, und um die Zeit, die benötigt wurde, um sie wieder online zu bringen.

Ich denke, dass Flughäfen eine reifere Branche sind und sich die Dinge im Laufe der Zeit verändert haben. Flughäfen sind wahrscheinlich wichtiger für die Wirtschaft und das tägliche Leben als vor 20 Jahren, während Rechenzentren eine neue, junge Branche sind. Ich glaube, sie sind sich heute der Folgen eines Ausfalls bewusster, der katastrophal wäre, nicht nur für ihre Geschäftsmodelle, sondern auch für ihre Kunden. Denn auch die würden ausfallen. Das Rechenzentrum scheint also eine Kosten-Nutzen-Analyse durchgeführt zu haben, die zeigt, dass es sich lohnt, Millionen von Pfund und Generatoren auszugeben. Es lohnt sich, diese Millionen Pfund auszugeben, um sich vor einem extrem seltenen Ereignis zu schützen, und das wäre? Dieser Stromausfall. Ja. Das haben sie getan. Sie haben die Wirtschaftlichkeitsrechnung gemacht, also ist es das wert, und ich glaube nicht, dass die Flughäfen das nicht aktiv gemacht haben. Es ist nur so, dass sich die Dinge im Laufe der Zeit geändert haben, und das muss jetzt neu betrachtet werden.

Anmerkung: Ein Rechenzentrum ist trotz allem eine sehr überschaubare Infrastruktur mit einer Gesamtplanung von Beginn an. Ein Flughafen hingegen ist eine gewachsene Infrastruktur mit sehr vielen unterschiedlichen Gewerken, was die ganze Sache wesentlich komplexer macht.

Siehe auch den Beitrag Alternde Infrastruktur, anfällige Systeme und Informationskriegführung.