Letzte Aktualisierung am 17. Januar 2016.

Quelle: orf.at

Das Mobilfunknetz der Deutschen Telekom in den Niederlanden ist nahezu einen Tag lang ausgefallen. Wegen eines Softwarefehlers seien Handytelefonate und der Zugriff auf das Internet ab gestern Nachmittag 14.00 Uhr gestört gewesen, teilte die Telekom-Tochter T-Mobile Niederlande heute auf ihrer Website mit.

Der Ausfall zog sich die ganze Nacht hin und wurde erst um 9.00 Uhr behoben, allerdings noch nicht für alle Kunden. Die Telekom zählt in den Niederlanden 3,7 Millionen Mobilfunknutzer und ist dort drittgrößter Anbieter.

Kommentar

Offensichtlich dürfte es keine gröberen Probleme gegeben haben, da es dazu bisher kaum Berichte im Internet gibt bzw. nur diese kurze Einheitsmeldung. Die Frage ist, was ein solches Szenario in einer realen Welt mit Internet of Things und Industrie 4.0 auslösen wird.

Es ist nicht so schlimm, dass etwas passieren kann, denn es gibt nirgends 100 Prozent Sicherheit. Unverantwortlich ist nur, wenn wir uns einfach darauf verlassen, dass nichts passiert und keine Rückfallebenen vorsehen, wie das derzeit weitgehend der Fall ist. Zum anderen ist es aber auch notwendig, dass bisherige Systemdesign zu überdenken. Denn in vielen Bereichen fehlen überlebensnotwendige Reichweitenbegrenzungen!

Ergänzung Franz Hein

Von 14 Uhr über die Nacht hinweg bis 9 Uhr ist zwar eine ganz beachtliche Nichtverfügbarkeitszeit, aber der größte Teil davon war nachts. Damit waren sicher die Auswirkungen noch begrenzt. Aber:

  • Als Ursache wird ein Softwarefehler angegeben – warum dann diese lange Ausfallzeit?
  • Softwarefehler haben in der Regel als Ursache eine kürzlich vorgenommene Änderung – warum hat ein Test den Fehler nicht vor der Inbetriebnahme aufgedeckt?
  • Es gab offensichtlich keine „Undo“-Funktion für ein rasches Zurück zum vorher stattgefundenen Normalbetrieb – gibt es eine solche Möglichkeit nicht?
  • Inzwischen gibt es immer mehr nur noch eine mobile Erreichbarkeit – gibt es genügend Redundanz und die Möglichkeit, auf das Festnetz umzusteigen?
  • Softwarefehler sind inzwischen so normal, dass sich niemand mehr wundert – müsste da nicht eine größere Transparenz über die näheren Umständen eingefordert werden?
  • Wir wachsen in eine erheblich umfangreichere Vernetzung hinein und damit in eine Abhängigkeit (wie beim Strom) – müsste das nicht zu einer erhöhten Vorsorge führen?

Das Überdenken des bisherigen Systemdesigns würde in letzter Konsequenz bedeuten: Zurück auf Los und Neubeginn, denn die heutige grundsätzliche Struktur geht leider von zentralen Komponenten aus, die so entscheidend wichtig sind, dass bei deren Ausfall die Auswirkungen sofort fatal sind. Wir haben in aller Regel keine fehlertoleranten IT-Systeme konstruiert und gebaut. Die zugrunde liegende Logik schlägt erbarmungslos zu. Es gibt ganz wenige Bereiche, bei denen Redundanz und Diversität beachtet wurden oder die Logik so umgesetzt wurde, dass das System bei auftretenden Fehlern in einen „sicheren“ Zustand übergeht (z. B. bei Signalanlagen der Bahn). Wenn kein Zug mehr fahren darf, kann kein Zusammenstoß auftreten – nur gibt es dann auch keinen Transport mehr.

Das Wort „Reichweitenbegrenzung“ kommt eher aus der „analogen“ Welt. Im digitalen Umfeld ist dieser Begriff aus meiner Sicht nicht definiert, denn da geht es meist um verfügbar oder nicht verfügbar. Bei einem Fehler in einer zentralen Komponente dehnt sich die Reichweite sofort auf das Gesamtsystem aus. Wir haben es im digitalen Umfeld um eine neue Art von Fehlern zu tun. Das sind wir immer noch nicht gewohnt. Um das klar zu machen, hatte ich bei meinem Vortrag im Dezember in Wien vor, auf die neue Fehlercharakteristik einzugehen. Dazu kam es nicht, weil die Vortragszeit extrem gekürzt worden ist. Wir nehmen uns nicht mehr die Zeit, solche Problemstellungen mit der unbedingt nötigen Gründlichkeit anzugehen. Lieber machen wir die Augen zu oder stecken den Kopf in den Sand (und hoffen, dass der Kelch an uns vorüber geht).

Wir müssten zu einer „Folgenbegrenzung“ gelangen, um mit einer Verfügbarkeit kleiner 100% trotzdem leben zu können. Das erfordert eine totale Denkwende – siehe oben die Feststellung: Zurück auf Los und Neubeginn. Die zunehmende Abhängigkeit von der kritischen Infrastruktur „IKT – in Symbiose mit der Energietechnik“ wird uns das Umdenken irgendwann aufzwingen. Aus meiner Sicht ist das „nur“ eine Frage der Zeit und auch „nur“ abhängig vom Schadenspotential. Irgendwann nützt dann auch keine Versicherung mehr, da die eingetretene Realitäten auch mit viel Geld im Nachhinein weder zu ändern sind noch in ihren Folgewirkungen tolerabel werden. Siehe dazu z. B. den absichtlich herbeigeführten Absturz eines Germanwings-Flugzeuges.

Siehe auch Weltrisikogesellschaft – Auf der Suche nach der verlorenen Sicherheit