Skip to content

Der Mythos der Perfektion

„Fünf Neunen Verfügbarkeit garantiert." Dieser Satz taucht in SLAs, Marketingmaterialien und Ausschreibungen auf. Die Zahl klingt beeindruckend: 99,999% Uptime bedeutet, dass Ihr System nur 5 Minuten und 15 Sekunden pro Jahr nicht erreichbar ist.

Was Anbieter nicht bewerben: Fünf Neunen sind kein Feature, das man kaufen kann. Es ist ein architektonischer Anspruch, der Ihre Infrastrukturkosten um das 3- bis 10-fache erhöht. Für die meisten Unternehmen ist er völlig unnötig.

Dieser Artikel erklärt, was fünf Neunen tatsächlich erfordern, wann sich die Investition lohnt und wie Sie Zuverlässigkeit an Ihre tatsächlichen Geschäftsanforderungen anpassen.


Die Mathematik hinter den Neunen

Was jede Neune wirklich bedeutet

Verfügbarkeit Ausfallzeit pro Jahr Ausfallzeit pro Monat
99% (zwei Neunen) 3 Tage, 15 Stunden 7 Stunden, 18 Minuten
99,9% (drei Neunen) 8 Stunden, 46 Minuten 43 Minuten, 50 Sekunden
99,99% (vier Neunen) 52 Minuten, 35 Sekunden 4 Minuten, 23 Sekunden
99,999% (fünf Neunen) 5 Minuten, 15 Sekunden 26 Sekunden

Jede zusätzliche Neune reduziert die erlaubte Ausfallzeit um den Faktor 10. Infrastrukturkomplexität und Kosten folgen derselben Kurve.

Die versteckten Annahmen

Die Fünf-Neunen-Berechnung setzt voraus:

  • Geplante Wartung zählt als Ausfallzeit, es sei denn, Sie haben Zero-Downtime-Deployment
  • Teilweise Ausfälle zählen, wenn ein Nutzer Beeinträchtigungen erlebt
  • Der Messzeitraum ist kontinuierlich, nicht selektiv gewählt

Viele Anbieter werben mit fünf Neunen und schließen dabei geplante Wartungsfenster aus. Das sind keine fünf Neunen. Das ist kreative Buchhaltung.


Was fünf Neunen tatsächlich erfordern

Redundanz auf jeder Ebene

99,999% Verfügbarkeit zu erreichen bedeutet, jeden einzelnen Ausfallpunkt zu eliminieren. Das erfordert:

Ebene Einzelsystem Fünf-Neunen-Architektur
Strom Einzelne Netzanbindung Doppelte Einspeisung + USV + Generator
Netzwerk Einzelner Provider Mehrere Provider mit automatischem Failover
Hardware Einzelner Server Active-Active-Cluster über Rechenzentren
Speicher Lokale Festplatten Replizierter Speicher mit automatischem Failover
Anwendung Monolithische Bereitstellung Microservices mit Circuit Breakern
Datenbank Einzelne Instanz Synchrone Replikation über Regionen

Kostenmultiplikator: Jede Redundanzebene erhöht die Kosten dieser Komponente typischerweise um 50-100%.

Geografische Verteilung

Echte fünf Neunen erfordern geografische Redundanz. Wenn Ihr primäres Rechenzentrum einen Ausfall erleidet (Brand, Überschwemmung, Glasfaserbruch), brauchen Sie sofortiges Failover zu einem sekundären Standort.

Das bedeutet:

  • Zwei oder mehr Rechenzentren in verschiedenen Regionen
  • Datenreplikation zwischen Standorten (synchron für null Datenverlust)
  • Globales Load Balancing mit Gesundheitsprüfungen
  • Netzwerk-Latenzoptimierung für regionsübergreifenden Verkehr

Praxisbeispiel: Ein Finanzdienstleister investierte jährlich 2,4 Millionen Euro in Infrastruktur für fünf Neunen. Die gleiche Workload ohne geografische Redundanz hätte 400.000 Euro gekostet.

Operative Exzellenz

Hardware-Redundanz ist wertlos, wenn Ihr Team nicht schnell genug auf Vorfälle reagieren kann. Fünf Neunen erfordern:

  • 24/7-Monitoring und Alerting mit Erkennung unter einer Minute
  • On-Call-Rotationen mit garantierten Reaktionszeiten
  • Runbooks für jedes bekannte Ausfallszenario
  • Chaos Engineering zur Entdeckung unbekannter Fehlermodi
  • Post-Incident-Reviews mit umsetzbaren Verbesserungen

Versteckte Kosten: Eine angemessene On-Call-Rotation für fünf Neunen erfordert typischerweise 5-8 Ingenieure pro Team, unter Berücksichtigung von Zeitzonen, Übergaben und Vorbeugung von Burnout.

Das Gesamtkostenbild

Komponente Standard-Setup Fünf-Neunen-Setup Kostensteigerung
Compute 5.000 €/Monat 15.000-25.000 €/Monat 3-5x
Netzwerk 1.000 €/Monat 4.000-8.000 €/Monat 4-8x
Speicher 2.000 €/Monat 6.000-10.000 €/Monat 3-5x
Personal 2 VZÄ 6-8 VZÄ 3-4x
Werkzeuge 500 €/Monat 3.000-5.000 €/Monat 6-10x

Jährliche Gesamtkostendifferenz: 200.000-400.000 € für eine mittelgroße Anwendung.


Wann sich fünf Neunen lohnen

Der Business Case für maximale Verfügbarkeit

Fünf Neunen machen Sinn, wenn Ausfallzeiten quantifizierbare Kosten haben, die die Infrastrukturinvestition übersteigen.

Berechtigte Fünf-Neunen-Szenarien:

  • Zahlungsabwicklung: Jede Minute Ausfall kostet Transaktionserlöse und beschädigt Vertrauen
  • Gesundheitssysteme: Zugriff auf Patientendaten kann lebenskritisch sein
  • Notfalldienste: Notrufzentralen, Katastrophenschutzkoordination
  • Finanzhandel: Millisekunden Ausfall können Millionen an verlorenen Trades bedeuten
  • Fertigungssteuerungssysteme: Produktionslinienstopps haben kaskadierende Kosten

Die Rechnung: Wenn eine Stunde Ausfall Ihr Unternehmen 50.000 € oder mehr kostet, kann Fünf-Neunen-Infrastruktur einen positiven ROI haben. Unter diesem Schwellenwert betreiben Sie wahrscheinlich Over-Engineering.

Die Kosten des Over-Engineering

Viele Organisationen jagen fünf Neunen, ohne den Business Case zu berechnen. Das Ergebnis:

  • Infrastrukturkosten, die mögliche Ausfallverluste in den Schatten stellen
  • Komplexität, die die Entwicklung verlangsamt und Fehlerquoten erhöht
  • Alarmmüdigkeit, die Teams für echte Vorfälle unempfindlich macht
  • Opportunitätskosten für Engineering-Zeit, die in Zuverlässigkeitstheater investiert wird

Ein warnendes Beispiel: Ein E-Commerce-Unternehmen investierte 1,2 Millionen Euro in Fünf-Neunen-Infrastruktur. Ihr Jahresumsatz betrug 3 Millionen Euro. Durchschnittliche Ausfallkosten pro Stunde: 400 €. Sie erreichten fünf Neunen, gaben aber das 20-fache ihres maximal möglichen Ausfallverlusts für die Verhinderung aus.


Der pragmatische Ansatz: Richtige Dimensionierung von Zuverlässigkeit

Verfügbarkeit zum Geschäftseinfluss zuordnen

Statt der höchstmöglichen Uptime hinterherzujagen, ordnen Sie Verfügbarkeitsstufen dem Geschäftseinfluss zu:

Stufe Verfügbarkeit Ausfall/Jahr Geeignet für
Bronze 99% 3,65 Tage Interne Werkzeuge, Entwicklungsumgebungen
Silber 99,9% 8,7 Stunden Nicht-kundenorientierte Dienste
Gold 99,99% 52 Minuten Kundenorientierte Anwendungen
Platin 99,999% 5 Minuten Umsatzkritische, sicherheitsrelevante Systeme

Der 99,9%-Sweet-Spot: Für die meisten Unternehmen bieten drei Neunen den besten ROI. Sie sind weniger als 9 Stunden pro Jahr nicht erreichbar, typischerweise während wartungsbedingter Schwachlastzeiten, und vermeiden die exponentiellen Kosten höherer Verfügbarkeit.

Wie 99,9% aussehen

Drei Neunen zu erreichen ist unkompliziert:

  • Redundante Server in einem einzelnen Rechenzentrum (Active-Passive)
  • Automatisches Failover für Datenbanken und Speicher
  • Regelmäßige Backups mit getesteten Wiederherstellungsprozeduren
  • Monitoring und Alerting während der Geschäftszeiten mit On-Call für kritische Probleme
  • Geplante Wartungsfenster während schwacher Nutzungszeiten

Jährliche Kosten: Typischerweise 1,5-2x eines nicht-redundanten Setups, nicht 5-10x.

Die Wartungsfenster-Strategie

Geplante Ausfallzeiten sind kein Versagen. Sie sind verantwortungsvoller Betrieb. Ein 4-stündiges Wartungsfenster um 3 Uhr morgens am Sonntag betrifft praktisch keine Kunden, ermöglicht aber:

  • Sicherheitspatches und Updates
  • Datenbankmigrationen und -optimierungen
  • Infrastruktur-Upgrades
  • Performance-Optimierung

Die Rechnung: 12 Wartungsfenster à 4 Stunden = 48 Stunden geplanter Ausfall. Das sind 99,45% Verfügbarkeit. Wenn diese Fenster zu Zeiten mit unter 1% der Spitzenlast liegen, ist der Geschäftseinfluss vernachlässigbar.


Messen, was zählt

SLA vs. SLO vs. SLI

Bevor Sie Verfügbarkeitsziele festlegen, verstehen Sie die Terminologie:

  • SLI (Service Level Indicator): Die Kennzahl, die Sie messen (z. B. erfolgreiche Anfragen / Gesamtanfragen)
  • SLO (Service Level Objective): Ihr Ziel für diese Kennzahl (z. B. 99,9% erfolgreiche Anfragen)
  • SLA (Service Level Agreement): Die vertragliche Konsequenz bei Verfehlen des Ziels (z. B. Servicegutschriften)

Viele Organisationen definieren SLAs, ohne SLIs zu messen oder sinnvolle SLOs festzulegen. Das Ergebnis ist ein Vertrag ohne operative Realität.

Fehlerbudgets: Der moderne Ansatz

Statt Verfügbarkeit als binäres Ziel zu behandeln, nutzen Sie Fehlerbudgets:

  1. Budget berechnen: 99,9% Verfügbarkeit = 8,7 Stunden Ausfallbudget pro Jahr
  2. Verbrauch verfolgen: Jeder Vorfall reduziert Ihr Budget
  3. Abwägungen treffen: Wenn Sie bis Juni 6 Stunden Budget verbraucht haben, können Sie:
    • Höheres Risiko für den Rest des Jahres akzeptieren
    • Feature-Geschwindigkeit reduzieren, um Zuverlässigkeit zu verbessern
    • In Infrastruktur investieren, um das Budget zu erweitern

Fehlerbudgets machen Zuverlässigkeit zu einer Geschäftsentscheidung, nicht zu einem Glaubenskrieg zwischen „schnell voran" und „nichts kaputt machen".

Ehrliche Kennzahlen

Was Sie messen, ist genauso wichtig wie das, was Sie anstreben:

Kennzahl Was sie verbirgt Was sie offenbart
Server-Uptime Anwendungsfehler, Netzwerkprobleme Infrastruktur-Stabilität
Anfrage-Erfolgsrate Langsame Antworten, beeinträchtigte Funktionen Nutzerorientierte Verfügbarkeit
User-Session-Abschluss Nichts, das ist der Goldstandard End-to-End-Zuverlässigkeit

Messen Sie aus der Perspektive des Nutzers. Ein Server, der „läuft" aber Fehler zurückgibt, ist nicht verfügbar.


Zuverlässigkeit als Geschäftsentscheidung

Fünf Neunen sind kein Qualitätsmerkmal. Es ist eine Geschäftsentscheidung mit quantifizierbaren Kosten und Nutzen. Bevor Sie in maximale Verfügbarkeit investieren:

  1. Berechnen Sie Ihre tatsächlichen Ausfallkosten pro Stunde
  2. Ordnen Sie Verfügbarkeitsstufen dem Geschäftseinfluss zu
  3. Wählen Sie das richtige Ziel basierend auf ROI, nicht Marketing
  4. Messen Sie aus Nutzerperspektive
  5. Nutzen Sie Fehlerbudgets für fundierte Abwägungen

Für die meisten Unternehmen bieten drei Neunen (99,9%) mit strategischen Wartungsfenstern das optimale Verhältnis von Zuverlässigkeit und Kosten. Vier Neunen (99,99%) sind angemessen für kundenorientierte Anwendungen, bei denen Ausfallzeiten direkt den Umsatz beeinträchtigen. Fünf Neunen sollten Systemen vorbehalten sein, bei denen Verfügbarkeit wirklich missionkritisch ist.

Zahlen Sie nicht für Zuverlässigkeit, die Sie nicht brauchen. Investieren Sie in die Verfügbarkeit, die Ihr Unternehmen tatsächlich benötigt, und nicht mehr.


Unsicher, welche Verfügbarkeitsstufe Ihre Systeme benötigen? Kontaktieren Sie uns für eine Zuverlässigkeitsanalyse, die Infrastruktur auf Geschäftseinfluss abstimmt.