Fünf Neunen: Was 99,999% Verfügbarkeit wirklich kostet
Die Versprechen von 99,999% Verfügbarkeit klingen überzeugend, nur 5 Minuten Ausfall pro Jahr. Aber was erfordert es wirklich? Und wichtiger noch: Brauchen Sie es?

Inhalt

Fünf Neunen: Was 99,999% Verfügbarkeit wirklich kostet
Die Versprechen von 99,999% Verfügbarkeit klingen überzeugend, nur 5 Minuten Ausfall pro Jahr. Aber was erfordert es wirklich? Und wichtiger noch: Brauchen Sie es?
Der Mythos der Perfektion
„Fünf Neunen Verfügbarkeit garantiert." Dieser Satz taucht in SLAs, Marketingmaterialien und Ausschreibungen auf. Die Zahl klingt beeindruckend: 99,999% Uptime bedeutet, dass Ihr System nur 5 Minuten und 15 Sekunden pro Jahr nicht erreichbar ist.
Was Anbieter nicht bewerben: Fünf Neunen sind kein Feature, das man kaufen kann. Es ist ein architektonischer Anspruch, der Ihre Infrastrukturkosten um das 3- bis 10-fache erhöht. Für die meisten Unternehmen ist er völlig unnötig.
Dieser Artikel erklärt, was fünf Neunen tatsächlich erfordern, wann sich die Investition lohnt und wie Sie Zuverlässigkeit an Ihre tatsächlichen Geschäftsanforderungen anpassen.
Die Mathematik hinter den Neunen
Was jede Neune wirklich bedeutet
| Verfügbarkeit | Ausfallzeit pro Jahr | Ausfallzeit pro Monat |
|---|---|---|
| 99% (zwei Neunen) | 3 Tage, 15 Stunden | 7 Stunden, 18 Minuten |
| 99,9% (drei Neunen) | 8 Stunden, 46 Minuten | 43 Minuten, 50 Sekunden |
| 99,99% (vier Neunen) | 52 Minuten, 35 Sekunden | 4 Minuten, 23 Sekunden |
| 99,999% (fünf Neunen) | 5 Minuten, 15 Sekunden | 26 Sekunden |
Jede zusätzliche Neune reduziert die erlaubte Ausfallzeit um den Faktor 10. Infrastrukturkomplexität und Kosten folgen derselben Kurve.
Die versteckten Annahmen
Die Fünf-Neunen-Berechnung setzt voraus:
- Geplante Wartung zählt als Ausfallzeit, es sei denn, Sie haben Zero-Downtime-Deployment
- Teilweise Ausfälle zählen, wenn ein Nutzer Beeinträchtigungen erlebt
- Der Messzeitraum ist kontinuierlich, nicht selektiv gewählt
Viele Anbieter werben mit fünf Neunen und schließen dabei geplante Wartungsfenster aus. Das sind keine fünf Neunen. Das ist kreative Buchhaltung.
Was fünf Neunen tatsächlich erfordern
Redundanz auf jeder Ebene
99,999% Verfügbarkeit zu erreichen bedeutet, jeden einzelnen Ausfallpunkt zu eliminieren. Das erfordert:
| Ebene | Einzelsystem | Fünf-Neunen-Architektur |
|---|---|---|
| Strom | Einzelne Netzanbindung | Doppelte Einspeisung + USV + Generator |
| Netzwerk | Einzelner Provider | Mehrere Provider mit automatischem Failover |
| Hardware | Einzelner Server | Active-Active-Cluster über Rechenzentren |
| Speicher | Lokale Festplatten | Replizierter Speicher mit automatischem Failover |
| Anwendung | Monolithische Bereitstellung | Microservices mit Circuit Breakern |
| Datenbank | Einzelne Instanz | Synchrone Replikation über Regionen |
Kostenmultiplikator: Jede Redundanzebene erhöht die Kosten dieser Komponente typischerweise um 50-100%.
Geografische Verteilung
Echte fünf Neunen erfordern geografische Redundanz. Wenn Ihr primäres Rechenzentrum einen Ausfall erleidet (Brand, Überschwemmung, Glasfaserbruch), brauchen Sie sofortiges Failover zu einem sekundären Standort.
Das bedeutet:
- Zwei oder mehr Rechenzentren in verschiedenen Regionen
- Datenreplikation zwischen Standorten (synchron für null Datenverlust)
- Globales Load Balancing mit Gesundheitsprüfungen
- Netzwerk-Latenzoptimierung für regionsübergreifenden Verkehr
Praxisbeispiel: Ein Finanzdienstleister investierte jährlich 2,4 Millionen Euro in Infrastruktur für fünf Neunen. Die gleiche Workload ohne geografische Redundanz hätte 400.000 Euro gekostet.
Operative Exzellenz
Hardware-Redundanz ist wertlos, wenn Ihr Team nicht schnell genug auf Vorfälle reagieren kann. Fünf Neunen erfordern:
- 24/7-Monitoring und Alerting mit Erkennung unter einer Minute
- On-Call-Rotationen mit garantierten Reaktionszeiten
- Runbooks für jedes bekannte Ausfallszenario
- Chaos Engineering zur Entdeckung unbekannter Fehlermodi
- Post-Incident-Reviews mit umsetzbaren Verbesserungen
Versteckte Kosten: Eine angemessene On-Call-Rotation für fünf Neunen erfordert typischerweise 5-8 Ingenieure pro Team, unter Berücksichtigung von Zeitzonen, Übergaben und Vorbeugung von Burnout.
Das Gesamtkostenbild
| Komponente | Standard-Setup | Fünf-Neunen-Setup | Kostensteigerung |
|---|---|---|---|
| Compute | 5.000 €/Monat | 15.000-25.000 €/Monat | 3-5x |
| Netzwerk | 1.000 €/Monat | 4.000-8.000 €/Monat | 4-8x |
| Speicher | 2.000 €/Monat | 6.000-10.000 €/Monat | 3-5x |
| Personal | 2 VZÄ | 6-8 VZÄ | 3-4x |
| Werkzeuge | 500 €/Monat | 3.000-5.000 €/Monat | 6-10x |
Jährliche Gesamtkostendifferenz: 200.000-400.000 € für eine mittelgroße Anwendung.
Wann sich fünf Neunen lohnen
Der Business Case für maximale Verfügbarkeit
Fünf Neunen machen Sinn, wenn Ausfallzeiten quantifizierbare Kosten haben, die die Infrastrukturinvestition übersteigen.
Berechtigte Fünf-Neunen-Szenarien:
- Zahlungsabwicklung: Jede Minute Ausfall kostet Transaktionserlöse und beschädigt Vertrauen
- Gesundheitssysteme: Zugriff auf Patientendaten kann lebenskritisch sein
- Notfalldienste: Notrufzentralen, Katastrophenschutzkoordination
- Finanzhandel: Millisekunden Ausfall können Millionen an verlorenen Trades bedeuten
- Fertigungssteuerungssysteme: Produktionslinienstopps haben kaskadierende Kosten
Die Rechnung: Wenn eine Stunde Ausfall Ihr Unternehmen 50.000 € oder mehr kostet, kann Fünf-Neunen-Infrastruktur einen positiven ROI haben. Unter diesem Schwellenwert betreiben Sie wahrscheinlich Over-Engineering.
Die Kosten des Over-Engineering
Viele Organisationen jagen fünf Neunen, ohne den Business Case zu berechnen. Das Ergebnis:
- Infrastrukturkosten, die mögliche Ausfallverluste in den Schatten stellen
- Komplexität, die die Entwicklung verlangsamt und Fehlerquoten erhöht
- Alarmmüdigkeit, die Teams für echte Vorfälle unempfindlich macht
- Opportunitätskosten für Engineering-Zeit, die in Zuverlässigkeitstheater investiert wird
Ein warnendes Beispiel: Ein E-Commerce-Unternehmen investierte 1,2 Millionen Euro in Fünf-Neunen-Infrastruktur. Ihr Jahresumsatz betrug 3 Millionen Euro. Durchschnittliche Ausfallkosten pro Stunde: 400 €. Sie erreichten fünf Neunen, gaben aber das 20-fache ihres maximal möglichen Ausfallverlusts für die Verhinderung aus.
Der pragmatische Ansatz: Richtige Dimensionierung von Zuverlässigkeit
Verfügbarkeit zum Geschäftseinfluss zuordnen
Statt der höchstmöglichen Uptime hinterherzujagen, ordnen Sie Verfügbarkeitsstufen dem Geschäftseinfluss zu:
| Stufe | Verfügbarkeit | Ausfall/Jahr | Geeignet für |
|---|---|---|---|
| Bronze | 99% | 3,65 Tage | Interne Werkzeuge, Entwicklungsumgebungen |
| Silber | 99,9% | 8,7 Stunden | Nicht-kundenorientierte Dienste |
| Gold | 99,99% | 52 Minuten | Kundenorientierte Anwendungen |
| Platin | 99,999% | 5 Minuten | Umsatzkritische, sicherheitsrelevante Systeme |
Der 99,9%-Sweet-Spot: Für die meisten Unternehmen bieten drei Neunen den besten ROI. Sie sind weniger als 9 Stunden pro Jahr nicht erreichbar, typischerweise während wartungsbedingter Schwachlastzeiten, und vermeiden die exponentiellen Kosten höherer Verfügbarkeit.
Wie 99,9% aussehen
Drei Neunen zu erreichen ist unkompliziert:
- Redundante Server in einem einzelnen Rechenzentrum (Active-Passive)
- Automatisches Failover für Datenbanken und Speicher
- Regelmäßige Backups mit getesteten Wiederherstellungsprozeduren
- Monitoring und Alerting während der Geschäftszeiten mit On-Call für kritische Probleme
- Geplante Wartungsfenster während schwacher Nutzungszeiten
Jährliche Kosten: Typischerweise 1,5-2x eines nicht-redundanten Setups, nicht 5-10x.
Die Wartungsfenster-Strategie
Geplante Ausfallzeiten sind kein Versagen. Sie sind verantwortungsvoller Betrieb. Ein 4-stündiges Wartungsfenster um 3 Uhr morgens am Sonntag betrifft praktisch keine Kunden, ermöglicht aber:
- Sicherheitspatches und Updates
- Datenbankmigrationen und -optimierungen
- Infrastruktur-Upgrades
- Performance-Optimierung
Die Rechnung: 12 Wartungsfenster à 4 Stunden = 48 Stunden geplanter Ausfall. Das sind 99,45% Verfügbarkeit. Wenn diese Fenster zu Zeiten mit unter 1% der Spitzenlast liegen, ist der Geschäftseinfluss vernachlässigbar.
Messen, was zählt
SLA vs. SLO vs. SLI
Bevor Sie Verfügbarkeitsziele festlegen, verstehen Sie die Terminologie:
- SLI (Service Level Indicator): Die Kennzahl, die Sie messen (z. B. erfolgreiche Anfragen / Gesamtanfragen)
- SLO (Service Level Objective): Ihr Ziel für diese Kennzahl (z. B. 99,9% erfolgreiche Anfragen)
- SLA (Service Level Agreement): Die vertragliche Konsequenz bei Verfehlen des Ziels (z. B. Servicegutschriften)
Viele Organisationen definieren SLAs, ohne SLIs zu messen oder sinnvolle SLOs festzulegen. Das Ergebnis ist ein Vertrag ohne operative Realität.
Fehlerbudgets: Der moderne Ansatz
Statt Verfügbarkeit als binäres Ziel zu behandeln, nutzen Sie Fehlerbudgets:
- Budget berechnen: 99,9% Verfügbarkeit = 8,7 Stunden Ausfallbudget pro Jahr
- Verbrauch verfolgen: Jeder Vorfall reduziert Ihr Budget
- Abwägungen treffen: Wenn Sie bis Juni 6 Stunden Budget verbraucht haben, können Sie:
- Höheres Risiko für den Rest des Jahres akzeptieren
- Feature-Geschwindigkeit reduzieren, um Zuverlässigkeit zu verbessern
- In Infrastruktur investieren, um das Budget zu erweitern
Fehlerbudgets machen Zuverlässigkeit zu einer Geschäftsentscheidung, nicht zu einem Glaubenskrieg zwischen „schnell voran" und „nichts kaputt machen".
Ehrliche Kennzahlen
Was Sie messen, ist genauso wichtig wie das, was Sie anstreben:
| Kennzahl | Was sie verbirgt | Was sie offenbart |
|---|---|---|
| Server-Uptime | Anwendungsfehler, Netzwerkprobleme | Infrastruktur-Stabilität |
| Anfrage-Erfolgsrate | Langsame Antworten, beeinträchtigte Funktionen | Nutzerorientierte Verfügbarkeit |
| User-Session-Abschluss | Nichts, das ist der Goldstandard | End-to-End-Zuverlässigkeit |
Messen Sie aus der Perspektive des Nutzers. Ein Server, der „läuft" aber Fehler zurückgibt, ist nicht verfügbar.
Zuverlässigkeit als Geschäftsentscheidung
Fünf Neunen sind kein Qualitätsmerkmal. Es ist eine Geschäftsentscheidung mit quantifizierbaren Kosten und Nutzen. Bevor Sie in maximale Verfügbarkeit investieren:
- Berechnen Sie Ihre tatsächlichen Ausfallkosten pro Stunde
- Ordnen Sie Verfügbarkeitsstufen dem Geschäftseinfluss zu
- Wählen Sie das richtige Ziel basierend auf ROI, nicht Marketing
- Messen Sie aus Nutzerperspektive
- Nutzen Sie Fehlerbudgets für fundierte Abwägungen
Für die meisten Unternehmen bieten drei Neunen (99,9%) mit strategischen Wartungsfenstern das optimale Verhältnis von Zuverlässigkeit und Kosten. Vier Neunen (99,99%) sind angemessen für kundenorientierte Anwendungen, bei denen Ausfallzeiten direkt den Umsatz beeinträchtigen. Fünf Neunen sollten Systemen vorbehalten sein, bei denen Verfügbarkeit wirklich missionkritisch ist.
Zahlen Sie nicht für Zuverlässigkeit, die Sie nicht brauchen. Investieren Sie in die Verfügbarkeit, die Ihr Unternehmen tatsächlich benötigt, und nicht mehr.
Unsicher, welche Verfügbarkeitsstufe Ihre Systeme benötigen? Kontaktieren Sie uns für eine Zuverlässigkeitsanalyse, die Infrastruktur auf Geschäftseinfluss abstimmt.