SystemarchitekturTechnischer Leiter

Wie wird SLA (Service Level Agreement) auf der Ebene der IT-Architektur entworfen und welche Metriken müssen berücksichtigt werden?

Bestehen Sie Vorstellungsgespräche mit dem Hintsage-KI-Assistenten

Antwort.

Die Gestaltung von SLA (Service Level Agreement) in der Systemarchitektur beinhaltet die Festlegung von kontrollierbaren, messbaren und überwachten Qualitätskennzahlen für die Dienstleistungen. In der architektonischen Planungsphase werden die Schlüsselparameter für das SLA sowie die technischen Maßnahmen zu deren Messung bestimmt.

Grundlegende Schritte:

  1. Geschäftskritische Metriken werden bestimmt: Reaktionszeit, Verfügbarkeit, Fehlerquote, Wiederherstellungszeit.
  2. Die Architektur umfasst Überwachungsinstrumente für die automatische Erfassung dieser Metriken.
  3. Das SLA wird mit dem Auftraggeber abgestimmt, die Ergebnisse bilden die Grundlage für den Aufbau von Monitoring und Alerts.

Beispiel für die Definition eines SLA für einen Webdienst:

  • Verfügbarkeit: 99,9% (Downtime nicht mehr als 43 Minuten pro Monat)
  • API-Reaktionszeit: nicht mehr als 200 ms bei 95% der Anfragen
  • Fehlerquote: nicht mehr als 0,5%

Wichtige Merkmale:

  • SLA beeinflusst nicht nur die technische Architektur, sondern auch die Betriebs- und Unterstützungsprozesse.
  • SLA wird häufig in Spezifikationen und Verträgen dokumentiert.
  • Automatisiertes Monitoring, Alerts und Berichte erlauben eine zuverlässige Dokumentation der Einhaltung des SLA.

Fangfragen.

Kann ein SLA nur auf technischen Metriken (z.B. Fehler und Reaktionszeit) basieren?

Antwort: Falsch. Es müssen auch Geschäftsmetriken (z.B. der Erfolg abgeschlossener Geschäftsoperationen) berücksichtigt werden, damit das SLA den Erwartungen des Unternehmens entspricht.


Ist das Erreichen eines SLA ein statischer Prozess, der nach dem Systemstart keine Anpassungen erfordert?

Antwort: Nein. Das SLA wird mit Änderungen im Geschäft, erhöhtem Aufwand und neuen Anforderungen überprüft.


Kann die Überwachung des SLA nur auf den Ergebnissen externer Systeme (Ping, HTTP-Check) basieren, ohne Agenten innerhalb der Dienste?

Antwort: Nicht empfohlen. Externes Monitoring ist wichtig, aber internes Gathering (Agenten, die interne Metriken sammeln) ermöglicht es, versteckte Probleme zu erkennen, bevor sie von außen sichtbar werden.