Analisi di sistemaResponsabile tecnico

Come viene progettato l'SLA (Service Level Agreement) a livello di architettura IT e quali metriche è necessario considerare?

Supera i colloqui con l'assistente IA Hintsage

Risposta.

La progettazione dell'SLA (Accordo sul livello di servizio) nell'architettura del sistema è l'assegnazione di indicatori di qualità del servizio controllabili, misurabili e monitorabili. Nella fase di progettazione architettonica, vengono definiti i parametri chiave dell'SLA e i meccanismi tecnici per la loro misurazione.

Passaggi fondamentali:

  1. Si definiscono metriche business-critical: tempo di risposta, disponibilità, percentuale di errori, tempo di ripristino.
  2. L'architettura include strumenti di monitoraggio per la raccolta automatica di queste metriche.
  3. L'SLA viene concordato con il cliente, i risultati diventano la base per la costruzione del monitoraggio e degli avvisi.

Esempio di definizione dell'SLA per un servizio web:

  • Disponibilità: 99.9% (downtime non superiore a 43 minuti al mese)
  • Tempo di risposta API: non oltre 200 ms nel 95% delle richieste
  • Livello di errori: non oltre 0.5%

Caratteristiche chiave:

  • L'SLA influisce non solo sull'architettura tecnica, ma anche sui processi di operatività e supporto.
  • L'SLA è spesso documentato in specifiche e contratti.
  • Il monitoraggio automatico, gli avvisi, i report consentono di registrare con precisione il rispetto dell'SLA.

Domande trabocchetto.

È possibile costruire l'SLA solo su metriche tecniche (ad esempio, errori e tempo di risposta)?

Risposta: Errato. È necessario considerare anche metriche di business (ad esempio, il successo delle operazioni aziendali effettuate) affinché l'SLA soddisfi le aspettative del business.


Il raggiungimento dell'SLA è un processo statico e non richiede aggiustamenti dopo il lancio del sistema?

Risposta: No. L'SLA viene rivisto con il cambiamento del business, l'aumento del carico e l'emergere di nuove esigenze.


Il monitoraggio dell'SLA può basarsi solo sui risultati di sistemi esterni (ping, http-check) senza agenti all'interno dei servizi?

Risposta: Non raccomandato. Il monitoraggio esterno è importante, ma la raccolta interna (agenti che raccolgono metriche interne) consente di scoprire problemi nascosti prima che diventino evidenti dall'esterno.