Architecture systèmeResponsable technique

Comment le SLA (Service Level Agreement) est-il conçu au niveau de l'architecture informatique et quelles métriques doivent être prises en compte ?

Réussissez les entretiens avec l'assistant IA Hintsage

Réponse.

La conception du SLA (Accord de Niveau de Service) dans l'architecture système consiste à établir des indicateurs de qualité de service contrôlables, mesurables et surveillables. Au stade de la conception architecturale, les paramètres clés du SLA ainsi que les mécanismes techniques pour leur mesure sont définis.

Étapes de base :

  1. Déterminer les métriques critiques pour l'entreprise : temps de réponse, disponibilité, pourcentage d'erreurs, temps de récupération.
  2. L'architecture comprend des outils de surveillance pour la collecte automatique de ces métriques.
  3. Le SLA est convenu avec le client, et les résultats servent de base à la mise en place de la surveillance et des alertes.

Exemple de définition d'un SLA pour un service web :

  • Disponibilité : 99,9% (temps d'arrêt ne dépassant pas 43 minutes par mois)
  • Temps de réponse de l'API : ne dépassant pas 200 ms dans 95% des requêtes
  • Taux d'erreurs : ne dépassant pas 0,5%

Caractéristiques clés :

  • Le SLA influence non seulement l'architecture technique, mais aussi les processus d'exploitation et de support.
  • Le SLA est souvent documenté dans des spécifications et des contrats.
  • La surveillance automatique, les alertes, et les rapports permettent de fixer de manière fiable le respect du SLA.

Questions pièges.

Peut-on établir un SLA uniquement sur des métriques techniques (par exemple, erreurs et temps de réponse) ?

Réponse : Faux. Il est nécessaire de prendre en compte aussi des métriques commerciales (par exemple, le succès des opérations commerciales effectuées) afin que le SLA corresponde aux attentes de l'entreprise.


Atteindre le SLA est-il un processus statique qui ne nécessite pas de corrections après le lancement du système ?

Réponse : Non. Le SLA est révisé avec les changements dans les affaires, l'augmentation de la charge et l'apparition de nouvelles exigences.


La surveillance du SLA peut-elle être basées uniquement sur les résultats de systèmes externes (ping, vérification http) sans agents à l'intérieur des services ?

Réponse : Non recommandé. La surveillance externe est importante, mais la collecte interne (agents récoltant des métriques internes) permet de détecter les problèmes cachés avant qu'ils ne deviennent visibles de l'extérieur.