Arquitectura (IT)Líder Técnico

¿Cómo se diseña un SLA (Acuerdo de Nivel de Servicio) a nivel de arquitectura de TI y qué métricas se deben considerar?

Supere entrevistas con el asistente de IA Hintsage

Respuesta.

El diseño del SLA (Acuerdo de Nivel de Servicio) en la arquitectura del sistema es la asignación de indicadores de calidad del trabajo de los servicios que sean controlables, medibles y monitorizables. En la etapa de diseño arquitectónico se determinan los parámetros clave del SLA, así como los mecanismos técnicos para su medición.

Pasos básicos:

  1. Se determinan las métricas críticas para el negocio: tiempo de respuesta, disponibilidad, porcentaje de errores, tiempo de recuperación.
  2. La arquitectura incluye herramientas de monitoreo para la recolección automática de estas métricas.
  3. El SLA se acuerda con el cliente, y los resultados son la base para construir el monitoreo y las alertas.

Ejemplo de definición del SLA para un servicio web:

  • Disponibilidad: 99.9% (tiempo de inactividad no superior a 43 minutos al mes)
  • Tiempo de respuesta de API: no más de 200ms en el 95% de las solicitudes
  • Nivel de errores: no más de 0.5%

Características clave:

  • El SLA afecta no solo a la arquitectura técnica, sino también a los procesos de operación y soporte.
  • El SLA a menudo se documenta en especificaciones y contratos.
  • El monitoreo automático, las alertas y los informes permiten registrar de manera confiable el cumplimiento del SLA.

Preguntas capciosas.

¿Se puede construir un SLA solo con métricas técnicas (por ejemplo, errores y respuesta)?

Respuesta: Incorrecto. También es necesario considerar métricas de negocio (por ejemplo, el éxito de las operaciones comerciales realizadas) para que el SLA cumpla con las expectativas del negocio.


¿Es el cumplimiento del SLA un proceso estático y no requiere ajustes después del lanzamiento del sistema?

Respuesta: No. El SLA se revisa con cambios en el negocio, aumento de carga y aparición de nuevos requerimientos.


¿Puede el monitoreo del SLA basarse únicamente en los resultados de sistemas externos (ping, http-check) sin agentes dentro de los servicios?

Respuesta: No se recomienda. El monitoreo externo es importante, pero la recolección interna (agentes que recopilan métricas internas) permite detectar problemas ocultos antes de que se vuelvan evidentes externamente.