架构 (IT)技术负责人

如何在IT架构层面设计SLA(服务水平协议),需要考虑哪些指标?

用 Hintsage AI 助手通过面试

答案。

在系统架构中设计SLA(服务水平协议)是设定可控、可测量和可监控的服务质量指标。在架构设计阶段,确定SLA的关键参数以及测量这些参数的技术机制。

基本步骤:

  1. 确定业务关键指标:响应时间、可用性、错误率、恢复时间。
  2. 架构包含监控工具,用于自动收集这些指标。
  3. SLA与客户达成一致,结果是监控和警报的基础。

例如,为Web服务确定SLA:

  • 可用性:99.9%(每月停机时间不超过43分钟)
  • API响应时间:95%的请求不超过200ms
  • 错误率:不超过0.5%

关键特点:

  • SLA不仅影响技术架构,也影响运营和支持流程。
  • SLA通常在规范和合同中进行文档记录。
  • 自动监控、警报、报告能够准确记录SLA的执行情况。

有陷阱的问题。

是否可以仅基于技术指标(例如错误和响应)构建SLA?

答案:错误。还必须考虑业务指标(例如,成功完成的业务操作),以使SLA符合业务期望。


达到SLA是否是一个静态过程,并且在系统启动后不需要调整?

答案:不是。SLA会随着业务变化、负载增加和新要求的出现而进行审查。


SLA的监控是否可以仅基于外部系统的结果(ping,http检查),而不需要服务内部的代理?

答案:不推荐。外部监控重要,但内部收集(收集内部指标的代理)能够在问题变得明显之前,及早发现隐藏的问题。