Carefully chosen monitoring metric reflecting user experience (UX에 linear하게 가까운 지표).
보통 ratio로 정의:
SLI = good events / all valid events
예) 성공 응답 수 / 전체 요청 수, 200ms 이하 응답 / 전체 요청 등.
SLA: “Billing system error rate < 0.3%.”
여기서 SLI = error rate metric, SLO = 0.3% target, 전체 문장이 SLA.
(Maintain error rate [SLI] < 0.3% [SLO]) [SLA]
Error Budget = 1 - SLO
예) “90% of requests ≤ 200ms” → EB = 10%. 예산 소진이 예측되면 Alert!