왜 서킷브레이커가 필요하다고 생각했을까?

실무에서 한창 운영 중에 이벤트나 프로모션 진행 시 반복적으로 마주한 문제 상황

서비스를 운영하며 다음과 같은 위험 패턴이 자주 발생했음.

일시적 장애 하나로도 전체가 영향을 받는 구조

이러한 상황은 단순한 일회성 에러라기보다,

작은 실패가 전체 시스템 흐름을 망가뜨리는 구조적 결함”처럼 느낌.

특정 백엔드 API 하나가 느려지거나 실패하면, 사용자에게는 전체 서비스가 느리거나 망가진 것처럼 보이게 됨.

트래픽 최적화를 위해 캐싱을 적용했지만, 구조적으로 한계가 예상.

API Gateway 레벨에서 endpoint별 캐싱을 적용했고,

일부 정적/모듈 응답 경로에서는 일정 수준의 성능 개선과 부하 완화 됬음.

하지만 시스템 구조상 다음과 같은 잠재적 한계가 분명히 존재함.