1. 인프라 자원 및 가동 상태
- 첫 번째 줄 (CPU 및 온프레 상태)
- (왼쪽) CPU 사용량 패널 3개: 온프레 마스터, 워커1, 워커2 실시간 그래프
- (오른쪽) 온프레미스 통합 상태창: 정상 시 초록불 / 다운 시 빨간불 (Status Indicator)
- 두 번째 줄 (메모리 및 AWS 상태)
- (왼쪽) 메모리 사용량 패널 3개: 온프레 마스터, 워커1, 워커2 실시간 그래프
- (오른쪽) AWS Standby 상태창: 대기 시 빨간불(또는 주황) / 서비스 전환 시 초록불
2. AWS EKS 전용 관제
- HPA & Karpenter 지표: EKS HPA가 실행 중인 파드 개수 + Karpenter가 동적으로 생성한 노드 개수 (오토스케일링 확인용)
3. 스토리지 및 데이터 동기화 (RPO 중심)
- 파일 동기화 (NFS -> EFS): rsync 프로세스 작동 여부 및 실패 파일 개수 모니터링
- DB 동기화 (MySQL -> RDS): Replication Lag (동기화 지연 시간) 시각화
- 디스크 성능: 워커1(NFS)과 워커2(MySQL)의 실시간 Disk I/O (Read/Write)
- 볼륨 잔여량: NFS 볼륨(PV/PVC) 사용률 (%)
4. 서비스 및 DR 성과 지표
- MySQL 기본 지표: 초당 쿼리 수 (QPS) 및 활성 커넥션 수 (성능 튜닝 지표 제외)
- K8s 파드 상태: Running / Failed 파드 개수 (CrashLoopBackOff 실시간 감지)
- RTO (복구 시간): 장애 발생 후 AWS로 서비스가 정상 전환되기까지 걸린 실제 시간