20분 분량의 완성도 높은 발표 대본을 준비했습니다. 발표의 흐름이 끊기지 않도록 내용의 강약을 조절했으며, 특히 요청하신 '역동기화(Failback)'의 개선점 부분은 심사위원들에게 깊은 인상을 줄 수 있도록 현업 엔지니어의 시각을 담아 힘을 실어 작성했습니다.


🎙️ 삼시세끼 팀 심화프로젝트 발표 대본 (20분 분량)

[오프닝 & 팀/목차 소개 (Page 1~3)]

"안녕하십니까, 심화프로젝트 3조 삼시세끼 팀의 발표를 맡은 김경한입니다.

오늘 저희가 준비한 발표는 하이브리드 클라우드 환경에서의 DR, 즉 재해 복구 아키텍처에 관한 이야기입니다. 발표는 저희가 왜 이 주제를 선정했는지 배경을 먼저 설명해 드리고, 저희가 설계한 아키텍처의 평상시와 재해 발생 시의 네트워크 흐름을 비교해 보여드릴 예정입니다. 이어서 4가지 핵심 기능과 이를 구현하며 마주했던 트러블슈팅 경험을 공유하고, 마지막으로 결론과 향후 개선 과제를 말씀드리며 마무리하겠습니다.

저희 팀은 AWS 인프라 구축, 온프레미스 환경 구성, CI/CD 자동화, 그리고 통합 모니터링 등 각자의 전문 영역을 세분화하여 이번 프로젝트를 성공적으로 완성했습니다."


[문제 정의 및 주제 선정 (Page 4~5)]

"최근 IT 업계에서는 DR의 중요성이 그 어느 때보다 대두되고 있습니다. 2022년 카카오 판교 데이터센터 화재나 작년 행정안전부 국가정보자원관리원 마비 사태를 모두 기억하실 겁니다. 이 사건들은 단일 데이터센터에만 의존하는 아키텍처가 화재나 재해를 만났을 때, 전국적인 서비스 장애와 돌이킬 수 없는 신뢰도 추락으로 이어진다는 뼈아픈 한계를 보여주었습니다.

그렇다면 장애를 막기 위해 퍼블릭 클라우드에 똑같은 크기의 Active-Active 인프라를 구축하면 어떨까요? 안전하겠지만, 막대한 유지 비용 탓에 적자가 심해질 것입니다.

그래서 저희 팀은 **'기존 온프레미스 장비를 최대한 활용하면서, 클라우드 비용을 최적화할 수 있는 안전한 방법은 없을까?'**를 고민했습니다. 그 해답으로, 평상시에는 온프레미스를 메인(Active)으로 사용하고, 재해 발생 시에만 대기 중이던 AWS(Standby) 환경으로 전환하는 'Warm Standby 기반 하이브리드 클라우드 인프라'를 이번 프로젝트의 핵심 솔루션으로 제안하게 되었습니다."


[아키텍처 구성도 흐름 (Page 6~10)]

"저희가 설계한 아키텍처의 전체적인 흐름을 보시겠습니다.

평상시의 흐름입니다. 사용자 트래픽은 AWS Route 53을 거쳐 온프레미스 K8s 클러스터로 유입되어 정상적인 서비스를 제공합니다. 반대편에 있는 AWS EKS 환경은 트래픽을 받지 않고 최소한의 파드만 유지한 채 대기(Warm Standby) 상태를 유지합니다. 하지만 뒤에서는 Tailscale VPN 보안망을 통해 온프레미스의 MySQL 데이터와 NFS 파일 스토리지가 AWS의 RDS와 EFS로 실시간으로 쉴 새 없이 동기화되고 있습니다.

**만약 온프레미스에 화재가 발생하면 어떻게 될까요? (재해 발생 흐름)**Route 53이 온프레미스 서버의 응답 불량(장애)을 즉시 감지하고, 유저 트래픽의 방향을 AWS EKS 쪽으로 완전히 틀어버립니다(Failover). 그동안 잠들어 있던 AWS의 HPA와 Karpenter가 유입되는 트래픽을 감지하고, 단 1~2분 만에 파드와 워커 노드를 최대치로 무섭게 확장시킵니다. 그리고 평소 동기화해 두었던 RDS 데이터를 Primary로 승격시켜, 사용자는 단 1초의 데이터 유실 없이 서비스를 계속 이용하게 됩니다."

(11페이지 일정표, 12페이지 기술 스택 화면에서는 가볍게 환기합니다)"본 프로젝트는 약 5주간 진행되었으며, On-Premise 인프라 구축을 시작으로 AWS 연동, 모니터링, 최종 DR 테스트까지 체계적으로 수행했습니다. 시스템 구현을 위해 K8s, EKS, ArgoCD, Tailscale, Terraform 등 현업에서 요구하는 최신 클라우드 네이티브 기술 스택을 종합적으로 활용했습니다."


[핵심 기능 4가지 (Page 13~17)]