<aside> 💡

</aside>

🗄️ 왜 MySQL을 선택했나요?

AIRFLOW 파이프라인에서 처리되는 데이터는 정형적인 구조를 가지고 있기 때문에,

이를 안정적으로 관리할 수 있는 관계형 데이터베이스(RDS) 에 저장하는 것이 적절하다고 판단했습니다.

또한 프로젝트 내에서 수행하는 뉴스 크롤링 데이터 역시 일정한 스키마를 가진 정형 데이터로,

RDS 기반 관리가 효율적이라고 보았습니다.

그중에서도 MySQL을 사용한 이유는 다음과 같습니다:

💡 정리:

Airflow 파이프라인과 크롤링 데이터 모두 정형적 특성을 가지며,

검증된 안정성과 표준 호환성을 가진 MySQL

비용 효율적이면서도 안정적인 RDS 선택지라고 판단했습니다.

📰 OBA DB ERD

image.png

🗄️ 왜 AWS를 사용하나요?

☁️ 1. EC2 — 유연한 파이프라인 실행 환경

Airflow를 운영하기 위해 EC2 인스턴스(Ubuntu 기반 VM) 을 선택했습니다.

EC2는 Airflow Webserver, Scheduler, MySQL, Worker 등을 Docker Compose로 컨테이너화하여 배포할 수 있는 안정적인 환경을 제공합니다.