3 buckets = Query / Infra / Storage
MapReduce(2004) 계열이 여전히 다수.
현실: 시간·비용 대부분이 insight가 아니라 머신 돌봄(care & feeding) 에 들어감
(프로비저닝, 튜닝, 모니터링, 성능 관리, 데이터 핸들링).
Colo: 내 장비를 남의 IDC에 놓음 (소유·운영은 여전).
Virtualization (IaaS): API로 VM 자동화, CapEx → OpEx. Still user-managed infra.
Fully managed / serverless: 서비스가 인프라 자동 프로비저닝·컨피그.
Dev는 머신 단위 생각 X → 서비스 단위에 집중.
필요 시 150 machines ↔ 1 machine의 동일 작업량을 시간-병렬성으로 트레이드오프.
(1TB를 1초 vs 150초 느낌)
유휴 자원 비용 On-prem은 고정비, Cloud는 elastic + 종량제(pay-as-you-go).