[정현석. 1~4p 중간까지]
번거로운 운영 복잡도로 인해 관리가 쉽지 않다.
맵리듀스같은 경우 많은 양의 setup 코드가 필요했으며, failure 대응 또한 불안정하다.
작업(job)이 각 태스크(task)로 나누어져 데이터 처리를 할 경우, 중간 과정(예를 들어 map(), shuffle()…)의 데이터를 로컬 디스크에 써야 했는데 반복적인 I/O 수행은 비효율적이다.

하둡은 머신러닝이나 스트리밍, SQL 질의 등 다른 워크로드와 연계에 대한 한계가 존재한다.
[백지연. 4p 중간부터 8p 중간까지]