MLE를 통해 feature들의 분포를 모델링해두는 방법
새로운 데이터가 들어왔을 때, 확률이 가장 높은 class를 선택한다.
$$ \hat{y}=\arg \max _{y \in Y} P(y \mid x)=\operatorname{argmax} \frac{P(x \mid y) P(y)}{P(x)} $$
모델링이 된 이후엔, 분류가 빠르게 이루어진다.
이항분포를 확장한 것
세 가지 이상의 결과를 가지는 사건의 반복 시행에서 발생하는 확률분포
특성벡터가 이벤트의 빈도수를 나타낸다.
카운트 또는 카운트 비율을 나타내는 feature 에 가장 적합
데이터의 분포가 데이터의 중점으로부터 정규분포를 따른다고 가정한다.