CBOW가 뒤집어진 모델

벡터의 평균을 구하는 과정이 없다.

CBOW보다 성능이 좋다고 알려져있다.

학습 과정의 Loss가 더 낮은 것이 아니라 임베딩 벡터의 표현력이 더 좋다는 의미.