CBOW가 뒤집어진 모델
벡터의 평균을 구하는 과정이 없다.
CBOW보다 성능이 좋다고 알려져있다.
학습 과정의 Loss가 더 낮은 것이 아니라 임베딩 벡터의 표현력이 더 좋다는 의미.
CBOW와 마찬가지로 Multi-Classification Model에 해당한다.