간단한 예시와 함께해요 : )
: 단어를 벡터로 표현하는 것
→ 왜 벡터로 표현하는가?
→ 단어 간의 거리를 표현할 수 있고, 이를 통해 여러가지 분석방식을 사용할 수 있음
(1) 희소 표현 : 원-핫 벡터와 같이 [0 0 1 0 0 0 ··· 0 0 0 0] 으로 표현하는 방식
Ex)
"나는 회색 고양이를 검정색 보다 좋아한다" 라는 문장
이렇게 표현하는 방식을 희소 표현이라고 한다
(2) 밀집 표현 : 원-핫 벡터의 높은 차원을 사용자가 원하는 차원으로 맞추어 표현하는 방식
Ex)
"나는 회색 고양이를 좋아한다" 라는 문장에서
'고양이'의 원-핫 벡터는 [0 0 1 0 0 0 0] 이다 → 7차원