간단한 예시와 함께해요 : )

1. 워드 임베딩(Word Embedding) 기본 개념

: 단어를 벡터로 표현하는 것

→ 왜 벡터로 표현하는가?

→ 단어 간의 거리를 표현할 수 있고, 이를 통해 여러가지 분석방식을 사용할 수 있음

(1) 희소 표현 : 원-핫 벡터와 같이 [0 0 1 0 0 0 ··· 0 0 0 0] 으로 표현하는 방식

Ex)

"나는 회색 고양이를 검정색 보다 좋아한다" 라는 문장

이렇게 표현하는 방식을 희소 표현이라고 한다

(2) 밀집 표현 : 원-핫 벡터의 높은 차원을 사용자가 원하는 차원으로 맞추어 표현하는 방식

Ex)

"나는 회색 고양이를 좋아한다" 라는 문장에서

'고양이'의 원-핫 벡터는 [0 0 1 0 0 0 0] 이다 → 7차원