Embeddingとは? 一言でいうと…

人間は「りんご」と「みかん」が果物仲間で、「りんご」と「パソコン」は全然違うものだと、感覚的に分かります。しかし、コンピュータは文字をただの記号としてしか認識できません。

そこで、言葉の意味的な近さや遠さを、コンピュータが計算できる「数字の羅列(座標や住所のようなもの)」に変換する。この魔法のような技術がEmbeddingです。


「巨大な図書館」でイメージしてみよう

Embeddingを理解するために、言葉の世界を一つの巨大な図書館だと想像してみてください。

ステップ1: 言葉がバラバラに置かれている(Embeddingがない状態)

ステップ2: 凄腕の司書さんが登場する(これがEmbeddingモデル)

ステップ3: 言葉が意味の近い場所に整理される(Embeddingされた状態)

この「図書館のどこに置かれたか」という場所の情報(例:「3階の動物コーナー、B-2の棚」)が、コンピュータが扱える**数字の住所(ベクトル)**にあたります。

Embeddingとは、この司書さんが言葉を意味の近い場所に整理整頓していく作業そのものを指します。


Embeddingで何が嬉しいの?

言葉に「意味の住所」を割り振れると、AIは以下のような賢いことができるようになります。