<aside> ๐ ๐ ๋ชฉ์ฐจ
1๏ธโฃ ํต์ฌ ์์ด๋์ด - Word2Vec์ ๊ธฐ๋ณธ ๊ฐ๋ 2๏ธโฃ ๊ธฐ์กด ๋ฐฉ์์ ๋ฌธ์ - ์ ๋ฑ์ฅํ๋? 3๏ธโฃ Word2Vec์ ํ์ - ๋ฌด์์ด ๋ค๋ฅธ๊ฐ? 4๏ธโฃ ๋ ๊ฐ์ง ํ์ต ๋ฐฉ๋ฒ - CBOW vs Skip-gram 5๏ธโฃ ๋ฒกํฐ ์ฐ์ฐ์ ๋ง๋ฒ - ๋๋ผ์ด ๊ฒฐ๊ณผ 6๏ธโฃ ์คํ ๊ฒฐ๊ณผ - ์ฑ๋ฅ ๋น๊ต 7๏ธโฃ ์์ ์ค๋ช - ๊ธฐ์ ์ ๋ด์ฉ 8๏ธโฃ ๊ณ์ธต์ ์ํํธ๋งฅ์ค - ํต์ฌ ๊ธฐ์ 9๏ธโฃ ์ํฅ๊ณผ ์์ - ์ญ์ฌ์ ์ค์์ฑ ๐ ์ค์ฉ์ ๊ฐ์ด๋ - ์ด๋ป๊ฒ ์ฌ์ฉํ ๊น? ๐ ๊ฒฐ๋ก - ํต์ฌ ๋ด์ฉ ์์ฝ
</aside>
<aside> ๐ ๐ ๋ ผ๋ฌธ ์ ๋ณด ์ ์: Tomas Mikolov, Kai Chen, Greg Corrado, Jeffrey Dean (Google Inc.) ๋ฐํ: 2013๋
</aside>
"๋น์ทํ ๋ฌธ๋งฅ์์ ์ฌ์ฉ๋๋ ๋จ์ด๋ค์ ๋น์ทํ ์๋ฏธ๋ฅผ ๊ฐ์ง๋ค"
์ด ๊ฐ๋จํ ์์ด๋์ด๋ก ์ปดํจํฐ๊ฐ ๋จ์ด์ ์๋ฏธ๋ฅผ ์ดํดํ ์ ์๊ฒ ๋์์ต๋๋ค.
<aside> ๐ฏ CBOW (Continuous Bag-of-Words)
</aside>
์ฃผ๋ณ ๋จ์ด๋ค์ ๋ณด๊ณ ๊ฐ์ด๋ฐ ๋จ์ด๋ฅผ ๋ง์ถ๋ ๋ฐฉ์
์์: "๋๋ ___ ์ ์ข์ํ๋ค"
ํน์ง:
<aside> ๐ฏ Skip-gram
</aside>
๊ฐ์ด๋ฐ ๋จ์ด๋ฅผ ๋ณด๊ณ ์ฃผ๋ณ ๋จ์ด๋ค์ ๋ง์ถ๋ ๋ฐฉ์
์์: "์ฌ๊ณผ"๊ฐ ์ฃผ์ด์ก์ ๋
ํน์ง:
<aside> โจ ๐ฎ ๋๋ผ์ด ๋ฐ๊ฒฌ ๋จ์ด๋ค ์ฌ์ด์ ๊ด๊ณ๊ฐ ๋ฒกํฐ์ ๋ง์ ๊ณผ ๋บ์ ์ผ๋ก ํํ๋๋ค!
</aside>
๋ชจ๋ธ | ์๋ฏธ์ ์ ํ๋ | ๋ฌธ๋ฒ์ ์ ํ๋ | ์ ์ฒด ์ ํ๋ |
---|---|---|---|
๊ธฐ์กด RNN | 9% | 36% | 24.6% |
๊ธฐ์กด NNLM | 23% | 53% | 50.8% |
CBOW | 24% | 64% | 63.7% |
Skip-gram | 55% | 59% | 65.6% |
<aside> ๐ โก ์ฑ๋ฅ์ ํ๋ช ๊ธฐ์กด RNN: 8์ฃผ (1๊ฐ CPU) Word2Vec: 1์ผ ๋ฏธ๋ง
16์ต ๊ฐ์ ๋จ์ด๋ก ์ด๋ฃจ์ด์ง ๋์ฉ๋ ๋ฐ์ดํฐ์์ ํ๋ฃจ ๋ง์ ๊ณ ํ์ง ๋จ์ด ๋ฒกํฐ ํ์ต!
</aside>