๐Ÿง  Paper Summary

๐Ÿ” 1. ์—ฐ๊ตฌ ๋ชฉ์  (Motivation)


โš™๏ธ 2. ์ฃผ์š” ๊ธฐ์—ฌ (Contributions)


๐Ÿงฉ 3. ๋ชจ๋ธ ๊ตฌ์กฐ / ๋ฐฉ๋ฒ•๋ก  (Method)

๐Ÿ“ ์ „์ฒด ๊ตฌ์กฐ

โš™๏ธ ํ•ต์‹ฌ ๊ตฌ์„ฑ ์š”์†Œ

(1) Scaled Dot-Product Attention

$$ Attention(Q,K,V)=softmax(dkQKT)V $$