1) Sinusoidal embeddings

위치 정보를 학습하지 말고, 수식으로 고정해서 넣자

image.png

image.png

image.png

image.png

전체 positional embedding은 2차원짜리 한 쌍이 아니라, i=0..(d/2-1)까지 여러 주파수 ωᵢ를 가진 sin/cos 쌍들을 쭉 이어붙인 벡터이다.

그래서 PE_m과 PE_n의 내적은 → 각 주파수 쌍의 내적들이 합쳐진 형태가 된다.