<aside> ๐ฅ
Agent์ ๋ ๋ถ๋ถ์ ๋ด๋นํ๋ LLM ๋ชจ๋ธ์ ๋ํด์ ์ข๋ ์์๋ด ์๋ค.
</aside>
LLM์ ์ด๋ฏธ ์๋ ์ฌ๋๋ค๋ ๋ง๊ณ ๋ชจ๋ ๊ฒ๋ค์ ์ด ์ฅ์ ๋ค ๋ด์ ์ ์๊ธฐ ๋๋ฌธ์ ์์ธํ ์๊ณ ์ถ์ผ์๋ค๋ฉด https://huggingface.co/learn/nlp-course/chapter1/1๋ฅผ ์ฐธ๊ณ ํด์ฃผ์๊ธธ ๋ฐ๋๋๋ค!
LLM์ ์ฌ๋์ ์ธ์ด๋ฅผ ์ดํดํ๊ณ ๋งํ ์ ์๋ AI model์ ํ ์ข ๋ฅ์ ๋๋ค. Large๊ฐ ๋ถ์ ๋งํผ, ๋๊ท๋ชจ์ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ํ์ตํ์ฌ ์ธ์ด์ ํจํด, ๊ตฌ์กฐ, ์ฌ์ง์ด๋ ๋์์ค๊น์ง ํ์ตํ ๋ชจ๋ธ์ ๋๋ค. ์ด๋ฌํ ๋ชจ๋ธ์ ์์ต์์ ํ๋ผ๋ฏธํฐ(parameters)๋ก ๊ตฌ์ฑ์ด ๋์ด ์์ต๋๋ค.
๋๋ถ๋ถ์ LLM์ Transformer architecture ๊ตฌ์กฐ๋ฅผ ๋ฐ๋ฅด๊ณ ์์ต๋๋ค. ํนํ, Transformer๋ Attention ์ด๋ผ๋ ์๊ณ ๋ฆฌ์ฆ์ ๊ธฐ๋ฐ์ผ๋ก ๊ตฌ์ฑ๋์ด ์๊ณ , 2018๋ ๊ตฌ๊ธ์์ ๋ฐํํ BERT ๋ ผ๋ฌธ์์ ํนํ ๊ฐ๊ด๋ฐ์์ต๋๋ค.
Transformer Architecture (์ถ์ฒ : โฃ)
Transformer์ ํฌ๊ฒ 2๊ฐ์ง ๋ชจ๋๋ก ๋๋ฉ๋๋ค.
๋๊ฐ์ง ๋ชจ๋์ ์ด๋ป๊ฒ ์ฌ์ฉํ๋๋์ ๋ฐ๋ผ 3๊ฐ์ง๋ก ๋๋ ์ ์์ต๋๋ค.
<aside> โ ๏ธ
์ฃผ์ํ ์ ์ ๊ฐ task๊ฐ ๋ช ํํ ๋๋์ด์ ธ ์๋ ๊ฒ์ด ์๋๋๋ค. ์๋ฅผ ๋ค์ด, encoder-decoder ๋ชจ๋ธ์ด Translation์ ํ๋ค๊ณ ํด์ only-decoder ๋ชจ๋ธ์ด Translation์ ๋ชปํ๋ ๊ฒ์ด ์๋๋๋ค(์คํ๋ ค decoder ๋ชจ๋ธ์ธ LLM์ด ํจ์ฌ ์ํฉ๋๋ค).
</aside>
LLM์ only-decoder ๋ชจ๋ธ์ base๋ก ํ๊ณ ์์ต๋๋ค. only-decoder ๋ชจ๋ธ์ ๋๊ท๋ชจ์ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ํ์ต์ํจ ๊ฒ์ด LLM์ ๋๋ค.
๋ํ์ ์ธ LLM ๋ชจ๋ธ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
Model | Provider |
---|---|
Deepseek-R1 | DeepSeek |
GPT4 | OpenAI |
Llama 3 | Meta (Facebook AI Research) |
Gemma | |
Mistral | Mistral |
LLM์ only-decoder ๋ชจ๋ธ์ ๋๊ท๋ชจ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ํ์ตํ ๋ชจ๋ธ์ด๋ผ๊ณ ์์์ ์ธ๊ธํ์ต๋๋ค.
only-decoder ๋ชจ๋ธ์ ์ ๋ ฅ์ ์๋ฒ ๋ฉ ํน์ ํ ์คํธ๋ก ๋ฐ๊ณ ํ ์คํธ๋ฅผ ์ถ๋ ฅํ๋ค๊ณ ํ๋๋ฐ์. ์ด๋, LLM์ ์ ๋ ฅ์ ํ ์คํธ๋ก ๋ฐ๊ณ ํ ์คํธ๋ฅผ ์ถ๋ ฅํฉ๋๋ค. only-decoder ๋ชจ๋ธ์์ text๋ฅผ ์ถ๋ ฅํ๋ ๊ฒ์ **์์ฑ(generate)**ํ๋ค๊ณ ํํํฉ๋๋ค.
์ด์ LLM์ด ๊ตฌ์ฒด์ ์ผ๋ก ์ด๋ป๊ฒ ์์ฑํ๋์ง์ ๋ํด์ ์์ธํ ์์๋ด ๋๋ค.
LLM์ ๋ฌธ์ฅ์ ์์๊ณผ ๋์ ์ธ์ํ๊ธฐ ์ํด์ **ํน์ ํ ํฐ(special token)**์ ์ฌ์ฉํฉ๋๋ค. ์ฌ๊ธฐ์ ํ ํฐ์ ๋จ์ด๋ณด๋ค ๋ ์์ ๋จ์์ด๊ธด ํ์ง๋ง ์ดํด๋ฅผ ๋๊ธฐ ์ํด ๋จ์ด๋ผ๊ณ ํด๋ด ๋๋ค!
LLM ์ ๋ ฅ์ผ๋ก SOS Token์ ๋ฃ์ผ๋ฉด LLM์ด ๋ฌธ์ฅ์ ์์์ด๋ผ๋ ์๋ฏธ๋ฅผ ์ดํดํฉ๋๋ค. ๋ํ, EOS Token์ ์ ๋ ฅ์ผ๋ก ๋ฃ์ผ๋ฉด ๋ฌธ์ฅ์ ๋์ด๋ผ๋ ์๋ฏธ๋ฅผ ์ดํดํฉ๋๋ค.
๋ฐ๋๋ก, SOS Token์ ์์ฑํ๋ฉด LLM์ด ๋ฌธ์ฅ์ ์๋จ์ ๋์ฌ๋งํ ํ ํฐ๋ค์ ์์ฑํ๊ธฐ ์์ํฉ๋๋ค. ๋ํ, EOS Token์ ์์ฑํ๊ธฐ ์ง์ ๊น์ง๋ ๋ฌธ์ฅ์ ๋๋จ์ ๋์ฌ๋งํ ํ ํฐ๋ค์ ์์ฑํ๋ค๊ฐ EOS Token์ ์์ฑํ๋ฉด ์์ฑ์ ๋ฉ์ถ๊ฒ ๋ฉ๋๋ค.
๋ํ์ ์ธ ๋ชจ๋ธ๋ค์ EOS Token์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
Model | Provider | EOS Token | Functionality |
---|---|---|---|
GPT4 | OpenAI | `< | endoftext |
Llama 3.3 | Meta (Facebook AI Research) | `< | eot_of_text |
Deepseek-R1 | DeepSeek | `< | end_of_sentence |
Gemma | <end_of_turn> |
End of conversation turn |
์ด๋ฌํ EOS Token์ ๋ฌธ์ฅ์ ๋์ ์๋ฆฌ๊ธฐ ๋๋ฌธ์ ๋งค์ฐ ์ค์ํฉ๋๋ค! ์๊ทธ๋ฌ๋ฉด ๋ชจ๋ธ์ ๋ฌธ์ฅ์ ๋์ ๋ชจ๋ฅด๊ณ ๊ณ์ ํ ํฐ์ ์์ฑํ๊ธฐ ๋๋ฌธ์ ์๋ฌ๊ฐ ๋ฐ์ํ ์ ์์ต๋๋ค! ๊ทธ๋ฆฌ๊ณ ๊ฐ์ ํ์ฌ์์ ๋์จ ๋ชจ๋ธ๋ ๊ฐ ํ ํฐ์ ์ด๋ฆ์ด ๋ฌ๋ผ์ง ์ ์์ต๋๋ค!
decoder ๋ชจ๋ธ์ ์๊ธฐํ๊ท์ (autoregressive)์ธ ๋ชจ๋ธ์ ๋๋ค. ์๊ธฐํ๊ท๋ผ๋ ๋ง์ ์ด์ ์ ์ถ๋ ฅํ๋ ๊ฒฐ๊ณผ๋ฌผ์ ๋ค์ ์ ๋ ฅ์ผ๋ก ์ฌ์ฉํ๋ ๋ฐฉ์์ ์๋ฏธํฉ๋๋ค.
Autoregressive (์ถ์ฒ : โฃ)
์์ ๊ฐ์ ๋ฌดํ ๋ฐ๋ณต์ ์๊ธฐํ๊ท๋ผ๊ณ ํ๊ณ , ์ด ์๊ธฐํ๊ท๋ ๋ฌดํ์ ์ง์๋ฉ๋๋ค. ๊ฒฐ๊ตญ์ ์ด ๋ฌดํ ๋ฐ๋ณต์ ๋์ด์ค ๋ฌด์์ธ๊ฐ๊ฐ ํ์ํ๋ฐ, ๋์ด์ผํ ํ์ด๋ฐ์ ์๋ ค์ฃผ๋ ๊ฒ์ด [2.1. LLM์ special token](https://www.notion.so/2-1-LLM-special-token-1ba1806f5bc180a09da6ca1bb584e4ef)์์ ๋งํ๋ EOS Token์ ๋๋ค.
๋ฌธ์ฅ์ ์์ฑํ๋ ๋ฐฉ์์ 2.2. Next Token Prediction(NTP)์์ ๋งํ๋ ๊ฒ์ฒ๋ผ ์๊ธฐํ๊ท์ (Autoregressive) ๋ฐฉ์์ผ๋ก ์์ฑํฉ๋๋ค.
๊ทธ๋ ๋ค๋ฉด ํ๋์ ํ ํฐ์ ์์ฑํ๋ ๋ฐฉ์์ ์ด๋ค ๋ฐฉ์์ผ๋ก ์์ฑํ ๊น์? ์๊ธฐํ๊ท๋ฅผ ํตํด ์ฌ๋ฌ ํ ํฐ๋ค์ ์์ฑํ๋ ๊ฒ์ ์ดํดํ๋๋ฐ ํ๋์ ํ ํฐ์ ์์ฑํ๋ ๋ฐฉ์์ ๋ํด์๋ ์์ง ๋ช ํํ์ง ์์๊ฑฐ ๊ฐ์ต๋๋ค.
ํ๋์ ํ ํฐ์ ์์ฑํ๋ ๋ฐฉ์์ ํ๋ฅ ์ ์ธ ๋ฐฉ์์ ํตํด ์์ฑํฉ๋๋ค. LLM์ ์ฌ์ค ๋ฐ๋ก text์ ์์ฑํ๋ ๊ฒ์ด ์๋ ์ด๋ค logit๊ฐ์ ์์ฑํฉ๋๋ค. ๊ทธ logit ๊ฐ์ ์ด์ฉํด ํ๋ฅ ๊ฐ์ผ๋ก ๋ณํํ ํ, ๊ฐ์ฅ ๋์ ํ๋ฅ ์ token์ ์ฑํํ๋ ๋ฐฉ์์ผ๋ก ์งํ๋ฉ๋๋ค.
token prediction (์ถ์ฒ : โฃ)
์๋ฅผ ๋ค์ด, Paris is the city
๋ผ๋ ๋ฌธ์ฅ์ LLM์ ๋ฃ๋๋ค๊ณ ํด๋ด
์๋ค. ์๊ธฐํ๊ท์ ๋ฐฉ์์ด๊ธฐ ๋๋ฌธ์ Paris is the city
๋ค์์ ์ฌ ํ ํฐ์ ์์ฑํด์ผ ํฉ๋๋ค.
์ด๋ค ํ ํฐ์ ์์ฑํ ์ง LLM์ ๊ณ ๋ฏผํฉ๋๋ค. vocab์ด๋ผ๊ณ ํ๋ ๋จ์ด์ง ๋ด์์ logit ๊ฐ๋ค์ ์ป์ต๋๋ค. vocab์ ์์ญ๋ง์ ๋จ์ด๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.
์ด๋ฌํ Logit๊ฐ์ softmax๋ผ๊ณ ํ๋ ํจ์๋ฅผ ์ด์ฉํด ํ๋ฅ ๊ฐ์ผ๋ก ๋ณํํฉ๋๋ค.