1. Pretraining

스크린샷 2026-01-08 오후 3.20.34.png

스크린샷 2026-01-08 오후 3.21.28.png

엄청난 양의 데이터를 이용해서 LLM이 다음 토큰을 예측하도록 학습시키는 것

모델이 쓰여진 모든 것을 훈련시키는 과정

스크린샷 2026-01-08 오후 3.22.54.png

목표는 다음 토큰을 예측하는 것

스크린샷 2026-01-08 오후 3.23.42.png

데이터셋 - 인터넷에서 구할 수 있는 모든 것

2. FLOPs, FLOPS

모델에 필요한 연산량 얘기 나올 때 이 표기법이 사용됨

스크린샷 2026-01-08 오후 3.27.37.png

FLOPs - 부동소수점 연산 (컴퓨팅 단위 - FLOPs 수치가 높을 수록 관련된 연산량이 많아짐)

스크린샷 2026-01-08 오후 3.27.54.png