Fine-Tuning이란?

RLHF

image.png

훈련 과정

  1. 초기 단계
  2. 인간 피드백
  3. 강화 학습

PEFT

정의

대표적인 기법