모집은 약 3주 정도 진행할 예정이며, 생각하는 인원수가 안 모일 경우 취소될 수 있습니다.

지원(이하 중 택1)

  1. kernel팀
  1. 데이터/평가 팀

🎄지원링크(공통)

LLM 만들기 스터디

과정(전체 과정 약 3달)

  1. 모델링
  2. distributed dataparallel baseline 구현
  3. pipeline parallelism 구현
  4. cuda기초 - gemm kernel로 개념익히기
  5. cuda를 사용한 가속 - flash attention 2 구현(forward/backward passes)
  6. 훈련 데이터 준비
  7. 사전학습 - 1.5B모델 학습시키기
  8. kv cache의 구현
  9. SFT, reasoning trace, GRPO alignment