Intro

<aside> 🔥

추론 시간이 늘어날수록 성능이 올라가고 그것이 더욱 효율적이라는 논문에 대해서 고찰해봅니다. (2025년 7월 18일)

</aside>

구글 DeepMind에서 2024년 8월에 발표한 Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters이 큰 파장을 일으킨지 1년정도가 지났습니다. 현실에서 이 논문처럼 되고 있는지 확인해봅니다.

Body

Conclusion

구글 딥마인드 짱


⬅️ 이전 페이지

모델 추론 메모리 측정하기

➡️ 다음 페이지

Reference

https://arxiv.org/abs/2408.03314

<aside>

Topics

왜 Chat-gpt는 재현이 안될까?

Gemini API 사용법

허깅페이스 잘 사용하기

컴퓨터의 소수점 표현

모델 추론 메모리 측정하기

성능과 추론 time

GPU 효율적인 학습

프롬프트 엔지니어링

AI 스쿼드 팀 만들기

</aside>