<aside> 🔥
추론 시간이 늘어날수록 성능이 올라가고 그것이 더욱 효율적이라는 논문에 대해서 고찰해봅니다. (2025년 7월 18일)
</aside>
구글 DeepMind에서 2024년 8월에 발표한 Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters이 큰 파장을 일으킨지 1년정도가 지났습니다. 현실에서 이 논문처럼 되고 있는지 확인해봅니다.
구글 딥마인드 짱
⬅️ 이전 페이지
➡️ 다음 페이지
https://arxiv.org/abs/2408.03314
<aside>
</aside>