읽을 논문
DataFlex: A Unified Framework for Data-Centric Dynamic Training of Large Language Models
arxiv.org
LLM 데이터 중심 동적 학습 프레임워크 제안 논문
Claw-Eval Toward Trustworthy Evaluation of Autonomous Agents
arxiv.org
LLM 에이전트 신뢰성 평가를 위한 trajectory 기반 벤치마크 연구
FIPO: Eliciting Deep Reasoning with Future-KL Influenced Policy Optimization
FIPO: Eliciting Deep Reasoning with Future-KL Influenced Policy Optimization
복잡한 추가 모델 없이도 모델의 추론 길이를 10,000자까지 늘려 o1-mini급 성능을 뽑아낸 강화학습 최적화 연구
AI NEWS
OpenAI Image V2 model
OpenAI tests next-gen Image V2 model on ChatGPT and LM Arena
- OpenAI가 차세대 이미지 모델(Image V2)을 ChatGPT와 LM Arena에서 테스트 중
- 실제 사용자 기반 평가를 통해 성능을 검증