읽을 논문

DataFlex: A Unified Framework for Data-Centric Dynamic Training of Large Language Models

arxiv.org

LLM 데이터 중심 동적 학습 프레임워크 제안 논문

Claw-Eval Toward Trustworthy Evaluation of Autonomous Agents

arxiv.org

LLM 에이전트 신뢰성 평가를 위한 trajectory 기반 벤치마크 연구

FIPO: Eliciting Deep Reasoning with Future-KL Influenced Policy Optimization

FIPO: Eliciting Deep Reasoning with Future-KL Influenced Policy Optimization

복잡한 추가 모델 없이도 모델의 추론 길이를 10,000자까지 늘려 o1-mini급 성능을 뽑아낸 강화학습 최적화 연구

AI NEWS

OpenAI Image V2 model

OpenAI tests next-gen Image V2 model on ChatGPT and LM Arena