2026.04.12 | Notion

읽을 논문

DataFlex: A Unified Framework for Data-Centric Dynamic Training of Large Language Models

LLM 데이터 중심 동적 학습 프레임워크 제안 논문

Claw-Eval Toward Trustworthy Evaluation of Autonomous Agents

LLM 에이전트 신뢰성 평가를 위한 trajectory 기반 벤치마크 연구

FIPO: Eliciting Deep Reasoning with Future-KL Influenced Policy Optimization

FIPO: Eliciting Deep Reasoning with Future-KL Influenced Policy Optimization

복잡한 추가 모델 없이도 모델의 추론 길이를 10,000자까지 늘려 o1-mini급 성능을 뽑아낸 강화학습 최적화 연구

AI NEWS

OpenAI Image V2 model

OpenAI tests next-gen Image V2 model on ChatGPT and LM Arena

OpenAI가 차세대 이미지 모델(Image V2)을 ChatGPT와 LM Arena에서 테스트 중
실제 사용자 기반 평가를 통해 성능을 검증