ICML 2026 | 爱丁堡大学、普林斯顿联合UIUC等机构联合定义Agent的下半场：智能体理论

一句话版本。 过去两年 Agent 研究更像一场工程竞赛——谁的推理链更长、谁的工具箱更大、谁的 workflow 更复杂。但 Agent 的下半场不再是拼花活，而是把它变成一门科学：不仅问"它 work 不 work？"，更要问"它为什么 work，以及什么时候才应该这么做？"这篇文章想聊聊我们在 ICML 2026 提出的 Theory of Agent (ToA)——以及它如何解释当下最前沿的长上下文、推理模型、工具使用 RL 背后那根共同的主线。

关于这项工作

Theory of Agent (ToA) 是由爱丁堡大学联合普林斯顿大学、UIUC、西北大学、香港中文大学共同提出的智能体统一理论，已被 ICML 2026 以 Position Paper 的形式接收，并获得了审稿人"在计算机科学与工程这种普遍缺乏理论的学科里，这是一项非常令人印象深刻的工作"的评价。

Project Homepage: https://hrwise-nlp.github.io/assets/websites/theory-of-agent/

Arxiv: https://arxiv.org/abs/2506.00886.pdf

作者团队覆盖了当前 Agent / LLM 研究的多条主线——从 ReAct 式推理与工具使用，到 RL 对齐、世界模型、科学发现智能体——这份工作也正是这些主线汇聚后的一次尝试：把 Agent 从一套工程技巧，变成一门可以被推理、被证伪、被累积的科学。

一个你肯定见过的场景:两份同样满分的试卷

想象同一套试卷发到两个学生手里。

同学 A 走的是闭卷考试模式。整套题他靠自己:回忆知识点、做推理、验算,必要时在脑子里重新组织一遍——他把考试当成锻炼基础和思维的机会。
同学 B 走的是开卷考试模式。每一道题他都上网查、问 ChatGPT、翻参考答案,直接抄过来就交。

两份卷子批改下来,都是 100 分。老师如果只看分数,这两个人是一样的。但只要你当过老师,或者自己读过书,你就知道这两个人一学期之后的差距会非常大:

同学 A:哪怕中间做错过、绕弯过,每做一题,他那根叫"解题直觉"的东西都在被加粗一次。期末的时候,同样一道题他能更快、更稳地做对,而且能举一反三。
同学 B:他也做了一学期题,但他脑子里的知识存量没有任何变化。到了必须闭卷的那一次考试——或者任何一次没有 ChatGPT 可用的场合——他会突然发现自己什么都不会。

两份满分,两条命运完全相反的成长曲线。

⚠️ 先澄清一个常见误解:这个故事里绝不是说"同学 A 不会用搜索引擎"或者"用工具是坏事"。恰恰相反——A 也可以、也应该在需要的时候用工具(考试是比喻,真实世界里的 Agent 当然会遇到靠自己无论如何答不出来的题,这时候必须调用外部信息)。

真正的关键是:能靠自己答对的题,就不必为了省事而默认抄答案。工具该在"靠自己不够"的时候上场,而不是在"根本还没试过"的时候就被默认触发。至于"什么叫靠自己不够""什么叫真正必需",正是后面要花篇幅讲清楚的事——我们会把它精确成一个叫知识边界(knowledge boundary)的东西。