ReAct

Self-ask

Plan-and-execute agents

Untitled

简单结论

Agents的技术,其实本质上就是写prompt,让模型仿照你的方式来进行执行的一种应用范式,prompt里面包含一些tools的描述,然后我们可以根据模型的输出使用一些外部tools(例如计算器,搜索API,数据库,程序接口,各种模型的API),能使用外部的API,知识库,那大模型就厉害了,只要写好prompt,几乎能干游戏,机器人控制,RPA等所有的事情了。我们可以总结一下,一个包含Agents自主智能体的系统如下图所示,通过tools让大模型获取外部输入,通过prompts来驱动LLM得到我们想要的输出:

Untitled

简而言之,Agent可以访问一套工具(Tool),并根据用户输入确定要使用哪些工具。Agent可以使用多个工具,并使用一个工具的输出作为下一个工具的输入。目前有两种类型的Agents:

Action Agents适合小型的任务,而plan-and-execute agents更适合需要保持长期目标的复杂任务,通常最好的方法是通过让plan-and-execute agent使用action agents来执行计划,将action agents的动态性与plan-and-execute agent的计划能力相结合。

演进

从仅使用 CoT,仅执行 Action,到 ReAct

而将 ReAct 框架和思维链(CoT)结合使用,则能够让大模型在推理过程同时使用内部知识和获取到的外部信息,从而给出更可靠和实际的回应,也提高了 LLMs 的可解释性和可信度。

Agent

Untitled

AI 自主决定程序逻辑这个编程新范式的价值