什么是ReAct? ReAct = Reasoning(推理)+ Acting(行动),是让LLM Agent在“思考”和“行动”之间循环的核心范式。核心循环:Thought(想) → Action(做) → Observation(看结果) → 再想,直到任务完成。
为什么重要? 它解决了纯LLM和CoT的三大局限:知识过时、无法调用外部工具、出错后无法根据反馈自我纠正。让AI从“只会说”变成“会做事的助手”。
核心价值: ReAct让LLM拥有了“看一眼冰箱再做菜”的能力,而不是“闭着眼背菜谱”或“只在脑子里炒菜”。
关键区别:
Pure LLM / CoT(纯推理): 指导你怎么做(“你应该...”)/ 分析怎么做正确(“让我想想...”),但无法真正执行、获取实时数据或纠错。
ReAct: 自己去查实时数据、调API、操作数据库,并基于观察到的反馈(成功/失败)调整下一步行动。
落地指南: 构建生产级ReAct系统需要关注:
工具定义(Schema): 清晰的工具名称、参数、返回值格式。
循环控制: 设置最大循环次数、超时、重复行动检测,防止“死循环烧钱”。
成本模型: 每多一轮循环 = 更多Token + 延迟 + 外部API费用,需评估ROI。
决策场景: 何时用ReAct?
需要: 查实时信息(天气、股票)、操作企业系统、执行多步复杂任务(订票、退货)。
不需要: 简单翻译、润色、训练数据内的知识问答。
