ReAct范式深度剖析

什么是ReAct？ ReAct = Reasoning（推理）+ Acting（行动），是让LLM Agent在“思考”和“行动”之间循环的核心范式。核心循环：Thought（想） → Action（做） → Observation（看结果） → 再想，直到任务完成。

为什么重要？ 它解决了纯LLM和CoT的三大局限：知识过时、无法调用外部工具、出错后无法根据反馈自我纠正。让AI从“只会说”变成“会做事的助手”。

核心价值： ReAct让LLM拥有了“看一眼冰箱再做菜”的能力，而不是“闭着眼背菜谱”或“只在脑子里炒菜”。

关键区别：
- Pure LLM / CoT（纯推理）： 指导你怎么做（“你应该...”）/ 分析怎么做正确（“让我想想...”），但无法真正执行、获取实时数据或纠错。
- ReAct： 自己去查实时数据、调API、操作数据库，并基于观察到的反馈（成功/失败）调整下一步行动。
落地指南： 构建生产级ReAct系统需要关注：
1. 工具定义（Schema）： 清晰的工具名称、参数、返回值格式。
2. 循环控制： 设置最大循环次数、超时、重复行动检测，防止“死循环烧钱”。
3. 成本模型： 每多一轮循环 = 更多Token + 延迟 + 外部API费用，需评估ROI。

决策场景： 何时用ReAct？