近日,阿里巴巴通义千问负责人林俊旸在离职风波后首次公开发声,发表了这篇题为《从“Reasoning” Thinking 到“Agentic” Thinking》的深度文章(原文链接:x.com)。
作为亲历 OpenAI o1、DeepSeek R1 推理浪潮并主导 Qwen3 混合思考模式探索的核心人物,林俊旸在文中坦诚复盘了 Qwen 团队在“合并思考与指令”上遭遇的技术困境,并提出了一个大胆的判断:AI 竞争的下一个战场不在推理时长,而在智能体的行动能力。
文章系统梳理了 AI 发展的两个阶段。第一阶段是“推理思考”(Reasoning Thinking)时代——以 o1 和 R1 为代表,模型学会了“在回答之前思考”,通过更长的推理轨迹提升答案质量。但林俊旸指出,这种孤立的内部独白式推理正在遭遇瓶颈:Qwen3 试图统一思考与指令模式的努力最终失败,因为两种模式的数据分布和行为目标根本不同,强行合并只会导致双向平庸。
第二阶段是“智能体思考”(Agentic Thinking)时代——核心问题从“模型能思考多久”转变为“模型能否以维持有效行动的方式思考”。这要求模型不仅会推理,更要会决策、使用工具、感知环境反馈、在失败后修正计划。林俊旸认为,未来的竞争优势将来自环境设计、训练-推理解耦、框架工程,以及在模型决策与真实后果之间闭合循环的能力。
这是一次技术路线的重新定向,也是一个行业观察者从漩涡中心退出后的冷静判断。
