林俊旸最新推文：从Reasoning Thinking到Agentic Thinking

近日，阿里巴巴通义千问负责人林俊旸在离职风波后首次公开发声，发表了这篇题为《从“Reasoning” Thinking 到“Agentic” Thinking》的深度文章（原文链接：x.com）。

作为亲历 OpenAI o1、DeepSeek R1 推理浪潮并主导 Qwen3 混合思考模式探索的核心人物，林俊旸在文中坦诚复盘了 Qwen 团队在“合并思考与指令”上遭遇的技术困境，并提出了一个大胆的判断：AI 竞争的下一个战场不在推理时长，而在智能体的行动能力。

文章系统梳理了 AI 发展的两个阶段。第一阶段是“推理思考”(Reasoning Thinking）时代——以 o1 和 R1 为代表，模型学会了“在回答之前思考”，通过更长的推理轨迹提升答案质量。但林俊旸指出，这种孤立的内部独白式推理正在遭遇瓶颈：Qwen3 试图统一思考与指令模式的努力最终失败，因为两种模式的数据分布和行为目标根本不同，强行合并只会导致双向平庸。

第二阶段是“智能体思考”(Agentic Thinking）时代——核心问题从“模型能思考多久”转变为“模型能否以维持有效行动的方式思考”。这要求模型不仅会推理，更要会决策、使用工具、感知环境反馈、在失败后修正计划。林俊旸认为，未来的竞争优势将来自环境设计、训练-推理解耦、框架工程，以及在模型决策与真实后果之间闭合循环的能力。

这是一次技术路线的重新定向，也是一个行业观察者从漩涡中心退出后的冷静判断。