本周是“推理能力”全面爆发的一周。闭源侧,OpenAI 发布的 GPT-5.1 首次引入“自适应推理”,打破了快思考与慢思考的界限;开源侧则迎来高光时刻,阿里 Qwen3-VL 将“思维链”引入视觉模型,而 DeepSeek-Math-V2 则以 685B MoE 架构再次刷新数学榜单。此外,Google 推出的“Agent-first”开发工具链正在重塑软件工程的未来。