vol.253 - 2026年2月13日 谷歌Gemini 3深度思考版刷新多项纪录
11分钟
·
14
·
0
- GLM-5性能实测抗衡GPT-5.3,已具备系统架构师级别的复杂任务处理能力。
- 亮点在于自动修复错误,从实验品转向解决实际问题,大幅降低开发人力与时间成本。
- 发布后热度惊人,标志着国产大模型在实用性和效率上的重大飞跃。
- 由华人科学家姚顺宇团队主导,推理能力登顶SOTA,ARC-AGI-2得分高达84.6%。
- 超越绝大多数人类水平,专注于解决科研与工程难题。
- 赋能3D打印模型设计及新材料研发,大幅降低工业制造成本,拓宽应用边界。
- 小红书发布最严AI新规,强制标识合成内容并严打仿冒名人,意在及时止损、维护社区信任。
- 横店影视推出AI漫剧**《九州牧云录》**,实现AI深度参与特效与分镜制作。
- 影视制作向智慧创作转型,适应快节奏观看需求,预示AI将更多介入大片制作。
4. 硬软结合与物理评测:雷神科技与WorldArena (00:04:05 - 00:05:30)
- 雷神科技全线进军AI硬件(PC、智能眼镜),意图抓住消费级市场换机潮。
- 清北联合发布WorldArena评测,打破机器人“唯画质论”,聚焦物理遵循性。
- 强调机器人的“功能智能”而非“表演智能”,如同给具身智能考“驾照”。
- SToRM方案通过缩减Token和滑动窗口预测,将自动驾驶车载计算成本降低30倍。
- 研究揭示代码Agent提供过多上下文反而降低成功率,增加模型困惑。
- 提倡“少即是多”,仅提供最简洁需求与核心逻辑以提升效率。
6. 商业巨头与安全隐忧:Anthropic与OpenClaw (00:06:55 - 00:08:40)
- Anthropic估值飙升至3800亿美元,Claude Code年化营收超25亿美元,开发者影响力巨大。
- OpenClaw暴露数万台实例,存在数据窃取风险,凸显Agent权限过大带来的托管风险。
- Waymo第六代司机引发争议,远程辅助是否属于人工介入模糊了“完全自主”的定义。
- 开源社区活跃:Letta实现Agent记忆Git化管理,Seedance 2.0中文提示词库降低创作门槛。
- 普通人的机会在于发现商业机会并利用AI工具,执行力是变现成功的决定性因素。
- 总结:AI全方位重塑世界,既是工具也是挑战,关键在于学习、适应并创造价值。