vol.253 - 2026年2月13日谷歌Gemini 3深度思考版刷新多项纪录

来生小酒馆-每日AI资讯

11分钟 ·5个月前

16

·

0

访问网页版AI资讯日报：ai.hubtoday.app

1. 国产AI的里程碑：GLM-5的实战跨越 (00:00:00 - 00:01:25)

GLM-5性能实测抗衡GPT-5.3，已具备系统架构师级别的复杂任务处理能力。

亮点在于自动修复错误，从实验品转向解决实际问题，大幅降低开发人力与时间成本。

发布后热度惊人，标志着国产大模型在实用性和效率上的重大飞跃。

2. 推理巅峰与工业革命：Gemini 3深度思考版 (00:01:25 - 00:02:40)

由华人科学家姚顺宇团队主导，推理能力登顶SOTA，ARC-AGI-2得分高达84.6%。

超越绝大多数人类水平，专注于解决科研与工程难题。

赋能3D打印模型设计及新材料研发，大幅降低工业制造成本，拓宽应用边界。

3. 规范确立与文娱转型：从监管到AI短剧 (00:02:40 - 00:04:05)

小红书发布最严AI新规，强制标识合成内容并严打仿冒名人，意在及时止损、维护社区信任。

横店影视推出AI漫剧**《九州牧云录》**，实现AI深度参与特效与分镜制作。

影视制作向智慧创作转型，适应快节奏观看需求，预示AI将更多介入大片制作。

4. 硬软结合与物理评测：雷神科技与WorldArena (00:04:05 - 00:05:30)

雷神科技全线进军AI硬件（PC、智能眼镜），意图抓住消费级市场换机潮。

清北联合发布WorldArena评测，打破机器人“唯画质论”，聚焦物理遵循性。

强调机器人的“功能智能”而非“表演智能”，如同给具身智能考“驾照”。

5. 效率悖论与模型瘦身：自动驾驶与代码Agent (00:05:30 - 00:06:55)

SToRM方案通过缩减Token和滑动窗口预测，将自动驾驶车载计算成本降低30倍。

研究揭示代码Agent提供过多上下文反而降低成功率，增加模型困惑。

提倡“少即是多”，仅提供最简洁需求与核心逻辑以提升效率。

6. 商业巨头与安全隐忧：Anthropic与OpenClaw (00:06:55 - 00:08:40)

Anthropic估值飙升至3800亿美元，Claude Code年化营收超25亿美元，开发者影响力巨大。

OpenClaw暴露数万台实例，存在数据窃取风险，凸显Agent权限过大带来的托管风险。

Waymo第六代司机引发争议，远程辅助是否属于人工介入模糊了“完全自主”的定义。

7. 开源生态与未来展望：全民AI时代的机遇 (00:08:40 - 00:10:43)

开源社区活跃：Letta实现Agent记忆Git化管理，Seedance 2.0中文提示词库降低创作门槛。

普通人的机会在于发现商业机会并利用AI工具，执行力是变现成功的决定性因素。

总结：AI全方位重塑世界，既是工具也是挑战，关键在于学习、适应并创造价值。

在小宇宙打开