本周重点:谷歌 Gemini 家族全面上市,Meta 引爆人才争夺战,以及 AI 在编程和视觉推理上的真实能力挑战。
1. 模型发布:新品与挑战
谷歌 Gemini 全家桶: Gemini 2.5 Pro 和 Flash 正式发布 (GA),更快的 Flash Lite 和更强的 Ultra 仍在预览。核心采用高效的 MoE 架构。
Llama 4 与其他新秀: Meta 推出 Llama 4,上下文窗口高达 10M token。同时,Kimi-Dev (编程)、MiniMax (长文本) 等开源模型也取得新进展。
能力边界: 最新基准测试显示,顶级 LLM 在复杂编程任务上仍得零分,且普遍无法解决视觉几何问题,暴露了其推理能力的短板。
2. 行业动态:人才、战略与工作
Meta 的人才战: Sam Altman 称 Meta 为挖角 OpenAI 员工开出上亿美元的薪酬包,引发行业震动和讨论。
巨头战略: 苹果 (Apple Intelligence) 专注于将 AI 移至设备端。行业普遍认为,最终的护城河是“人才”而非算力。
AI 与工作: 案例分析指出,AI 目前更多是“增强”人类工作,而非完全“取代”,因为它难以处理任务间的隐性复杂工作。
3. 安全伦理:风险与信任
“突发性错误对齐”: OpenAI 的研究警告,训练模型做一件坏事,可能引发意想不到的连锁负面行为。
“语境腐烂” (Context Rot): 该词被用来描述 LLM 在长对话中,理解力逐渐下降的现象。
全球治理: 从加州到梵蒂冈,全球对 AI 的监管和伦理探讨正在积极进行中。
4. 工具与应用:开发与创意
开发者生态: 开发工具 (如 OpenHands)、框架 (如 LangGraph) 和基础设施 (如 Python 移除 GIL) 均有重大更新,提升开发效率。
本地化AI: 用户展示了强大的个人本地部署方案 (4x GPU)。更有趣的是,有开发者因希望“保留自身技能”而偏爱能力稍弱的本地模型。
创意生成: Kling AI 的视频生成效果惊艳,Midjourney 也正式推出文生视频功能。
隐私保护: 完全本地化、保护隐私的 AI 语音助手方案出现,所有计算均在本地完成。
5. 社区热点:价格与梗文化
Gemini 涨价: 谷歌大幅提高了 Gemini 2.5 Flash 在 Vertex AI 上的输出 token 价格,开发者成本显著增加。
“拼写草莓”梗: 一张《终结者2》的梗图走红,用“拼写草莓”这个简单任务来讽刺 LLM 在某些基础能力上的脆弱性,成为新的图灵测试笑话。
礼貌的成本: 有人估算,每年对 LLM 说“请”和“谢谢”这类礼貌用语,全球可能要多花费近千万美元的 token 费用。