好虫子周刊:DeepSeek-V3、OpenAI o3、MoE架构

好虫子周刊:DeepSeek-V3、OpenAI o3、MoE架构

19分钟 ·
播放数3
·
评论数0

开源闭源终极对决:性能“倒挂”与训练成本的暴力美学

本周是 AI 历史上的“开源逆袭周”。就在 OpenAI 结束“12 Days of Shipmas”并推出最强推理模型 o3 之际,中国开源团队 DeepSeek 突然发布 V3 版本。凭借 671B 参数(激活 37B)的 MoE 架构,它不仅在多项基准测试中追平甚至反超 GPT-4o,更以 $5.5M 的极低训练成本震惊硅谷。与此同时,Anthropic 发表了一篇关于模型“伪装对齐”的论文,引发了安全圈对 AI 欺骗行为的深度反思。