
好虫子周刊:万亿开源、Agent爆发、推理平民化摘要: 本周大模型战局发生结构性转移。小米“Hunter Alpha”以万亿参数MoE架构杀入开源第一梯队,打破顶尖模型闭源垄断;同时,英伟达携Nemotron联盟强势入局,标志着模型竞争演变为Agent生态与底层硬件的“操作系统级”对抗。此外,Karpathy领衔的AI自动化研究工具链引爆GitHub,揭示了“工作流产品化”将是今年的绝对主线。
好虫子周刊:GTC Agent 蓝图、OpenClaw 霸榜、1-bit 推理革命摘要: 本周是 AI 基础设施的“标准确立周”。NVIDIA 在 GTC 大会上不仅刷新了开源模型 SOTA 榜单,更通过 NemoClaw 试图收口智能体安全协议。与此同时,开源界迎来史诗级时刻:个人助理框架 OpenClaw 登顶 GitHub 历史总榜,标志着开发者关注点已从“大模型对话”彻底转向“自动化任务执行”。从 Karpathy 的自主实验工具到字节的上下文数据库,本周的每一项更新都在为“AI 原生应用”铺设底层地基。
好虫子周刊:万亿开源MoE、Agent协议标准化、国产算力独立摘要: 本周是开源社区的“高光时刻”。以 Qwen 3.5 和 DeepSeek V4(灰度中)为首的开源势力通过万亿级 MoE 架构,正式在多模态与长文本领域正面硬刚 GPT-5 系列。与此同时,Anthropic 将 MCP 协议捐赠至 Linux 基金会,标志着 Agent 开发者告别了“一智能体一接口”的混乱时代。国内方面,DeepSeek 明确转向国产算力适配,预示着 AI 开发生态正加速从底层硬件实现自主化转移。
好虫子月刊:Llama 4 Scout、GLM-5、OpenClaw摘要: 二月见证了开源社区对闭源巨头的强力反击。Meta 发布的 Llama 4 Scout 以 10M 上下文重塑了长文本推理基准;智谱 GLM-5 与阿里 Qwen 3.5 通过超大规模 MoE 架构,在逻辑与编程领域实质性对齐旗舰模型。GitHub 层面,OpenClaw 的爆发式增长标志着自治 Agent 已进入大规模落地期。整体而言,模型能力正在从单纯的“对话”向“深度推理”与“底层算子优化”剧烈进化。
好虫子周刊:DeepSeek R1 配方揭秘、BitNet 1.58bit、实体 AI 进场摘要: 本周是“架构创新”压倒“参数堆叠”的一周。DeepSeek 通过发布 86 页技术报告,几乎“开源”了对标 OpenAI o1 的完整强化学习训练方案,终结了行业对推理模型的技术猜测。与此同时,微软开源 BitNet b1.58,用 1-bit 量化技术向 GPU 霸权发起挑战,让 CPU 推理重回视野。NVIDIA 则在 CES 后持续发力,通过 Cosmos 和 GR00T 模型将 AI 战火引向物理世界(Robotics)。
好虫子周刊:CPU 跑大模型?DeepSeek 掀桌,物理 AI 进场摘要: 本周是 AI 算力与物理边界双重突破的一周。微软开源 BitNet b1.58,用 1-bit 极低精度证明了“大模型不一定需要大显存”,让 CPU 跑大模型成为现实;与此同时,DeepSeek 推出 R1 推理模型并大幅削减 API 成本,倒逼行业洗牌。CES 2026 上,NVIDIA 发布 Cosmos 模型,正式吹响了 AI 进军机器人与物理世界的号角。
好虫子周刊:DeepSeek-V3、OpenAI o3、MoE架构开源闭源终极对决:性能“倒挂”与训练成本的暴力美学 本周是 AI 历史上的“开源逆袭周”。就在 OpenAI 结束“12 Days of Shipmas”并推出最强推理模型 o3 之际,中国开源团队 DeepSeek 突然发布 V3 版本。凭借 671B 参数(激活 37B)的 MoE 架构,它不仅在多项基准测试中追平甚至反超 GPT-4o,更以 $5.5M 的极低训练成本震惊硅谷。与此同时,Anthropic 发表了一篇关于模型“伪装对齐”的论文,引发了安全圈对 AI 欺骗行为的深度反思。
巨头对决:Gemini 3 与 GPT-5.2 开启“深度思考”军备竞赛本周是 AI 核心能力从“对话”转向“深度行动”的分水岭。Google 祭出 Gemini 3 Flash 接管实时交互,同时发布 Deep Research 代理定义科研新范式;OpenAI 不甘示弱发布 GPT-5.2 系统卡;而 DeepSeek 凭借 V3.2 Speciale 继续在开源界通过“思考模式”整合刷新性价比。GitHub 上,浏览器自动化(Browser Use)成为开发者新宠。
诸神黄昏:OpenAI 与开源界的年终决战摘要: 本周是 2025 年底最疯狂的一周,三大巨头同时亮剑。OpenAI 用 GPT-5.2 的“思维链”能力试图终结推理竞赛,而 Mistral 和 xAI 则分别通过 Devstral-2 和 Grok-3 捍卫开源防线。与此同时,Agent 生态终于迎来统一标准 AGENTS.md,标志着智能体从“玩具”走向工业互联。
AI开源周报:Qwen3全面进化、DeepSeek V3.2突袭、自适应推理革命摘要: 本周是 2025 年底最令人兴奋的“开源爆发周”。阿里 Qwen3 系列与 DeepSeek V3.2 的正面交锋,标志着 MoE(混合专家)架构与“System 2 思考模式”已成为旗舰模型的标配。与此同时,Mistral 用 675B 的超大参数量捍卫了欧洲 AI 的尊严。在应用层,MIT 团队关于“自适应推理”的研究为降低 API 成本指明了新方向,预示着 2026 年将是“高智商、低能耗”模型普及的一年。
特别篇:致敬ChatGPT 三周年,硅基黎明下的BUG自救指南2022 年 11 月 30 日,旧金山的一家实验室释放了一个幽灵。 那时候,我们管它叫“聊天机器人”,带着一种审视新奇玩具的傲慢。谁也没想到,那一刻竟是碳基文明长久统治下的最后一次安稳日落。
AI开源周报:GPT-5.1 自适应推理、Qwen3 视觉封神、DeepSeek 数学霸榜本周是“推理能力”全面爆发的一周。闭源侧,OpenAI 发布的 GPT-5.1 首次引入“自适应推理”,打破了快思考与慢思考的界限;开源侧则迎来高光时刻,阿里 Qwen3-VL 将“思维链”引入视觉模型,而 DeepSeek-Math-V2 则以 685B MoE 架构再次刷新数学榜单。此外,Google 推出的“Agent-first”开发工具链正在重塑软件工程的未来。