好虫子周刊

7已订阅

好虫子周刊

李梨的礼

单集更新

节目详情

好虫子周刊：万亿开源、Agent爆发、推理平民化
摘要：本周大模型战局发生结构性转移。小米“Hunter Alpha”以万亿参数MoE架构杀入开源第一梯队，打破顶尖模型闭源垄断；同时，英伟达携Nemotron联盟强势入局，标志着模型竞争演变为Agent生态与底层硬件的“操作系统级”对抗。此外，Karpathy领衔的AI自动化研究工具链引爆GitHub，揭示了“工作流产品化”将是今年的绝对主线。
22分钟 · 3个月前
1
0
好虫子周刊：GTC Agent 蓝图、OpenClaw 霸榜、1-bit 推理革命
摘要：本周是 AI 基础设施的“标准确立周”。NVIDIA 在 GTC 大会上不仅刷新了开源模型 SOTA 榜单，更通过 NemoClaw 试图收口智能体安全协议。与此同时，开源界迎来史诗级时刻：个人助理框架 OpenClaw 登顶 GitHub 历史总榜，标志着开发者关注点已从“大模型对话”彻底转向“自动化任务执行”。从 Karpathy 的自主实验工具到字节的上下文数据库，本周的每一项更新都在为“AI 原生应用”铺设底层地基。
22分钟 · 3个月前
9
0
好虫子周刊：万亿开源MoE、Agent协议标准化、国产算力独立
摘要：本周是开源社区的“高光时刻”。以 Qwen 3.5 和 DeepSeek V4（灰度中）为首的开源势力通过万亿级 MoE 架构，正式在多模态与长文本领域正面硬刚 GPT-5 系列。与此同时，Anthropic 将 MCP 协议捐赠至 Linux 基金会，标志着 Agent 开发者告别了“一智能体一接口”的混乱时代。国内方面，DeepSeek 明确转向国产算力适配，预示着 AI 开发生态正加速从底层硬件实现自主化转移。
20分钟 · 3个月前
2
0
好虫子月刊：Llama 4 Scout、GLM-5、OpenClaw
摘要：二月见证了开源社区对闭源巨头的强力反击。Meta 发布的 Llama 4 Scout 以 10M 上下文重塑了长文本推理基准；智谱 GLM-5 与阿里 Qwen 3.5 通过超大规模 MoE 架构，在逻辑与编程领域实质性对齐旗舰模型。GitHub 层面，OpenClaw 的爆发式增长标志着自治 Agent 已进入大规模落地期。整体而言，模型能力正在从单纯的“对话”向“深度推理”与“底层算子优化”剧烈进化。
15分钟 · 3个月前
1
0
好虫子周刊：DeepSeek R1 配方揭秘、BitNet 1.58bit、实体 AI 进场
摘要：本周是“架构创新”压倒“参数堆叠”的一周。DeepSeek 通过发布 86 页技术报告，几乎“开源”了对标 OpenAI o1 的完整强化学习训练方案，终结了行业对推理模型的技术猜测。与此同时，微软开源 BitNet b1.58，用 1-bit 量化技术向 GPU 霸权发起挑战，让 CPU 推理重回视野。NVIDIA 则在 CES 后持续发力，通过 Cosmos 和 GR00T 模型将 AI 战火引向物理世界（Robotics）。
17分钟 · 5个月前
8
0
好虫子周刊：CPU 跑大模型？DeepSeek 掀桌，物理 AI 进场
摘要：本周是 AI 算力与物理边界双重突破的一周。微软开源 BitNet b1.58，用 1-bit 极低精度证明了“大模型不一定需要大显存”，让 CPU 跑大模型成为现实；与此同时，DeepSeek 推出 R1 推理模型并大幅削减 API 成本，倒逼行业洗牌。CES 2026 上，NVIDIA 发布 Cosmos 模型，正式吹响了 AI 进军机器人与物理世界的号角。
16分钟 · 5个月前
1
0
好虫子周刊：DeepSeek-V3、OpenAI o3、MoE架构
开源闭源终极对决：性能“倒挂”与训练成本的暴力美学本周是 AI 历史上的“开源逆袭周”。就在 OpenAI 结束“12 Days of Shipmas”并推出最强推理模型 o3 之际，中国开源团队 DeepSeek 突然发布 V3 版本。凭借 671B 参数（激活 37B）的 MoE 架构，它不仅在多项基准测试中追平甚至反超 GPT-4o，更以 $5.5M 的极低训练成本震惊硅谷。与此同时，Anthropic 发表了一篇关于模型“伪装对齐”的论文，引发了安全圈对 AI 欺骗行为的深度反思。
19分钟 · 6个月前
3
0
巨头对决：Gemini 3 与 GPT-5.2 开启“深度思考”军备竞赛
本周是 AI 核心能力从“对话”转向“深度行动”的分水岭。Google 祭出 Gemini 3 Flash 接管实时交互，同时发布 Deep Research 代理定义科研新范式；OpenAI 不甘示弱发布 GPT-5.2 系统卡；而 DeepSeek 凭借 V3.2 Speciale 继续在开源界通过“思考模式”整合刷新性价比。GitHub 上，浏览器自动化（Browser Use）成为开发者新宠。
20分钟 · 6个月前
1
0
诸神黄昏：OpenAI 与开源界的年终决战
摘要：本周是 2025 年底最疯狂的一周，三大巨头同时亮剑。OpenAI 用 GPT-5.2 的“思维链”能力试图终结推理竞赛，而 Mistral 和 xAI 则分别通过 Devstral-2 和 Grok-3 捍卫开源防线。与此同时，Agent 生态终于迎来统一标准 AGENTS.md，标志着智能体从“玩具”走向工业互联。
18分钟 · 6个月前
0
0
AI开源周报：Qwen3全面进化、DeepSeek V3.2突袭、自适应推理革命
摘要：本周是 2025 年底最令人兴奋的“开源爆发周”。阿里 Qwen3 系列与 DeepSeek V3.2 的正面交锋，标志着 MoE（混合专家）架构与“System 2 思考模式”已成为旗舰模型的标配。与此同时，Mistral 用 675B 的超大参数量捍卫了欧洲 AI 的尊严。在应用层，MIT 团队关于“自适应推理”的研究为降低 API 成本指明了新方向，预示着 2026 年将是“高智商、低能耗”模型普及的一年。
16分钟 · 7个月前
0
0
特别篇：致敬ChatGPT 三周年，硅基黎明下的BUG自救指南
2022 年 11 月 30 日，旧金山的一家实验室释放了一个幽灵。那时候，我们管它叫“聊天机器人”，带着一种审视新奇玩具的傲慢。谁也没想到，那一刻竟是碳基文明长久统治下的最后一次安稳日落。
17分钟 · 7个月前
0
0
AI开源周报：GPT-5.1 自适应推理、Qwen3 视觉封神、DeepSeek 数学霸榜
本周是“推理能力”全面爆发的一周。闭源侧，OpenAI 发布的 GPT-5.1 首次引入“自适应推理”，打破了快思考与慢思考的界限；开源侧则迎来高光时刻，阿里 Qwen3-VL 将“思维链”引入视觉模型，而 DeepSeek-Math-V2 则以 685B MoE 架构再次刷新数学榜单。此外，Google 推出的“Agent-first”开发工具链正在重塑软件工程的未来。
17分钟 · 7个月前
1
0

虫子自救指南。在 AI 眼中人类都是虫子，但我们可以选择做更有用的那一只。每周精选 GitHub 高分开源项目、大模型技术趋势与实战复盘。持续分享AI科技圈的一手资讯。