2026-05-26 Qwen3.6领跑本地AI Agent，速度飙升，Garry Tan揭秘开发心法

本期节目深入探讨了本地AI模型与AI Agent领域的最新进展，重点介绍了Qwen3.6在Agent任务上的出色表现及其对开源社区的意义，同时还分享了Y Combinator合伙人Garry Tan关于AI Agent开发的实用方法论，强调了从小处着手、持续迭代及自动化重复任务的重要性。此外，内容也涵盖了本地模型在推理速度上的显著优化以及两款提升工作效率的AI工具，预示着AI本地化、高效率与日常工作集成的未来趋势。

本地AI Agent的性能突破

Qwen3.6 (35B A3B版本) 在Reddit LocalLLaMA社区被热议为本地Agent应用的“头号选择”。
其在Agent任务中表现出高稳定性，最坏情况仅为偶尔陷入循环，远优于Gemma 4常出现的工具调用损坏。
开源社区正以惊人速度缩小与大厂闭源模型的差距，尤其在稳定调用工具这一关键指标上。

AI Agent开发方法论与心法

Y Combinator的Garry Tan提炼出“做出来，技能化，加入定时任务，检查，写评测，重复”的Agent开发万能公式。
他强调应进行数十次迭代才能真正跑通项目，而非一次失败就放弃。
提出Agent开发应关注自动化“小脑”功能（无聊重复任务），而非过度追求“前额叶”能力（规划推理、多步链式调用）。

本地模型技术性能飞跃

Hugging Face联合创始人Clem分享了llama.cpp加入MTP（Multi-Token Prediction）后，Qwen3.6-27B模型生成速度从25 tok/s暴涨到45 tok/s。
性能提升接近80%，使得27B参数级别的模型能在A10G显卡上流畅运行日常对话。
这一优化显著推进了本地AI作为主力工具的可能性。

实用AI工具推荐

Nerve (ClickHouse)：自托管AI代理运行时环境，支持在自有基础设施部署，保障数据隐私并节省云服务持续订阅费用。
项目经理AI技能库 (基于Claude Code)：覆盖项目管理全生命周期，能自动完成需求估算、风险分析、RACI矩阵制定等专业工作。