

VOL.3 AI五路大军密集发布新模型,路线分岔、价格战与国产生态崛起## 核心主旨与简介 2026年4月,AI行业经历了史无前例的密集发布潮。从4月8日到24日,短短十六天内,智谱GLM-5.1、Anthropic Claude Opus 4.7、月之暗面Kimi K2.6、OpenAI GPT-5.5、DeepSeek V4五款旗舰模型相继发布,几乎每隔几天就有重磅消息。这并非简单的版本迭代,而是标志着AI行业正从“技术竞赛”进入“商业化生死战”,从“谁更聪明”转向“谁更能干”,从“美国独大”转向“中美双轨”。 ## 一、价格真相:615倍价差与涨价潮 最直观的变化是价格。4月24日同一天,OpenAI推出GPT-5.5 Pro,输出定价每百万Token 180美元(折合人民币约1229.4元),而DeepSeek V4-Flash仅0.28美元(约2元),价差高达615倍。即使对比GPT-5.5标准版(30美元),也有102倍。这个数字极具冲击力:调用一次GPT-5.5 Pro的钱,可以调用V4-Flash 615次。 然而,涨价并非只有OpenAI一家。国内定价趋势也在逆转:2025年行业普遍降价,但2026年初,智谱GLM Coding Plan率先提价30%,阿里云AI计算价格上调34%,百度智能云同步跟涨。涨价背后是调用量暴涨——国内日均Token用量在2026年3月突破140万亿,较2024年初增长超1000倍。字节豆包日均调用量不到两个月上涨超60%,MiniMax在OpenClaw带动下月度Token消耗增长6倍。需求如此旺盛,企业愿意为溢价买单。 … ## 章节划分 ### 第 1 章:各位听众朋友们大家好,欢迎收听本期《比特… **本节概要:** 各位听众朋友们大家好,欢迎收听本期《比特与偏见》。我是主持人Kevin。今天这期节目的话题,放在整个AI行业历史里都算得上“炸裂”——2026年4月,十六天之内 大家好!这期内容确实够劲,我前天熬夜看完了所有技术报告,今天早上眼睛都是红的,不过为了跟大家聊透,值了。 大家好。我先说啊,飞哥说“熬夜看技术报告”,实际上我昨天看他在群里发了一张图——DeepSeek V4的FP4训练精度那页,他说“这玩意儿好像巧克力蛋糕配方”, 哈哈哈哈,… ### 第 2 章:对,而且涨价不是OpenAI一家的事。… **本节概要:** 对,而且涨价不是OpenAI一家的事。2026年初,智谱的GLM Coding Plan率先提价30%,阿里云AI计算上调34%,百度智能云也跟涨。明明之前是“ 很简单,供需逆转了。2025年大家还在抢客户,靠补贴拉新;到了2026年,调用量暴涨——国内日均Token用量在2026年3月突破140万亿,比2024年初增长 而且涨价还有几个“隐形机制”。第一,模型升级直接导致重定价,比如智谱从GLM-4.7到GLM-5.1,API实际价格… ### 第 3 章:好,接下来我们深入技术路线。… **本节概要:** 好,接下来我们深入技术路线。刚才Helen提到“黑箱”和“白盒”,这其实就是闭源与开源的分岔。GPT-5.5代表深度闭源路线:参数量不公开,权重不公开,训练细节 这背后其实是两种组织模式和资源禀赋的差异。美国模型追求领域创新和性能上限——比如OpenAI的image-2跨跃式提升,Anthropic在Agentic co 而且我觉得,开源路线还有一个“反哺”效应。DeepSeek V4把FP4训练精度、Muon优化器、混合稀疏注意力这些… ### 第 4 章:听起来很厉害,但我有个疑问——这个“调度… **本节概要:** 听起来很厉害,但我有个疑问——这个“调度器”本身不也需要额外的计算开销吗?如果判断错了,把复杂任务当简单任务处理,会不会反倒出错? 好问题。技术报告里显示,他们用了一个轻量级的分类器,参数很小,FLOPs可以忽略。而且有容错机制:如果快思考的输出置信度不高,会自动触发慢思考回溯。这种“动态深 小米MiMo-V2.5-Pro也很有意思,全球开源模型并列第一,综合智能指数跻身所有模型前五。100万Token上下文,API定价约为国际竞品的1… ### 第 5 章:我还记得黄仁勋在4月15号的播客里预警过… **本节概要:** 我还记得黄仁勋在4月15号的播客里预警过,原话大概是:“如果DeepSeek先在华为平台上发布,那对我们国家来说将是灾难性的。”结果9天后,预言成真。这脸打得, 哈哈,Helen你真的是……但我觉得这个细节特别重要。推动这一切实现的,是北京智源研究院的FlagOS开源软件栈。这相当于给国产芯片提供了一个“统一接口”,让模 绝对是。你看美国那边,英伟达有CUDA,AMD有ROCm,Intel有OneAPI,每家都是自己的封闭生态。中国的做… ### 第 6 章:那你们觉得,投资者的逻辑是不是变了?… **本节概要:** 那你们觉得,投资者的逻辑是不是变了?以前大家关心“技术有多酷”,现在更关心“能赚多少钱”? 完全正确。2026年的AI投资,已经从VC逻辑转向了PE逻辑。VC逻辑是看想象空间、看技术突破、看创始人故事;PE逻辑是看现金流、看利润率、看客户留存。现在大家 对,而且竞争的单位也从“模型”变成了“模型+部署”。评测机构METR指出,SWE-bench上“通过”的代码方案约有一半在实际环境中会fail。真正拉开差距的是 说到部署,还有一个很宏观… ### 第 7 章:这个案例我印象也很深。还有国家电网计划采… **本节概要:** 这个案例我印象也很深。还有国家电网计划采购约8500台具身智能设备,金额68亿元。这是不是说明实体产业对AI的需求正在爆发? 当然是。国家电网的采购计划只是冰山一角。制造业、能源、医疗、金融……几乎每个行业都在尝试部署AI。但这里有一个瓶颈——算力。中国所有主要LLM供应商都表示,推理 这就很有意思了。通常涨价会导致需求下降,但AI行业目前是“涨价+需求爆增”同时发生。说明这个市场还远未饱和。但风险也在累积——中美模型能力差距如果再度扩… ### 第 8 章:最后,还有一个底层技术的里程碑我想提一下… **本节概要:** 最后,还有一个底层技术的里程碑我想提一下——DeepSeek V4首次在如此大规模的开源模型上实现了FP4训练精度。以前大家觉得FP8就是极限了,现在FP4出来 意味着算力效率又翻了一倍。FP4比FP8的存储和计算量减半,也就是说在同样的硬件上,你可以训两倍大的模型,或者用一半的时间训同样的模型。DeepSeek V4用 不过我也得泼一盆冷水。国产光芯片25G以上产品国产化率只有4%,提醒我们底层技术仍然受制于人。光芯片是连接数据中心、… ## 时间轴与章节对应 - **片头音乐** · `00:00`~`00:08`(约 8s) | 章 | 出镜角色 | 起止时间 | 标题 | | ---: | --- | --- | --- | | 1 | 主持人 Kevin、嘉宾 飞哥、嘉宾 Helen | `00:08`~`02:25` | 各位听众朋友们大家好,欢迎收听本期《比特… | | 2 | 主持人 Kevin、嘉宾 Helen、嘉宾 飞哥 | `02:25`~`04:54` | 对,而且涨价不是OpenAI一家的事。… | | 3 | 主持人 Kevin、嘉宾 飞哥、嘉宾 Helen | `04:54`~`07:55` | 好,接下来我们深入技术路线。… | | 4 | 嘉宾 Helen、嘉宾 飞哥、主持人 Kevin | `07:55`~`10:27` | 听起来很厉害,但我有个疑问——这个“调度… | | 5 | 嘉宾 Helen、主持人 Kevin、嘉宾 飞哥 | `10:27`~`12:53` | 我还记得黄仁勋在4月15号的播客里预警过… | | 6 | 主持人 Kevin、嘉宾 Helen、嘉宾 飞哥 | `12:53`~`15:00` | 那你们觉得,投资者的逻辑是不是变了?… | | 7 | 主持人 Kevin、嘉宾 飞哥、嘉宾 Helen | `15:00`~`17:37` | 这个案例我印象也很深。还有国家电网计划采… | | 8 | 主持人 Kevin、嘉宾 飞哥、嘉宾 Helen | `17:37`~`19:46` | 最后,还有一个底层技术的里程碑我想提一下… | - **片尾音乐** · `19:46`~`19:59`(约 13s)
VOL.2 Kapathy对于AI agent的判断,为什么发生180度大转弯主要内容 Karpathy从AI agent的怀疑者转变为深度使用者,揭示了AI agent十年的发展历程、核心缺陷、实践案例及对未来人机协作的展望。 内容结构 - Karpathy对AI agent十年的观点与核心缺陷 - AI发展的三个阶段与本质矛盾 - 从怀疑到全面采用:五个月的反转 - 智能体实践案例:Dobby智能家居与AutoResearch - 编程范式的革命:从手写代码到AI代理主导 - 模型坍塌与人类认知的类比 - AI在教育中的角色与Eureka愿景 - 自动驾驶经验与‘九的行军’ - 未来展望:AGI时间线与人机协作 - Karpathy的个人历程与认知演进 时间轴 - `00:44` · ~20.26s **嘉宾 飞哥**(#2):Kevin好,各位听众好。很高兴能来聊聊这个特别有意思的话题。Karpathy这个反转啊,确实非常典型,它几乎浓缩了当下所有一线AI从业者和重度用户的心路历程: - `01:17` · ~23.26s **嘉宾 飞哥**(#4):对,他当时就是这个意思。他提醒行业不要过度兴奋,不要觉得通用智能体明天就能上岗。他打了个特别贴切的比方:我们理想中的AI代理,应该像一个用户可以随时雇佣的“员工 - `01:40` · ~13.25s **主持人 Kevin**(#5):嗯,这个“无法工作”的判断,背后是他对当前大模型作为智能体核心的一系列“认知缺陷”的诊断。能具体说说这些缺陷是什么吗?这对于我们理解智能体的能力边界至关重要。 - `01:54` · ~25.66s **嘉宾 飞哥**(#6):他列出了几个关键点。首先是“智能”本身还不够,处理复杂、长链条任务时推理能力会断掉。其次是“多模态”能力不足,理解和生成图像、声音、视频还不成熟。第三是缺乏真正 - `02:24` · ~34.03s **嘉宾 飞哥**(#8):这是一个巨大的认知误区!Karpathy对此解释得非常清楚。模型在**一次对话中**能“记住”你的话,仅仅是因为你们的对话历史被完整地保存在了这次对话的“上下文 - `03:11` · ~35.88s **嘉宾 飞哥**(#10):真正的学习需要一个“蒸馏”阶段。就像人类需要睡眠来巩固记忆,把白天的短期记忆转化为长期记忆一样。模型也需要一个类似的训练过程,把上下文窗口里那些有价值的、反复出 - `03:46` · ~16.68s **主持人 Kevin**(#11):这个比喻太精准了。没有海马体,就无法形成长期记忆。好,我们理解了Karpathy最初的“诊断书”。那么,是什么让他在短短两个月后,就从一个诊断医生变成了一个“重 - `04:03` · ~28.85s **嘉宾 飞哥**(#12):我觉得这个反转恰恰证明,**虽然当前的AI代理离“完美员工”还很远,但它已经跨越了一个关键的“可用性门槛”**。Karpathy描述他的转变,像是“某个开关打开 - `04:51` · ~31.22s **嘉宾 飞哥**(#14):是的,这其实是一种“甜蜜的负担”。当工具强大到一定程度,使用者的瓶颈就从“工具行不行”变成了“我能不能用好它”。他称之为“skill issue”。另一个有趣的 - `05:22` · ~12.02s **主持人 Kevin**(#15):哈哈,这已经超越了工具关系,有点像人机协作的伙伴关系了。那说了这么多理论上的转变,有没有什么具体的、让人“哇塞”的案例,能让我们真切感受到智能体现在能做什么? - `05:34` · ~8.42s **嘉宾 飞哥**(#16):当然有,而且非常酷。Karpathy自己就做了两个绝佳的示范。一个是生活方面的,叫“Dobby”智能家居管家。 - `06:16` · ~45.22s **嘉宾 飞哥**(#20):不止如此。他还把安防摄像头接入了Qwen这样的视觉模型,用于变化检测。比如当门口有车停下时,Dobby能通过WhatsApp直接给他发消息。现在他睡觉前只需要说 - `07:01` · ~8.26s **主持人 Kevin**(#21):这个案例太有说服力了,它展示了智能体作为“通用接口”和“自动化胶水”的潜力。那在更专业的领域,比如科研上呢? - `07:09` · ~20.42s **嘉宾 飞哥**(#22):这就是他的第二个案例:AutoResearch。他构建了一个系统,让AI代理去自动优化一个叫nanochat的小型语言模型的训练代码。整个流程是闭环的:代理自动 - `08:05` · ~6.67s **主持人 Kevin**(#25):这就像不知疲倦、不会犯低级错误的超级科研助理。而且它的工作是可并行、可规模化的。 - `08:12` · ~34.87s **嘉宾 飞哥**(#26):完全正确。这个“Karpathy循环”项目在社交媒体上爆火,很多人复现。Shopify的CEO用类似的思路做了37次实验,性能提升19%。更厉害的是,SkyPi - `08:47` · ~14.06s **主持人 Kevin**(#27):这描绘了一幅非常激动人心的“群体智能科研”图景。那显然,这种智能体优先的范式,对程序员这个职业的冲击是最直接、最剧烈的。Karpathy本人就是顶尖程序员,他的 - `09:22` · ~7.46s **主持人 Kevin**(#29):但我们也听到很多开发者抱怨,AI写的代码质量不高,需要大量修改,效率反而不高。Karpathy怎么看这个矛盾? - `09:29` · ~37.46s **嘉宾 飞哥**(#30):他观察得非常细致。他把与编码模型的互动分成三类:第一是完全不用;第二是用自动补全;第三是用智能体进行“vibe coding”。他的结论是,**自动补全是目前最 - `10:07` · ~2.42s **主持人 Kevin**(#31):那智能体编码的优势在哪里呢? - `10:09` · ~37.66s **嘉宾 飞哥**(#32):优势在于两种场景:一是处理“样板式”的繁琐任务,比如自动生成数据报告、写一些标准化的脚本;二是当你要用一种完全不熟悉的编程语言或框架时。比如,如果你懂Pytho - `11:02` · ~33.65s **嘉宾 飞哥**(#34):这是个很精彩的洞察。“模型坍塌”是指,如果一个生成模型只用自己生成的数据来训练自己,它的输出会变得越来越狭窄、同质化,失去多样性,就像思想被禁锢在了一个小盒子里 - `11:36` · ~10.06s **主持人 Kevin**(#35):所以他认为,无论是AI还是人类,都需要不断注入“熵”,也就是新鲜、多元、甚至混乱的信息,来防止这种认知上的坍塌。 - `11:46` · ~19.08s **嘉宾 飞哥**(#36):是的。他甚至联想到,人类的“做梦”可能就是一种防止大脑过拟合的机制,将我们置于怪异的情境中来保持思维的活性。这为AI研究指出了一个有趣的方向:如何为模型设计一种 - `12:05` · ~8.66s **主持人 Kevin**(#37):从技术到哲学,Karpathy的思考维度很广。我们知道他还投身于教育,创办了Eureka Labs。在AI时代,他对教育的看法又是什么呢? - `12:14` · ~31.06s **嘉宾 飞哥**(#38):他的教育理念非常独特。他认为,教育的核心不是灌输知识,而是“建造通往知识的坡道”,目标是最大化学生“每秒顿悟”的次数。因为知识本身是网状、并行的结构,但人类学习 - `12:50` · ~49.2s **嘉宾 飞哥**(#40):他认为AI将从根本上改变教育,但**目前的大模型还不行**。因为一个优秀的人类家教,能在很短时间内理解学生独特的“心智模型”,然后提供恰到好处的挑战(就是维果茨 - `13:39` · ~14.04s **主持人 Kevin**(#41):这个愿景很美好。飞哥,我们聊了这么多Karpathy在软件和算法层面的思考,别忘了他在特斯拉负责AI的那五年,是深耕硬核的自动驾驶领域的。那段经历给他的认知带来 - `13:53` · ~18.46s **嘉宾 飞哥**(#42):那段经历至关重要,给了他关于“产品化”和“可靠性”的残酷教育。他学到了两个关键概念:一是“从演示到产品的巨大差距”,做个能跑的演示很容易,但做成可靠的产品难如登 - `14:19` · ~41.26s **嘉宾 飞哥**(#44):没错。让一个系统达到90%的可靠可能只需要1份努力,但从90%到99%需要付出同样甚至更多的努力,从99%到99.9%又是巨大的投入。自动驾驶就是如此,失败的成 - `15:00` · ~9.24s **主持人 Kevin**(#45):所以,综合他在软件智能体和硬核自动驾驶两方面的经验,他对AGI的未来时间线,是激进还是保守呢? - `15:09` · ~48.86s **嘉宾 飞哥**(#46):他非常清醒和务实。他认为AI的进步更像是“自主性滑块”的连续移动,人类把越来越复杂的任务抽象出来,交给自动化系统。AGI或超级智能不会是突然的“爆炸”,而是一个 - `15:58` · ~4.66s **主持人 Kevin**(#47):基于这种渐进式的判断,他对近未来有什么具体的预测吗? - `16:03` · ~29.62s **嘉宾 飞哥**(#48):他预测2026年可能会是“Slopacolypse”(可以戏译为“泔水末日”)。意思是,GitHub、arXiv论文库、社交媒体上会充斥着大量由AI生成的、“差 - `16:45` · ~46.2s **嘉宾 飞哥**(#50):是的,这是一条非常清晰的认知演进路线。早期他相信“规模即一切”;在特斯拉他领悟到“数据工程比算法魔法更重要”;重回OpenAI后,他提出预训练撞上了数据墙,下一 - `17:31` · ~14.04s **主持人 Kevin**(#51):今天和飞哥的聊天信息量巨大,我们从Karpathy的个人反转聊起,深入探讨了智能体的能力与缺陷、具体案例、对编程和教育等行业的冲击、以及未来的哲学展望。非常感谢
Hermes Agent 与 OpenClaw 的对决内容结构 * - AI Agent热潮与节目定位 * - AI Agent的本质定义与层级区别 * - OpenClaw:社区驱动的静态Agent平台 * - Hermes Agent:内置自我改进循环的进化型Agent * - 八个维度的直接对比:学习、记忆、生态、部署、安全等 * - 两种设计哲学:人类定义能力边界 vs Agent自我定义能力边界 * - AI Agent的未来三大趋势:多Agent系统、自主规划升级、记忆系统核心化 * - 个人在AI Agent浪潮中的位置:从工具使用者到AI团队管理者 * - 真实用户场景、效果反馈与迁移体验 * - 用户反馈揭示的深层问题与规律 * - 给想入局者的务实选型建议与行动指南 * - 结语:在范式转移中看清方向 时间轴 - `01:35` 范式转移,这个词非常关键。在深入这两款工具之前,我们是不是需要先对齐一下最基本的概念?到底什么是AI Agent?它和我们每天用的ChatGPT、Claude这 - `03:27` 这个区别非常形象,“问题回答机”和“数字职员”。好,概念对齐了,我们就正式进入今天的两大主角。首先是从2025年底开始,在开源社区掀起热潮的OpenClaw。飞 - `03:44`OpenClaw的诞生,代表了社区力量的一次集中爆发。它的核心理念非常直接:**通过人类编写的Skill(技能)文件,来定义和扩展Agent的能力边界**。你可 - `04:06` 这个“技能包”就是Skill,一个用Markdown写的文件。比如,你想让Agent帮你管理日历,就找一个“Calendar Skill”;想让它发邮件,就用“ - `04:36` 这是OpenClaw最大的优势之一。截至目前,ClawHub上已经有了**超过5700个由社区贡献的Skills**,覆盖了内容创作、销售自动化、社交媒体 - `05:12` 架构上,它的核心是一个Gateway,也就是网关。所有外部消息,无论是从Telegram、Discord、Slack,还是对中国用户非常友好的飞书、QQ、微信 - `06:04` 听起来对新手极其友好,生态丰富,渠道支持全面。那么,它的局限性,或者说引发后来争议和对比的关键点,在哪里呢? - `06:55`永不进步,这个点非常扎心,但也点明了静态工具的瓶颈。好,接下来,让我们看看2026年2月横空出世,真正引发这场范式讨论的挑战者:Hermes Agent。它来自 - `07:17`它的核心理念,直指OpenClaw的命门。它内置了一个完整的 **“自我改进学习循环”** 。这个Agent的核心理念不是“执行人类定义的任务”,而是“从执行任 - `07:41` 当然可以,这是Hermes Agent最精妙的设计。这个循环大致分为五步。第一步:**经验**。Agent去完成一个多步骤的复杂任务,比如处理一个客户的技术支持 - `08:50` 这就像一个人类员工在做工作总结和流程优化!这个循环是自动触发的吗? - `08:55` 是的,根据官方文档,大约是**每完成15个任务**,Hermes Agent就会启动一次这样的自我评估和改进流程。这意味着,随着时间推移,这个Agent是在不断 - `09:34` 这个比喻太到位了。除了这个革命性的学习循环,Hermes在其他基础架构上,比如记忆系统,有什么特别的设计来支撑这种“成长性”吗? - `10:14`它还有一个很实用的“热/冷”架构设计。把最常用、需要快速访问的记忆放在“热”层,不常用的归档到“冷”层,这样可以智能地控制调用大模型时的Token消耗,也就是控 - `10:41` 部署上,Hermes给了更多选择,尤其考虑了成本。它支持六种后端:除了本地和Docker,还支持SSH远程服务器、云端开发环境Daytona、高性能计算集群Si - `11:11` 安全设计上,Hermes可以说是“站在巨人的教训上”。OpenClaw在2026年初曝出过几个高危安全漏洞,比如CVE-2026-25253,CVSS评分达到8 - `11:43` 信息量非常大。现在我们对这两个Agent有了基础了解。飞哥,接下来我们能不能做一个更系统、更直接的对比?从多个维度,帮听众清晰地看到它们的差异。 - `11:55` 没问题。我们可以从八个核心维度来一次“正面交锋”。第一个,也是根本性的维度:**学习能力**。OpenClaw:没有自动学习能力,Skills静态,靠手动更新。 - `12:21` 第二个维度,**记忆系统**。OpenClaw:基于Markdown文件和SQLite向量搜索,跨会话记忆需要一些手动配置。Hermes Agent:分层记忆架 - `12:46`第三个维度,**生态系统与Skills**。OpenClaw:**5700+社区Skills**,生态极其丰富,几乎能即插即用。Hermes Agent:Ski - `13:17` 第四个维度,**部署灵活性**。OpenClaw:主要是本地和Docker部署,简单直接,但不支持无服务器选项。Hermes Agent:六种后端可选,特别是M - `13:45` 对,我刚想说的第五个维度就是**安全设计**。OpenClaw:经历过CVE漏洞,虽然已修复,但默认设置相对宽松,需要用户有一定安全意识去手动加固。Hermes - `14:11` 第六个维度是**多模型支持**。两者其实都很灵活。OpenClaw:主要通过OpenRouter支持众多模型,也支持OpenAI、Anthropic、本地Oll - `14:52`第七个维度是**消息渠道**。这是OpenClaw的传统强项。它支持**超过20个渠道**,尤其是对中文互联网生态的覆盖非常到位,飞书、QQ、微信、LINE、T - `15:23` 第八个维度,**社区与迁移**。OpenClaw:拥有**24.7万开发者**的庞大社区,非常活跃,问题和迭代都很快。Hermes Agent:虽然才两个月,但 - `16:12` 是的,这正是我想强调的。这远不止是技术特性表上的差异。OpenClaw代表的是 **“人类定义能力边界”** 的哲学。在这种哲学下,AI是一个强大的、精准的执行 - `16:43` 而Hermes Agent代表的是 **“Agent自我定义能力边界”** 的哲学。在这种哲学下,AI是一个具有学习能力的实体,它的能力边界在经验中不断拓展和重 - `17:08` 这让我想到一个经典的争论:我们到底应该把AI设计成绝对服从的“工具”,还是可以自主成长的“队友”? - `17:16` 没错,这就是底层的思想对决。是“工具论”和“队友论”的路线之争。而且我认为,这两种哲学可能并非零和博弈,它们会服务于不同的场景。对于流程固定、要求绝对可靠的生产 - `17:59` 在我看来,有三个趋势已经非常清晰。第一个趋势是:**从单体Agent到多Agent系统**。大家逐渐发现,打造一个“全能”的超级Agent既困难又不经济。未来的 - `18:41` 就像从一个超级英雄,变成一个分工明确的复仇者联盟。 - `18:46` 比喻得很形象!第二个趋势是:**自主规划与决策能力的持续升级**。这个趋势的起点可以追溯到OpenAI在2024年底发布的o1模型,它展现了强大的推理和规划潜力 - `19:30` 第三个趋势,我认为是**记忆系统将成为核心战场**。记忆是区分“有智慧的持续存在”和“每次重启都从零开始的工具”的关键。未来的记忆系统会分得更细:短时记忆要解决 - `20:51` 这绝不是简单的“AI取代人”。更准确的图景是,每个人都会拥有一个属于自己的、小小的AI团队。里面有负责日程的Agent,负责信息搜集的Agent,负责文案的Ag - `21:27` 从工具使用者到AI团队管理者,这个视角的转变非常震撼,也指明了我们个人学习的方向。好了,理论、哲学、趋势都聊了不少,我们回归一些更接地气的东西。飞哥,你有没有看 - `21:46` 有的,来自社区论坛、博客和GitHub的反馈非常丰富。我分享几个典型场景。第一个是**个人生产力与日常工作流**。有用户分享,用Hermes Agent管理他的 - `22:15` 第二个场景是**开发者任务**。很多程序员喜欢Hermes的终端体验,它有一个不错的文本用户界面,支持多行编辑。用它来自动化代码审查、生成常用脚本、配置开发环境 - `22:46` 第四个场景是**跨平台消息接入**。有用户把他常用的Telegram、Discord、Slack都接入了同一个Hermes Agent,这样无论在哪个平台和它说 - `23:06`反馈非常两极,很有意思。关于学习能力,正面反馈说:“它真的在学!我让它处理客服咨询,几次之后它自己总结出了一个‘用更通俗语言解释技术问题’的Skill,后续的对 - `23:34` 关于执行速度,有人说Hermes比OpenClaw响应更快,规划更果断。但也有人遇到稳定性问题,偶发任务卡住需要重启Agent的情况。关于安全性,从OpenCl - `23:57` 说到迁移,这应该是一个很大的群体。那些从OpenClaw迁移到Hermes的用户,他们的体验是怎样的?有没有人后悔? - `24:39` 当然,也有大量用户选择**不迁移**。他们的理由同样坚实:OpenClaw的社区庞大,任何问题都能快速得到解答;Skills库太丰富,不想重新造轮子;对中国平台 - `25:01`看来,没有绝对的好坏,只有合不合适。从这些真实的用户反馈中,你能否总结出一些更深层的规律或者问题? - `25:09` 当然。我观察到三个规律。第一,用户其实分成了两个“阵营”。一个阵营看重成长性,用了Hermes这种能学习的Agent后,有种“再也回不去”的感觉。另一个阵营看重 - `25:32` 第二,**自我学习是一把双刃剑**。对于领域专家用户,他们能判断Agent学习的方向是否正确,这时自我学习是巨大的加成。但对于不太懂行的小白用户,Agent可能 - `25:59` 第三,**技术先进性和实际用户体验之间存在差距**。Hermes的自我改进循环、分层记忆在技术架构上无疑是更先进的。但因为它迭代太快(才6个版本),在实际使用中 - `26:41` 好的,我总结几条务实的建议。第一,**不要等待“完美”的平台**。这个领域迭代速度极快,等待意味着落后。最好的方式是,马上选择一个,从一个简单的、具体的任务开始 - `27:02` 第二,**理解设计哲学,再决定你的用途**。如果你需要的是一个处理固定流程、不需要经常改变、且要求稳定可靠的自动化工具,比如定时发日报、自动回复固定话术,那么* - `27:26` 如果你面对的是非结构化、需要探索和优化、且希望这个“助手”能越用越聪明、越懂你的任务,比如市场调研、竞品分析、个性化内容推荐,并且你对成本敏感(想用无服务器模式 - `27:47` 第三,**深入理解记忆系统的配置**。无论选哪个,记忆系统都是Agent是否“贴心”的关键。花点时间学习如何配置持久化记忆、如何管理上下文,这能让你的Agent - `28:02` 第四,**保持对多Agent系统的关注**。这是2026年明确的下一波浪潮。尝试思考你的工作能否拆解成多个Agent协作完成,这可能是效率提升的下一个爆发点。 - `28:14` 最后,第五,**两者并非不能共存**。事实上,已经有用户这么做了。他们用OpenClaw部署一个Agent,专门处理来自微信、钉钉的多渠道消息和请求,因为渠道支 - `29:11` 无论你是一名开发者、一名创业者,还是一位寻求提效的知识工作者,希望本期节目能帮助你在这场AI Agent的浪潮中,看清方向,找到自己的位置。关键在于行动起来,在