比特与偏见

4已订阅

比特与偏见

胖丁kevin

单集更新

节目详情

VOL.3 AI五路大军密集发布新模型，路线分岔、价格战与国产生态崛起
## 核心主旨与简介 2026年4月，AI行业经历了史无前例的密集发布潮。从4月8日到24日，短短十六天内，智谱GLM-5.1、Anthropic Claude Opus 4.7、月之暗面Kimi K2.6、OpenAI GPT-5.5、DeepSeek V4五款旗舰模型相继发布，几乎每隔几天就有重磅消息。这并非简单的版本迭代，而是标志着AI行业正从“技术竞赛”进入“商业化生死战”，从“谁更聪明”转向“谁更能干”，从“美国独大”转向“中美双轨”。 ## 一、价格真相：615倍价差与涨价潮最直观的变化是价格。4月24日同一天，OpenAI推出GPT-5.5 Pro，输出定价每百万Token 180美元（折合人民币约1229.4元），而DeepSeek V4-Flash仅0.28美元（约2元），价差高达615倍。即使对比GPT-5.5标准版（30美元），也有102倍。这个数字极具冲击力：调用一次GPT-5.5 Pro的钱，可以调用V4-Flash 615次。然而，涨价并非只有OpenAI一家。国内定价趋势也在逆转：2025年行业普遍降价，但2026年初，智谱GLM Coding Plan率先提价30%，阿里云AI计算价格上调34%，百度智能云同步跟涨。涨价背后是调用量暴涨——国内日均Token用量在2026年3月突破140万亿，较2024年初增长超1000倍。字节豆包日均调用量不到两个月上涨超60%，MiniMax在OpenClaw带动下月度Token消耗增长6倍。需求如此旺盛，企业愿意为溢价买单。 … ## 章节划分 ### 第 1 章：各位听众朋友们大家好，欢迎收听本期《比特… **本节概要：** 各位听众朋友们大家好，欢迎收听本期《比特与偏见》。我是主持人Kevin。今天这期节目的话题，放在整个AI行业历史里都算得上“炸裂”——2026年4月，十六天之内大家好！这期内容确实够劲，我前天熬夜看完了所有技术报告，今天早上眼睛都是红的，不过为了跟大家聊透，值了。大家好。我先说啊，飞哥说“熬夜看技术报告”，实际上我昨天看他在群里发了一张图——DeepSeek V4的FP4训练精度那页，他说“这玩意儿好像巧克力蛋糕配方”，哈哈哈哈，… ### 第 2 章：对，而且涨价不是OpenAI一家的事。… **本节概要：** 对，而且涨价不是OpenAI一家的事。2026年初，智谱的GLM Coding Plan率先提价30%，阿里云AI计算上调34%，百度智能云也跟涨。明明之前是“ 很简单，供需逆转了。2025年大家还在抢客户，靠补贴拉新；到了2026年，调用量暴涨——国内日均Token用量在2026年3月突破140万亿，比2024年初增长而且涨价还有几个“隐形机制”。第一，模型升级直接导致重定价，比如智谱从GLM-4.7到GLM-5.1，API实际价格… ### 第 3 章：好，接下来我们深入技术路线。… **本节概要：** 好，接下来我们深入技术路线。刚才Helen提到“黑箱”和“白盒”，这其实就是闭源与开源的分岔。GPT-5.5代表深度闭源路线：参数量不公开，权重不公开，训练细节这背后其实是两种组织模式和资源禀赋的差异。美国模型追求领域创新和性能上限——比如OpenAI的image-2跨跃式提升，Anthropic在Agentic co 而且我觉得，开源路线还有一个“反哺”效应。DeepSeek V4把FP4训练精度、Muon优化器、混合稀疏注意力这些… ### 第 4 章：听起来很厉害，但我有个疑问——这个“调度… **本节概要：** 听起来很厉害，但我有个疑问——这个“调度器”本身不也需要额外的计算开销吗？如果判断错了，把复杂任务当简单任务处理，会不会反倒出错？好问题。技术报告里显示，他们用了一个轻量级的分类器，参数很小，FLOPs可以忽略。而且有容错机制：如果快思考的输出置信度不高，会自动触发慢思考回溯。这种“动态深小米MiMo-V2.5-Pro也很有意思，全球开源模型并列第一，综合智能指数跻身所有模型前五。100万Token上下文，API定价约为国际竞品的1… ### 第 5 章：我还记得黄仁勋在4月15号的播客里预警过… **本节概要：** 我还记得黄仁勋在4月15号的播客里预警过，原话大概是：“如果DeepSeek先在华为平台上发布，那对我们国家来说将是灾难性的。”结果9天后，预言成真。这脸打得，哈哈，Helen你真的是……但我觉得这个细节特别重要。推动这一切实现的，是北京智源研究院的FlagOS开源软件栈。这相当于给国产芯片提供了一个“统一接口”，让模绝对是。你看美国那边，英伟达有CUDA，AMD有ROCm，Intel有OneAPI，每家都是自己的封闭生态。中国的做… ### 第 6 章：那你们觉得，投资者的逻辑是不是变了？… **本节概要：** 那你们觉得，投资者的逻辑是不是变了？以前大家关心“技术有多酷”，现在更关心“能赚多少钱”？完全正确。2026年的AI投资，已经从VC逻辑转向了PE逻辑。VC逻辑是看想象空间、看技术突破、看创始人故事；PE逻辑是看现金流、看利润率、看客户留存。现在大家对，而且竞争的单位也从“模型”变成了“模型+部署”。评测机构METR指出，SWE-bench上“通过”的代码方案约有一半在实际环境中会fail。真正拉开差距的是说到部署，还有一个很宏观… ### 第 7 章：这个案例我印象也很深。还有国家电网计划采… **本节概要：** 这个案例我印象也很深。还有国家电网计划采购约8500台具身智能设备，金额68亿元。这是不是说明实体产业对AI的需求正在爆发？当然是。国家电网的采购计划只是冰山一角。制造业、能源、医疗、金融……几乎每个行业都在尝试部署AI。但这里有一个瓶颈——算力。中国所有主要LLM供应商都表示，推理这就很有意思了。通常涨价会导致需求下降，但AI行业目前是“涨价+需求爆增”同时发生。说明这个市场还远未饱和。但风险也在累积——中美模型能力差距如果再度扩… ### 第 8 章：最后，还有一个底层技术的里程碑我想提一下… **本节概要：** 最后，还有一个底层技术的里程碑我想提一下——DeepSeek V4首次在如此大规模的开源模型上实现了FP4训练精度。以前大家觉得FP8就是极限了，现在FP4出来意味着算力效率又翻了一倍。FP4比FP8的存储和计算量减半，也就是说在同样的硬件上，你可以训两倍大的模型，或者用一半的时间训同样的模型。DeepSeek V4用不过我也得泼一盆冷水。国产光芯片25G以上产品国产化率只有4%，提醒我们底层技术仍然受制于人。光芯片是连接数据中心、… ## 时间轴与章节对应 - **片头音乐** · `00:00`～`00:08`（约 8s） | 章 | 出镜角色 | 起止时间 | 标题 | | ---: | --- | --- | --- | | 1 | 主持人 Kevin、嘉宾飞哥、嘉宾 Helen | `00:08`～`02:25` | 各位听众朋友们大家好，欢迎收听本期《比特… | | 2 | 主持人 Kevin、嘉宾 Helen、嘉宾飞哥 | `02:25`～`04:54` | 对，而且涨价不是OpenAI一家的事。… | | 3 | 主持人 Kevin、嘉宾飞哥、嘉宾 Helen | `04:54`～`07:55` | 好，接下来我们深入技术路线。… | | 4 | 嘉宾 Helen、嘉宾飞哥、主持人 Kevin | `07:55`～`10:27` | 听起来很厉害，但我有个疑问——这个“调度… | | 5 | 嘉宾 Helen、主持人 Kevin、嘉宾飞哥 | `10:27`～`12:53` | 我还记得黄仁勋在4月15号的播客里预警过… | | 6 | 主持人 Kevin、嘉宾 Helen、嘉宾飞哥 | `12:53`～`15:00` | 那你们觉得，投资者的逻辑是不是变了？… | | 7 | 主持人 Kevin、嘉宾飞哥、嘉宾 Helen | `15:00`～`17:37` | 这个案例我印象也很深。还有国家电网计划采… | | 8 | 主持人 Kevin、嘉宾飞哥、嘉宾 Helen | `17:37`～`19:46` | 最后，还有一个底层技术的里程碑我想提一下… | - **片尾音乐** · `19:46`～`19:59`（约 13s）
20分钟 · 17天前
2
0
VOL.2 Kapathy对于AI agent的判断，为什么发生180度大转弯
主要内容 Karpathy从AI agent的怀疑者转变为深度使用者，揭示了AI agent十年的发展历程、核心缺陷、实践案例及对未来人机协作的展望。内容结构 - Karpathy对AI agent十年的观点与核心缺陷 - AI发展的三个阶段与本质矛盾 - 从怀疑到全面采用：五个月的反转 - 智能体实践案例：Dobby智能家居与AutoResearch - 编程范式的革命：从手写代码到AI代理主导 - 模型坍塌与人类认知的类比 - AI在教育中的角色与Eureka愿景 - 自动驾驶经验与‘九的行军’ - 未来展望：AGI时间线与人机协作 - Karpathy的个人历程与认知演进时间轴 - `00:44` · ~20.26s **嘉宾飞哥**（#2）：Kevin好，各位听众好。很高兴能来聊聊这个特别有意思的话题。Karpathy这个反转啊，确实非常典型，它几乎浓缩了当下所有一线AI从业者和重度用户的心路历程： - `01:17` · ~23.26s **嘉宾飞哥**（#4）：对，他当时就是这个意思。他提醒行业不要过度兴奋，不要觉得通用智能体明天就能上岗。他打了个特别贴切的比方：我们理想中的AI代理，应该像一个用户可以随时雇佣的“员工 - `01:40` · ~13.25s **主持人 Kevin**（#5）：嗯，这个“无法工作”的判断，背后是他对当前大模型作为智能体核心的一系列“认知缺陷”的诊断。能具体说说这些缺陷是什么吗？这对于我们理解智能体的能力边界至关重要。 - `01:54` · ~25.66s **嘉宾飞哥**（#6）：他列出了几个关键点。首先是“智能”本身还不够，处理复杂、长链条任务时推理能力会断掉。其次是“多模态”能力不足，理解和生成图像、声音、视频还不成熟。第三是缺乏真正 - `02:24` · ~34.03s **嘉宾飞哥**（#8）：这是一个巨大的认知误区！Karpathy对此解释得非常清楚。模型在**一次对话中**能“记住”你的话，仅仅是因为你们的对话历史被完整地保存在了这次对话的“上下文 - `03:11` · ~35.88s **嘉宾飞哥**（#10）：真正的学习需要一个“蒸馏”阶段。就像人类需要睡眠来巩固记忆，把白天的短期记忆转化为长期记忆一样。模型也需要一个类似的训练过程，把上下文窗口里那些有价值的、反复出 - `03:46` · ~16.68s **主持人 Kevin**（#11）：这个比喻太精准了。没有海马体，就无法形成长期记忆。好，我们理解了Karpathy最初的“诊断书”。那么，是什么让他在短短两个月后，就从一个诊断医生变成了一个“重 - `04:03` · ~28.85s **嘉宾飞哥**（#12）：我觉得这个反转恰恰证明，**虽然当前的AI代理离“完美员工”还很远，但它已经跨越了一个关键的“可用性门槛”**。Karpathy描述他的转变，像是“某个开关打开 - `04:51` · ~31.22s **嘉宾飞哥**（#14）：是的，这其实是一种“甜蜜的负担”。当工具强大到一定程度，使用者的瓶颈就从“工具行不行”变成了“我能不能用好它”。他称之为“skill issue”。另一个有趣的 - `05:22` · ~12.02s **主持人 Kevin**（#15）：哈哈，这已经超越了工具关系，有点像人机协作的伙伴关系了。那说了这么多理论上的转变，有没有什么具体的、让人“哇塞”的案例，能让我们真切感受到智能体现在能做什么？ - `05:34` · ~8.42s **嘉宾飞哥**（#16）：当然有，而且非常酷。Karpathy自己就做了两个绝佳的示范。一个是生活方面的，叫“Dobby”智能家居管家。 - `06:16` · ~45.22s **嘉宾飞哥**（#20）：不止如此。他还把安防摄像头接入了Qwen这样的视觉模型，用于变化检测。比如当门口有车停下时，Dobby能通过WhatsApp直接给他发消息。现在他睡觉前只需要说 - `07:01` · ~8.26s **主持人 Kevin**（#21）：这个案例太有说服力了，它展示了智能体作为“通用接口”和“自动化胶水”的潜力。那在更专业的领域，比如科研上呢？ - `07:09` · ~20.42s **嘉宾飞哥**（#22）：这就是他的第二个案例：AutoResearch。他构建了一个系统，让AI代理去自动优化一个叫nanochat的小型语言模型的训练代码。整个流程是闭环的：代理自动 - `08:05` · ~6.67s **主持人 Kevin**（#25）：这就像不知疲倦、不会犯低级错误的超级科研助理。而且它的工作是可并行、可规模化的。 - `08:12` · ~34.87s **嘉宾飞哥**（#26）：完全正确。这个“Karpathy循环”项目在社交媒体上爆火，很多人复现。Shopify的CEO用类似的思路做了37次实验，性能提升19%。更厉害的是，SkyPi - `08:47` · ~14.06s **主持人 Kevin**（#27）：这描绘了一幅非常激动人心的“群体智能科研”图景。那显然，这种智能体优先的范式，对程序员这个职业的冲击是最直接、最剧烈的。Karpathy本人就是顶尖程序员，他的 - `09:22` · ~7.46s **主持人 Kevin**（#29）：但我们也听到很多开发者抱怨，AI写的代码质量不高，需要大量修改，效率反而不高。Karpathy怎么看这个矛盾？ - `09:29` · ~37.46s **嘉宾飞哥**（#30）：他观察得非常细致。他把与编码模型的互动分成三类：第一是完全不用；第二是用自动补全；第三是用智能体进行“vibe coding”。他的结论是，**自动补全是目前最 - `10:07` · ~2.42s **主持人 Kevin**（#31）：那智能体编码的优势在哪里呢？ - `10:09` · ~37.66s **嘉宾飞哥**（#32）：优势在于两种场景：一是处理“样板式”的繁琐任务，比如自动生成数据报告、写一些标准化的脚本；二是当你要用一种完全不熟悉的编程语言或框架时。比如，如果你懂Pytho - `11:02` · ~33.65s **嘉宾飞哥**（#34）：这是个很精彩的洞察。“模型坍塌”是指，如果一个生成模型只用自己生成的数据来训练自己，它的输出会变得越来越狭窄、同质化，失去多样性，就像思想被禁锢在了一个小盒子里 - `11:36` · ~10.06s **主持人 Kevin**（#35）：所以他认为，无论是AI还是人类，都需要不断注入“熵”，也就是新鲜、多元、甚至混乱的信息，来防止这种认知上的坍塌。 - `11:46` · ~19.08s **嘉宾飞哥**（#36）：是的。他甚至联想到，人类的“做梦”可能就是一种防止大脑过拟合的机制，将我们置于怪异的情境中来保持思维的活性。这为AI研究指出了一个有趣的方向：如何为模型设计一种 - `12:05` · ~8.66s **主持人 Kevin**（#37）：从技术到哲学，Karpathy的思考维度很广。我们知道他还投身于教育，创办了Eureka Labs。在AI时代，他对教育的看法又是什么呢？ - `12:14` · ~31.06s **嘉宾飞哥**（#38）：他的教育理念非常独特。他认为，教育的核心不是灌输知识，而是“建造通往知识的坡道”，目标是最大化学生“每秒顿悟”的次数。因为知识本身是网状、并行的结构，但人类学习 - `12:50` · ~49.2s **嘉宾飞哥**（#40）：他认为AI将从根本上改变教育，但**目前的大模型还不行**。因为一个优秀的人类家教，能在很短时间内理解学生独特的“心智模型”，然后提供恰到好处的挑战（就是维果茨 - `13:39` · ~14.04s **主持人 Kevin**（#41）：这个愿景很美好。飞哥，我们聊了这么多Karpathy在软件和算法层面的思考，别忘了他在特斯拉负责AI的那五年，是深耕硬核的自动驾驶领域的。那段经历给他的认知带来 - `13:53` · ~18.46s **嘉宾飞哥**（#42）：那段经历至关重要，给了他关于“产品化”和“可靠性”的残酷教育。他学到了两个关键概念：一是“从演示到产品的巨大差距”，做个能跑的演示很容易，但做成可靠的产品难如登 - `14:19` · ~41.26s **嘉宾飞哥**（#44）：没错。让一个系统达到90%的可靠可能只需要1份努力，但从90%到99%需要付出同样甚至更多的努力，从99%到99.9%又是巨大的投入。自动驾驶就是如此，失败的成 - `15:00` · ~9.24s **主持人 Kevin**（#45）：所以，综合他在软件智能体和硬核自动驾驶两方面的经验，他对AGI的未来时间线，是激进还是保守呢？ - `15:09` · ~48.86s **嘉宾飞哥**（#46）：他非常清醒和务实。他认为AI的进步更像是“自主性滑块”的连续移动，人类把越来越复杂的任务抽象出来，交给自动化系统。AGI或超级智能不会是突然的“爆炸”，而是一个 - `15:58` · ~4.66s **主持人 Kevin**（#47）：基于这种渐进式的判断，他对近未来有什么具体的预测吗？ - `16:03` · ~29.62s **嘉宾飞哥**（#48）：他预测2026年可能会是“Slopacolypse”（可以戏译为“泔水末日”）。意思是，GitHub、arXiv论文库、社交媒体上会充斥着大量由AI生成的、“差 - `16:45` · ~46.2s **嘉宾飞哥**（#50）：是的，这是一条非常清晰的认知演进路线。早期他相信“规模即一切”；在特斯拉他领悟到“数据工程比算法魔法更重要”；重回OpenAI后，他提出预训练撞上了数据墙，下一 - `17:31` · ~14.04s **主持人 Kevin**（#51）：今天和飞哥的聊天信息量巨大，我们从Karpathy的个人反转聊起，深入探讨了智能体的能力与缺陷、具体案例、对编程和教育等行业的冲击、以及未来的哲学展望。非常感谢
18分钟 · 1 个月前
9
0
Hermes Agent 与 OpenClaw 的对决
内容结构 * - AI Agent热潮与节目定位 * - AI Agent的本质定义与层级区别 * - OpenClaw：社区驱动的静态Agent平台 * - Hermes Agent：内置自我改进循环的进化型Agent * - 八个维度的直接对比：学习、记忆、生态、部署、安全等 * - 两种设计哲学：人类定义能力边界 vs Agent自我定义能力边界 * - AI Agent的未来三大趋势：多Agent系统、自主规划升级、记忆系统核心化 * - 个人在AI Agent浪潮中的位置：从工具使用者到AI团队管理者 * - 真实用户场景、效果反馈与迁移体验 * - 用户反馈揭示的深层问题与规律 * - 给想入局者的务实选型建议与行动指南 * - 结语：在范式转移中看清方向时间轴 - `01:35` 范式转移，这个词非常关键。在深入这两款工具之前，我们是不是需要先对齐一下最基本的概念？到底什么是AI Agent？它和我们每天用的ChatGPT、Claude这 - `03:27` 这个区别非常形象，“问题回答机”和“数字职员”。好，概念对齐了，我们就正式进入今天的两大主角。首先是从2025年底开始，在开源社区掀起热潮的OpenClaw。飞 - `03:44`OpenClaw的诞生，代表了社区力量的一次集中爆发。它的核心理念非常直接：**通过人类编写的Skill（技能）文件，来定义和扩展Agent的能力边界**。你可 - `04:06` 这个“技能包”就是Skill，一个用Markdown写的文件。比如，你想让Agent帮你管理日历，就找一个“Calendar Skill”；想让它发邮件，就用“ - `04:36` 这是OpenClaw最大的优势之一。截至目前，ClawHub上已经有了**超过5700个由社区贡献的Skills**，覆盖了内容创作、销售自动化、社交媒体 - `05:12` 架构上，它的核心是一个Gateway，也就是网关。所有外部消息，无论是从Telegram、Discord、Slack，还是对中国用户非常友好的飞书、QQ、微信 - `06:04` 听起来对新手极其友好，生态丰富，渠道支持全面。那么，它的局限性，或者说引发后来争议和对比的关键点，在哪里呢？ - `06:55`永不进步，这个点非常扎心，但也点明了静态工具的瓶颈。好，接下来，让我们看看2026年2月横空出世，真正引发这场范式讨论的挑战者：Hermes Agent。它来自 - `07:17`它的核心理念，直指OpenClaw的命门。它内置了一个完整的 **“自我改进学习循环”** 。这个Agent的核心理念不是“执行人类定义的任务”，而是“从执行任 - `07:41` 当然可以，这是Hermes Agent最精妙的设计。这个循环大致分为五步。第一步：**经验**。Agent去完成一个多步骤的复杂任务，比如处理一个客户的技术支持 - `08:50` 这就像一个人类员工在做工作总结和流程优化！这个循环是自动触发的吗？ - `08:55` 是的，根据官方文档，大约是**每完成15个任务**，Hermes Agent就会启动一次这样的自我评估和改进流程。这意味着，随着时间推移，这个Agent是在不断 - `09:34` 这个比喻太到位了。除了这个革命性的学习循环，Hermes在其他基础架构上，比如记忆系统，有什么特别的设计来支撑这种“成长性”吗？ - `10:14`它还有一个很实用的“热/冷”架构设计。把最常用、需要快速访问的记忆放在“热”层，不常用的归档到“冷”层，这样可以智能地控制调用大模型时的Token消耗，也就是控 - `10:41` 部署上，Hermes给了更多选择，尤其考虑了成本。它支持六种后端：除了本地和Docker，还支持SSH远程服务器、云端开发环境Daytona、高性能计算集群Si - `11:11` 安全设计上，Hermes可以说是“站在巨人的教训上”。OpenClaw在2026年初曝出过几个高危安全漏洞，比如CVE-2026-25253，CVSS评分达到8 - `11:43` 信息量非常大。现在我们对这两个Agent有了基础了解。飞哥，接下来我们能不能做一个更系统、更直接的对比？从多个维度，帮听众清晰地看到它们的差异。 - `11:55` 没问题。我们可以从八个核心维度来一次“正面交锋”。第一个，也是根本性的维度：**学习能力**。OpenClaw：没有自动学习能力，Skills静态，靠手动更新。 - `12:21` 第二个维度，**记忆系统**。OpenClaw：基于Markdown文件和SQLite向量搜索，跨会话记忆需要一些手动配置。Hermes Agent：分层记忆架 - `12:46`第三个维度，**生态系统与Skills**。OpenClaw：**5700+社区Skills**，生态极其丰富，几乎能即插即用。Hermes Agent：Ski - `13:17` 第四个维度，**部署灵活性**。OpenClaw：主要是本地和Docker部署，简单直接，但不支持无服务器选项。Hermes Agent：六种后端可选，特别是M - `13:45` 对，我刚想说的第五个维度就是**安全设计**。OpenClaw：经历过CVE漏洞，虽然已修复，但默认设置相对宽松，需要用户有一定安全意识去手动加固。Hermes - `14:11` 第六个维度是**多模型支持**。两者其实都很灵活。OpenClaw：主要通过OpenRouter支持众多模型，也支持OpenAI、Anthropic、本地Oll - `14:52`第七个维度是**消息渠道**。这是OpenClaw的传统强项。它支持**超过20个渠道**，尤其是对中文互联网生态的覆盖非常到位，飞书、QQ、微信、LINE、T - `15:23` 第八个维度，**社区与迁移**。OpenClaw：拥有**24.7万开发者**的庞大社区，非常活跃，问题和迭代都很快。Hermes Agent：虽然才两个月，但 - `16:12` 是的，这正是我想强调的。这远不止是技术特性表上的差异。OpenClaw代表的是 **“人类定义能力边界”** 的哲学。在这种哲学下，AI是一个强大的、精准的执行 - `16:43` 而Hermes Agent代表的是 **“Agent自我定义能力边界”** 的哲学。在这种哲学下，AI是一个具有学习能力的实体，它的能力边界在经验中不断拓展和重 - `17:08` 这让我想到一个经典的争论：我们到底应该把AI设计成绝对服从的“工具”，还是可以自主成长的“队友”？ - `17:16` 没错，这就是底层的思想对决。是“工具论”和“队友论”的路线之争。而且我认为，这两种哲学可能并非零和博弈，它们会服务于不同的场景。对于流程固定、要求绝对可靠的生产 - `17:59` 在我看来，有三个趋势已经非常清晰。第一个趋势是：**从单体Agent到多Agent系统**。大家逐渐发现，打造一个“全能”的超级Agent既困难又不经济。未来的 - `18:41` 就像从一个超级英雄，变成一个分工明确的复仇者联盟。 - `18:46` 比喻得很形象！第二个趋势是：**自主规划与决策能力的持续升级**。这个趋势的起点可以追溯到OpenAI在2024年底发布的o1模型，它展现了强大的推理和规划潜力 - `19:30` 第三个趋势，我认为是**记忆系统将成为核心战场**。记忆是区分“有智慧的持续存在”和“每次重启都从零开始的工具”的关键。未来的记忆系统会分得更细：短时记忆要解决 - `20:51` 这绝不是简单的“AI取代人”。更准确的图景是，每个人都会拥有一个属于自己的、小小的AI团队。里面有负责日程的Agent，负责信息搜集的Agent，负责文案的Ag - `21:27` 从工具使用者到AI团队管理者，这个视角的转变非常震撼，也指明了我们个人学习的方向。好了，理论、哲学、趋势都聊了不少，我们回归一些更接地气的东西。飞哥，你有没有看 - `21:46` 有的，来自社区论坛、博客和GitHub的反馈非常丰富。我分享几个典型场景。第一个是**个人生产力与日常工作流**。有用户分享，用Hermes Agent管理他的 - `22:15` 第二个场景是**开发者任务**。很多程序员喜欢Hermes的终端体验，它有一个不错的文本用户界面，支持多行编辑。用它来自动化代码审查、生成常用脚本、配置开发环境 - `22:46` 第四个场景是**跨平台消息接入**。有用户把他常用的Telegram、Discord、Slack都接入了同一个Hermes Agent，这样无论在哪个平台和它说 - `23:06`反馈非常两极，很有意思。关于学习能力，正面反馈说：“它真的在学！我让它处理客服咨询，几次之后它自己总结出了一个‘用更通俗语言解释技术问题’的Skill，后续的对 - `23:34` 关于执行速度，有人说Hermes比OpenClaw响应更快，规划更果断。但也有人遇到稳定性问题，偶发任务卡住需要重启Agent的情况。关于安全性，从OpenCl - `23:57` 说到迁移，这应该是一个很大的群体。那些从OpenClaw迁移到Hermes的用户，他们的体验是怎样的？有没有人后悔？ - `24:39` 当然，也有大量用户选择**不迁移**。他们的理由同样坚实：OpenClaw的社区庞大，任何问题都能快速得到解答；Skills库太丰富，不想重新造轮子；对中国平台 - `25:01`看来，没有绝对的好坏，只有合不合适。从这些真实的用户反馈中，你能否总结出一些更深层的规律或者问题？ - `25:09` 当然。我观察到三个规律。第一，用户其实分成了两个“阵营”。一个阵营看重成长性，用了Hermes这种能学习的Agent后，有种“再也回不去”的感觉。另一个阵营看重 - `25:32` 第二，**自我学习是一把双刃剑**。对于领域专家用户，他们能判断Agent学习的方向是否正确，这时自我学习是巨大的加成。但对于不太懂行的小白用户，Agent可能 - `25:59` 第三，**技术先进性和实际用户体验之间存在差距**。Hermes的自我改进循环、分层记忆在技术架构上无疑是更先进的。但因为它迭代太快（才6个版本），在实际使用中 - `26:41` 好的，我总结几条务实的建议。第一，**不要等待“完美”的平台**。这个领域迭代速度极快，等待意味着落后。最好的方式是，马上选择一个，从一个简单的、具体的任务开始 - `27:02` 第二，**理解设计哲学，再决定你的用途**。如果你需要的是一个处理固定流程、不需要经常改变、且要求稳定可靠的自动化工具，比如定时发日报、自动回复固定话术，那么* - `27:26` 如果你面对的是非结构化、需要探索和优化、且希望这个“助手”能越用越聪明、越懂你的任务，比如市场调研、竞品分析、个性化内容推荐，并且你对成本敏感（想用无服务器模式 - `27:47` 第三，**深入理解记忆系统的配置**。无论选哪个，记忆系统都是Agent是否“贴心”的关键。花点时间学习如何配置持久化记忆、如何管理上下文，这能让你的Agent - `28:02` 第四，**保持对多Agent系统的关注**。这是2026年明确的下一波浪潮。尝试思考你的工作能否拆解成多个Agent协作完成，这可能是效率提升的下一个爆发点。 - `28:14` 最后，第五，**两者并非不能共存**。事实上，已经有用户这么做了。他们用OpenClaw部署一个Agent，专门处理来自微信、钉钉的多渠道消息和请求，因为渠道支 - `29:11` 无论你是一名开发者、一名创业者，还是一位寻求提效的知识工作者，希望本期节目能帮助你在这场AI Agent的浪潮中，看清方向，找到自己的位置。关键在于行动起来，在
30分钟 · 1 个月前
31
3

在这个AI信息爆炸的时代，我们不做技术教程，不追热点新闻。我们只做一件事—— 在嘈杂的信号里，提取真正值得思考的东西。这里是科技从业者的对话现场，和我们一起，带着偏见看清 AI 未来的方向。