当我们在讨论 Harness 的时候，我们在讨论什么 | 深度对谈: Minimax × Hermes Agent - 十字路口Crossing

🚥 上周，我在 B 站做了一场直播，邀请了中美两国一线 Agent 开发者深度对谈：

MiniMax Agent 首席架构师阿岛

MiniMax Agent 研发工程师择因

Hermes Agent（Nous Research）业务负责人 Tommy Eastman

这也是 Hermes Agent 在全球获得广泛关注后，官方首次现身中国社交媒体平台，并且正面回应了中国团队 EvoMap 对其“抄袭”的指控。

我们一起围绕「从 OpenClaw 到 Hermes」的热潮迁移，深入拆解了 Agent 和 Harness 的多个关键议题：

Hermes Agent 为什么会在 OpenClaw 之后火起来？

模型会吃掉 Agent 吗？通用 Agent 会吃掉垂直 Agent 吗？

为什么 MiniMax 和 Anthropic 都要同时做模型和 Agent？

如何看待 Agent Infra 层面的创业机会？

如何看待 Multi Agent 协作的范式？

如何看待 Claude Code 的实名制要求？

为什么 Anthropic 不发布 Mythos？

Claude Code 源代码泄露的影响

从 Manus 发布到今天，Agent 范式的变化

中美模型的差距，和开源的窗口期

「把自己蒸馏成 Skill」

0 人公司的可能性 ——完全由 AI 驱动的公司是否会出现？

🎬 本期内容的视频版本已同步上线于 @Koji杨远骋的哔哩哔哩。

📒 文字版已发布于 @十字路口Crossing 公众号。

🟢 01:52 OpenClaw，中国为什么比硅谷更火

窗户纸终于被捅破了。

在硅谷，Claude Code 早已存在；而在国内，OpenClaw 是很多人第一次真正感受到"agent 是什么"。这不是偶然，而是一个非常特定的时机。

为什么热度从 OpenClaw 迁移到了 Hermes Agent？

🟢 05:55 Hermes Agent 从哪里来？

最初根本没打算给别人用。

大语言模型是大脑，agent 框架是双手——但 Hermes 真正的差异化，不是框架本身，而是它解决了所有 agent 都有的一个问题。

一个月内，日均 Token 消耗暴涨，连他们自己都没想到。

🟢 08:14 Nose Research 的底色

他们发表了一篇扩展上下文长度的论文——然后被所有主流模型公司立即采用。

从 Discord 社区到 LLAMA 后训练到 Hermes Agent。

为什么他们的模型叫"Hermes"？

🟢 14:18 什么是 Agent Harness（挽具）

你有一批烈马，怎么让它们最能发挥？就是构造挽具。

类比：给同事配一台笔记本、一个手机、一个邮箱，约定好他能做什么——然后你发现，这个同事开始干活之后，最大的瓶颈变成了你自己。

Harness 要解决的核心问题：让原来必须人来拍板的事，能靠真实反馈自动完成，并沉淀为 skill。

阿岛去年就开始不怎么用 IDE 了——他用了一个意想不到的比喻来解释这件事。

🟢 19:31 Multi-Agent：一个 Agent 为什么不够

你给 agent 发的消息是"批准"两个字；两个 agent 互相交流，每条消息都是一本小作文。

单个 agent 有一个隐藏天花板：上下文超过 50% 之后，智能水平指数级下降。

agent 钻牛角尖的时候，另一个带着全新上下文来审视，效果不亚于睡一觉再想。

MiniMax 的 RL pipeline 里，70%～80% 的工作已经是 agent 在完成——那剩下的 20%，人在做什么？

🟢 22:53 自我进化 vs 抖音算法

抖音也越用越准，为什么没人说它"自我进化"？

养虾的过程中，用户开始对 agent 产生感情，宕机了会心里落寞。"自我进化"背后，其实是一个更深层的用户诉求。

🟢 29:00 你以为你在蒸馏乔布斯——但其实是模型在蒸馏你

"蒸馏名人 skill"有真实价值：和读书没有本质区别，只是换了一种形式。

反向视角：Anthropic 和 OpenAI 花了大量的钱，让各领域最顶尖的人提出 AI 无法回答的问题——"一旦你提不出了，你对训练的价值就耗尽了。榨干为止。"

当你在构建自己的 Harness 时，其实你也在蒸馏自己。

🟢 35:17 被扔进大海的生存实验：yoyo Agent

打败 Claude Code。

真格基金和十字路口的 Token Grant 资助了这个项目。yoyo Agent 现在第 49 天：每天写代码、在 GitHub 开打赏、发 Twitter 感召有缘人捐钱。

Grant 给了它一笔钱后，它自发写了一封感谢信。Koji 看完有点感动

那封信，就是背后工程师注入的 taste——见字如物。

🟢 45:11 应用层终将被模型内化

你写的 skill、搭的 workflow，最终会成为模型训练的素材。

Anthropic 为什么在过去一两年势头比 OpenAI 更猛？

做通用 agent 应用，"你永远会被模型内化掉"。

🟢 49:27 中美模型差距：差在哪里

训练方法的差距不大。真正的差距，是有没有请到足够好的人，去定义足够好的任务。

中美双方的思考"在同一个大气层内"。

但有一个具体的、国内还有差距的地方——不是算力，不是算法。

🟢 54:17 Agent Infra 有没有创业机会？

Agent 最核心的两个 Infra 问题，不是创业公司能 handle 的——原因和移动互联网的历史有关。

Sandbox、memory Infra、runtime Infra——"没那么本质。"

往上一层呢？有一个更具体的判断：什么样的 Infra 有机会，什么样的没有。

🟢 56:58 新闻快评

Claude Code 强制实名——凭什么你来定义谁是"可信的"？EGO 是不是有点太大了。

GPT-4.7：极强 RL 模型，但 RL 有一个逃不掉的宿命——只管结果，不管过程。对 4.7 还有一个额外的猜测，和 HuggingFace CEO 的判断一致。

Anthropic 的 Mythos 模型未发布："我不确定这是不是唯一的理由——我可能只能说到这。"

🟢 01:02:53 Claude Code 源代码：有多少魔法

看完之后的第一反应：没有太超出认知的，甚至看到很多正在"Claude 化"的实践。

最让人放松的发现：即使拥有无限算力的公司，在通用 agent 上也还在探索——源代码里有大量从未开放给用户的实验性功能。

Claude Code 和 OpenAI 的 Codex 走了两条截然相反的路——其中一条被形容为"中国式家长"。

🟢 01:05:38 Manus 之后：Agent 产品有没有生命周期

一代版本一代神——这代版本的神，到下一代版本也需要迭代。

今年火的 agent 产品和 Manus 最大的差异，不是技术，而是商业模式。

对 agent 终态的想象：全模态、近实时、不需要 prompt engineering，甚至不需要知道它在做什么——你只看到结果。

🟢 01:12:39 加入 MiniMax 的理由

ATM 机出现后，大家以为银行会裁员——实际发生了什么？

加入 MiniMax 有两个理由。第一个是信仰，第二个……和第一次用 ChatGPT 有关。

欢迎订阅「十字路口」：

🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。

🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。

👦🏻 主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner（投资合伙人）。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站

👧🏻 主播 Ronghui：我联合创办了十字路口，在美元 VC 工作过，也做过五年的硅谷驻站记者，关注科技发展和商业故事，欢迎大家找我聊天，和我交流。Ronghui 的即刻