Vol.22 对话吕骋:差点成先烈,被 Agent 救了,CLI 和 AI 原生电脑

Vol.22 对话吕骋:差点成先烈,被 Agent 救了,CLI 和 AI 原生电脑

90分钟 ·
播放数10562
·
评论数16

2024 年 1 月,rabbit r1 的发布曾掀起一阵 AI 硬件热潮,却也很快陷入铺天盖地的争议——科技博主给出负面评测,大众也发出「有手机为何还要它」的质疑,rabbit r1 一度被贴上「鸡肋」「不成熟」的标签。

在这一波 AI 硬件创业潮中,许多同行相继折戟,rabbit 成为少数仍在场上的玩家。

这一年里,吕骋见证了许多产品的快速迭代与分化。

作为连续创业者,吕骋在做 rabbit 之初就获得了 Khosla Ventures 、Sound Ventures 、Amazon Alexa Fund 以及 Synergist 等知名机构的融资。最近,rabbit 又获得了来自 BAI 资本的一轮支持。

近期,硅星人在旧金山湾区与吕骋进行了一次深入对话。镜头前的吕骋,不避讳谈论曾经的争议,也不掩饰对未来的激进判断;对坚持什么,为什么焦虑,他也很坦率直接。对外界对他把 r1 搞砸了的说法,他不接受,为自己辩护。

他坦言,创业本就是与不确定性为伴。而 rabbit 的每一步,都在把 AI 的能力落到实际操作中。

吕骋说,「历史当下可能无法判断对错,但我们希望回头来看,我们是 ahead of the time。」

【主播】

硅星人创始人&硅基立场主理人 骆轶航

【嘉宾】

rabbit创始人兼 CEO 吕骋

时间线

01:35 初代 AI 硬件里被骂最凶,却活到现在的玩家

03:05 从 r1 到 DLAM,全程没有转向,只做 Agent

05:07 LAM 用行动替代语言,不取代大模型

06:45 五年迭代,从按钮点击走到跨平台操控

08:35 抛弃单智能体,转向蜂群协作架构

10:18 图形界面正在退场,命令行重新成为主流

12:20 DLAM 模拟人脑、眼、手,通吃所有界面

14:15 图形界面时代最后的通用自动化方案

17:05 r1 销量超预期,退货率不到 5%

19:42 不做硬件就只能被平台锁死话语权

22:15 图形界面终将消失,语言才是终极交互

25:40 小龙虾印证:用户愿意为效率交出全部权限

28:50 CLI 时代硬件:更小、更便携、AI 原生

32:10 下一代硬件,纯命令行的随身电脑

44:30 操作系统轮回:GUI 与 CLI 螺旋交替

47:18 未来三年,AI 战局将彻底定局

50:05 人的知识与审美,决定 AI 的最终灵魂

57:20 AI 伙伴会成为终身陪伴的家庭成员

01:17:00 为 AI 原生一代打造真正需要的硬件

01:27:10 持续深耕 Agent,让硬件随 AI 不断进化

【本期金句】

Agent 自己去发明一个自己的更高效的编程语言,去跟它去说话,那这样的效果其实是更好的。
如果以后人和机器不需要做复杂交互的话, CLI 其实也就没有那么重要了。
苹果没有理由允许一个更聪明的 Siri 取代它的 Siri。
就是说人跟任何智能体的首要的交流方式是语言,而且仅是语言和文字。
我们不能造个法拉利引擎,然后放在马背上,然后指望它比汽车快。
我认为 AI 这个仗可能未来三年打完了。
等每个人都穿暖吃饱以后,你发现唯一重要的是什么?是 taste。
世界上最聪明的物种一定不是我们。

【关注我们】

本期播客同步视频版已上线,欢迎关注

B 站:硅基立场Pro

视频号、抖音、小红书:硅星人

展开Show Notes
星寒Albert
星寒Albert
2026.3.24
很喜欢这期的观点; 从 GUI到CLI
以wu之名
以wu之名
2026.3.24
下一步是软硬结合,看来马斯克那个造芯片并不是心血来潮
HD783230m
HD783230m
2026.4.18
GUI永远不会死,但是只用于output给人类信息,input大部分变成自然语言. 视觉已经出现5亿年了,高度复杂的语言才出现几十万,而且大部分人现在运用的不是很好,让一些人听明白一些事情,相比直接给对方视觉展示,信息密度和准确性差了很多个量级,这也是为什么人类很容易产生冲突隔阂的原因之一,语言被进化出来不一定是为了更好的转达信息,也可可能是为了更好的骗别人
Nixon_Hu
Nixon_Hu
2026.4.14
提到对于 AI 原生电脑的观察,我觉得很有启发,感谢
HD783230m
HD783230m
2026.4.18
typeless非常好用了
ROMANTICTANG
ROMANTICTANG
2026.4.05
请问看现在 obsidian 的 CLI
拾锦GRIT
拾锦GRIT
2026.3.29
听播客时侯这个词没有get到,搜了一下:
DLAM = Dynamic Large Action Model(动态大动作模型),是Rabbit公司(R1设备)的核心技术。

一、核心定义

- 全称:Dynamic Large Action Model(动态大动作模型)
- 前身:LAM(Large Action Model,大动作模型)
- 定位:AI Agent 底层技术,让AI像人一样操作电脑/手机

二、工作原理(脑-眼-手)

- 脑:调用大模型理解自然语言指令
- 眼:动态视觉理解屏幕界面(非静态截图)
- 手:模拟鼠标/键盘操作,跨系统执行任务

三、核心能力

- 跨平台通用控制:Win/Linux/鸿蒙/Android 等
- 绕开API/权限限制:直接操作GUI,打破SaaS孤岛
- 复杂任务自动化:语音驱动写代码、发消息、用专业软件
- 多Agent并行:分工协作完成复杂流程

四、与传统方案区别

- 传统:依赖API/SDK,受平台限制
- DLAM:视觉+模拟操作,像人一样用设备,适配所有GUI

五、应用场景

- Rabbit R1:语音控制电脑/手机
- 企业:老旧系统自动化、跨软件流程打通
- 个人:解放双手,语音完成复杂操作
GaloisPlus
GaloisPlus
2026.3.27
15:00 这个还挺有意思,以后A2A也应该多些类似人类可感的交互方式
Eet_vSIa
Eet_vSIa
2026.3.27
那些能不让人看出是ai的工具有人知道是什么吗
这不是我学长吗
科技先声
科技先声
2026.3.24
18:37 app抽壳之后,哪类公司的价值会最大? 是不是有壳且有技术的公司,如字节、阿里更容易胜出
兔师傅i:是的 没有软件基因或者创新和研发能力的厂商有点吃力了
Jasonbit:App抽壳这个词精准
长跑男
长跑男
2026.3.26
1:00:40 听了两遍,真的有很多启发,很期待新硬件
sanbai_
sanbai_
2026.3.25
“rabbit r1 一度被贴上「鸡肋」「不成熟」的标签。” 通常中文里面,“欺骗” 和 “不成熟” 是两个不同的词。
专门给极客做硬件做交互,CLI并不大众化还要教育用户重新学习一个跟手机做竞品的硬件!纯属YY出来的产品,跟R1一致。