125: 用AI复刻一个「我」,与心识宇宙陶芳波聊身份模型晚点聊 LateTalk

125: 用AI复刻一个「我」,与心识宇宙陶芳波聊身份模型

127分钟 ·
播放数8006
·
评论数48

「感觉自己永恒了。」

本期节目的嘉宾,心识宇宙创始人陶芳波有一套自己的 AI 助手分类法,分类标签都是人称代词:

第一类 AI 助手主攻陪伴,对应人称代词 her,就像电影《她》中承接主人公各种情绪的“萨曼莎”;第二类助手负责执行具体任务,类似《钢铁侠》中的智能管家“贾维斯”,对应人称代词 him。

陶芳波创立的心识宇宙(Mindverse),正在做第三类 AI 助手:me。他们想帮用户复制自己的“第二自我”,构建“身份大模型”(AI Identily Model)。这模型的认知、偏好、价值观和用户个人对齐,能代表用户发起、完成或验收工作。

创业前,陶芳波一直沿着 AI 研究的主线前进。他先后就读于清华大学、伊利诺伊大学香槟分校,毕业后第一份工作是在 Facebook 使用机器学习方法挖掘社交关系,随后到阿里达摩院神经符号实验室,调动跨学科知识,让 AI 模拟人脑。GPT-3 到来后,他决定下场创业。

陶芳波认为,当下已经有足够多的工具满足用户的日常需求。普通用户可能并不需要更多 AI 技术加成的工具,但需要一个 AI 版的第二自我,代理自己去和世界交互。

大部分创业公司让模型和用户对齐的方式还是把历史对话、用户偏好等内容作为上下文输入模型,每个用户使用的底层模型相同,只有上下文不同。心识宇宙团队则主张根据用户数据微调模型,把记忆、情感、价值观参数化。

除了打造身份模型的方式外,陶芳波还在本期播客中分享了身份模型的具体使用场景,以及如何通过产品设计让身份模型和用户“共生”,由此减少用户上传数据的阻力、方便身份模型迭代。

在陶芳波的终极想象里,人人拥有身份模型,意味着现实中运行的社会网络可以被复制到线上,不过在线上交互的 AI 不受人类打字、讲话速度限制,效率更高。身份模型替代人类收发任务、相互协作,人们将会从被迫使用各种工具的状态中解放出来。

本期嘉宾:心识宇宙创始人 陶芳波(即刻 @Tao水木八公

时间线跳转:
- 边创业边研究机器学习的 9 年求学生涯
01:52 大四开始第一段创业,做微博时代的达人撮合平台
04:21 读博前,自由度更高的神经网络成为显学
07:00 专攻数据挖掘方向,建模恐怖分子组织架构
10:56 读博期间的另一个创业项目:学生外卖

- 从 Facebook 到阿里,做能参与人类社会活动的 AI
13:33 既然 AI 有自主性,就要做有社会参与的 AI
16:13 过于发达的工具,让人成了工具的接口
19:28 毕业后,先去 Facebook 为社交网络建模
20:51 阿里时期,阅读认知科学、禅宗相关的书,思考如何造人

- 创业与重定向:从做 him/her 到做 me
25:46 GPT-3 出现,亲自下场的时候到了
28:16 Mindverse 重定向,从做 him/her 到做 me
33:03 用户训练完身份模型后,“觉得自己永恒”了
35:33 两个 AI 身份项目:Me.bot 开箱即用,Second Me 对外开源
37:26 不是 AI 分身,而是 AI 身份
44:04 Me.bot 的最新功能:共鸣、Talks
01:14:02 大量需要一个 AI 身份介入、互动的场景已经存在了
01:17:40 中国互联网数据孤岛和 AI 的通用性矛盾,一定会被打破
01:19:49 用开源模型、本地训练的方式帮用户克服递交数据的心理壁垒
01:23:31 设想中的商业模式:身份即服务

- 身份模型的训练方法
01:25:36 不用 RAG,把对个人的理解内化在参数中
01:29:37 把客观数据变成主观数据,重新抽象、总结
01:36:30 微调不会让模型忘掉知识,但可以放大个人相关的知识
01:39:19 公司周年庆上,身份模型预测出自己的讲话内容
01:41:41 一百份思考、一百份笔记,足够训练出一个 Second Me
01:42:43 模型应该每天微调一次,就像人每晚睡觉时形成记忆
01:44:36 只有让 AI 和用户“共生”,才能降低传输数据的阻力

  • 相信非共识项目有成为共识的那一天01:49:35 大厂有更多数据,更适合做身份模型,但小公司没负担、更高效01:53:00 买量不可取,更希望通过口碑获取用户01:54:54 不赶 AI Agent 的热门,2026 可能也是身份模型之年

剪辑制作:甜食

本期主播:孙海宁(微信 @_HaydenSun)
![]hv.z.wiki

☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆

欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。

请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。

关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:

展开Show Notes
很怕这种蒙眼狂奔的CEO,想得可能还没主持人清楚。对于实际落地问题都选择打太极相信自己。问产品模式是不是依赖规模效应,怎么解决?回答是增长靠口碑产品做好总能解决; 问产品数据壁垒是个人数据,像微信是这样的不是更有优势,答案是认知更重要,认知就能颠覆大厂; 商业模式没想清楚没闭环,理想是出售个人模型给大平台,收分成。这得多大的ME规模?大厂才愿意来付费调用你平台的个人数据。模型训练成本是一天一美金,数据不上云,训练好的模型才上云,那就是在端侧训练,一美金成本是安装ME.bot的人出?如果只是讲故事那也漏洞百出。。。。
Cell细胞:有个可用阈值的 https://www.xiaoyuzhoufm.com/episode/686dd81f60f8f77d4091453a
浩Sean:确实漏洞百出,但作为一个科学家创业,也还能理解,实际上这里面有不少内容是对做某些方向的人是有启发的
6条回复
用了一天,感觉这不是就是带记忆的 llm,那我为啥不用 chat gpt 和 Gemini 呢,模型能力又强又会说话。
Kevin_Hb4c
Kevin_Hb4c
2025.7.14
gpt3出圈时,我也是第一时间想到和陶博士同样的思路,但些点我没想通与博士交流一下:1.如何界定成功的复制了“我”,如果没法界定就没法闭环。2.假设真的100%复制了此刻的“我”,也很难随时100%同步。3.人是主观的,即便1和2都成立,大概率只接受理想中的自己,而非真实的自己。
Cell细胞:可以换个场景从内容消费者视角看 https://www.xiaoyuzhoufm.com/episode/686dd81f60f8f77d4091453a
阿互
阿互
2025.7.16
我觉得产品逻辑很绕,而且坦露自己的内心,我会保持慎重,交给一个靠不住的东西,我九成九是不愿意的
Hiraethhome
Hiraethhome
2025.7.15
Ummm使用AI的最终目的是用TA作为我和外界所有沟通的代理,甚至我的情感表达也由TA代劳? 这点我实在不是很能认同。这期节目的录制是由嘉宾的secondme 代劳的么?
李朗雪
李朗雪
2025.7.16
去年也想着做上载智能这件事,看到了心识宇宙这个项目,一直在追踪,听了陶总两期播客,真的都很有启发!包括我也很想做用agent代替自己快速和别人的agent聊天,帮助筛选伴侣,效率党表示真的很想要这个应用!但去年后来又想了想,那么多的分身、数字生命,这个已经拥挤不堪的世界会不会变得越来越拥挤了。
Rebecca_Rpnc
Rebecca_Rpnc
2025.7.15
30:27 人生三种关系,自我与物理世界的,自我与他人的,自我与自我的。能尝试去优化第三种关系,本身就蛮有意义!
第二人生
第二人生
2025.7.15
非常有质量的一次交谈,只有真正下场去了解陪伴,才能知道和为“陪伴”,愿意分享真实想法、脆弱与需求,让彼此进入“可被看见”的层面。欢迎一起探讨分享
鬼大师
鬼大师
2025.7.14
33:50 我还是我,他也是我。感觉就是造了个概念。
ParisLilijo
ParisLilijo
2025.11.06
这个可以做“screen interview”给交友软件,哈哈
HD776699d:这才是一个真的有解决问题的场景
岩韧
岩韧
2025.10.23
我,就这么一个平凡的我,宇宙里的一粒尘埃而已,我不知道有什么理由要建立一个second me
nata_XcJF:理由就是购物网站想更懂你
芝麻_5fRg
芝麻_5fRg
2025.7.18
好奇这个模型会强化自己的缺陷和不足吗?
nata_XcJF:先想想会有多少人愿意把自己的负面真实坦诚地喂给AI?
Cell细胞
Cell细胞
2025.7.15
51:00 哇 前几天录了一期播客 很多观点和大佬一样 小火炉播客争议背后:一个技术乐观主义者的播客探索
HD981465b
HD981465b
2025.7.15
有没有可能它的潜在客群是ToB,ToC只是让它更“强大”而已
nata_XcJF:C端自愿把海量个人数据交给平台让平台去打包卖给B端是吧😏
nata_XcJF:不是否认你说的,而是听起来嘉宾目标确实就是这个😏
豆包上面不就可以训练一个用你自己声音、自己思维的ME identity 了吗?
xstarcity
xstarcity
2025.11.29
刚看到一个思路,要完成这个转变,必须有一个了解每一个人的llm,或许是second me的一个应用场景?

Karpathy 认为,我们正在经历一种心态转变。

从为另一个人写作,转向为 LLM 写作。

这个视角的转换太绝了。

在这个新范式下,写作者的任务不再是降维或者是修饰。

而是尽可能清晰准确,逻辑严密地把信息喂给 LLM。

一旦 LLM 彻底理解了这个概念,它就成了那个终极的中介。

它面对小白用户,可以把你的思想翻译成大白话。

它面对专家用户,可以提炼出你最硬核的逻辑。

它甚至可以把你的文字转化成苏格拉底式的对话,或者是代码,或者是图表。

Karpathy 的这个洞察,让我意识到 AI 正在重构知识传播的底层协议。
xstarcity
xstarcity
2025.11.17
1:11:29 这让我想起昨天听到一期节目,曼祺问工具调用为什么要训练到大模型里面,而不是通过agentnt的直接调用?瞬间想起我们一个线上实时对话agent曾经各种问题案例,很多问题必须在用户的真实场景里面才会暴露出来,如果有个second me估计能瞬间总结的很好。

这种场景还有很多,所有过往经历很多需要总结的时候,这个自我记忆有用
听下来感觉和社交媒体对社会,对青少年的影响类似:越来越多的伪人,以及,因为缺乏与真实世界连接而导致的精神健康问题 😅
FinnYan
FinnYan
2025.9.16
确实一旦理解了做 me 的这个观点,真的就能认可并认为这是合理的未来
宛若20年前的黄仁勋……大有可为