125: 用AI复刻一个「我」,与心识宇宙陶芳波聊身份模型晚点聊 LateTalk

125: 用AI复刻一个「我」,与心识宇宙陶芳波聊身份模型

127分钟 ·
播放数7935
·
评论数40

「感觉自己永恒了。」

本期节目的嘉宾,心识宇宙创始人陶芳波有一套自己的 AI 助手分类法,分类标签都是人称代词:

第一类 AI 助手主攻陪伴,对应人称代词 her,就像电影《她》中承接主人公各种情绪的“萨曼莎”;第二类助手负责执行具体任务,类似《钢铁侠》中的智能管家“贾维斯”,对应人称代词 him。

陶芳波创立的心识宇宙(Mindverse),正在做第三类 AI 助手:me。他们想帮用户复制自己的“第二自我”,构建“身份大模型”(AI Identily Model)。这模型的认知、偏好、价值观和用户个人对齐,能代表用户发起、完成或验收工作。

创业前,陶芳波一直沿着 AI 研究的主线前进。他先后就读于清华大学、伊利诺伊大学香槟分校,毕业后第一份工作是在 Facebook 使用机器学习方法挖掘社交关系,随后到阿里达摩院神经符号实验室,调动跨学科知识,让 AI 模拟人脑。GPT-3 到来后,他决定下场创业。

陶芳波认为,当下已经有足够多的工具满足用户的日常需求。普通用户可能并不需要更多 AI 技术加成的工具,但需要一个 AI 版的第二自我,代理自己去和世界交互。

大部分创业公司让模型和用户对齐的方式还是把历史对话、用户偏好等内容作为上下文输入模型,每个用户使用的底层模型相同,只有上下文不同。心识宇宙团队则主张根据用户数据微调模型,把记忆、情感、价值观参数化。

除了打造身份模型的方式外,陶芳波还在本期播客中分享了身份模型的具体使用场景,以及如何通过产品设计让身份模型和用户“共生”,由此减少用户上传数据的阻力、方便身份模型迭代。

在陶芳波的终极想象里,人人拥有身份模型,意味着现实中运行的社会网络可以被复制到线上,不过在线上交互的 AI 不受人类打字、讲话速度限制,效率更高。身份模型替代人类收发任务、相互协作,人们将会从被迫使用各种工具的状态中解放出来。

本期嘉宾:心识宇宙创始人 陶芳波(即刻 @Tao水木八公

时间线跳转:
- 边创业边研究机器学习的 9 年求学生涯
01:52 大四开始第一段创业,做微博时代的达人撮合平台
04:21 读博前,自由度更高的神经网络成为显学
07:00 专攻数据挖掘方向,建模恐怖分子组织架构
10:56 读博期间的另一个创业项目:学生外卖

- 从 Facebook 到阿里,做能参与人类社会活动的 AI
13:33 既然 AI 有自主性,就要做有社会参与的 AI
16:13 过于发达的工具,让人成了工具的接口
19:28 毕业后,先去 Facebook 为社交网络建模
20:51 阿里时期,阅读认知科学、禅宗相关的书,思考如何造人

- 创业与重定向:从做 him/her 到做 me
25:46 GPT-3 出现,亲自下场的时候到了
28:16 Mindverse 重定向,从做 him/her 到做 me
33:03 用户训练完身份模型后,“觉得自己永恒”了
35:33 两个 AI 身份项目:Me.bot 开箱即用,Second Me 对外开源
37:26 不是 AI 分身,而是 AI 身份
44:04 Me.bot 的最新功能:共鸣、Talks
01:14:02 大量需要一个 AI 身份介入、互动的场景已经存在了
01:17:40 中国互联网数据孤岛和 AI 的通用性矛盾,一定会被打破
01:19:49 用开源模型、本地训练的方式帮用户克服递交数据的心理壁垒
01:23:31 设想中的商业模式:身份即服务

- 身份模型的训练方法
01:25:36 不用 RAG,把对个人的理解内化在参数中
01:29:37 把客观数据变成主观数据,重新抽象、总结
01:36:30 微调不会让模型忘掉知识,但可以放大个人相关的知识
01:39:19 公司周年庆上,身份模型预测出自己的讲话内容
01:41:41 一百份思考、一百份笔记,足够训练出一个 Second Me
01:42:43 模型应该每天微调一次,就像人每晚睡觉时形成记忆
01:44:36 只有让 AI 和用户“共生”,才能降低传输数据的阻力

  • 相信非共识项目有成为共识的那一天01:49:35 大厂有更多数据,更适合做身份模型,但小公司没负担、更高效01:53:00 买量不可取,更希望通过口碑获取用户01:54:54 不赶 AI Agent 的热门,2026 可能也是身份模型之年

剪辑制作:甜食

本期主播:孙海宁(微信 @_HaydenSun)
![]hv.z.wiki

☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆

欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。

请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。

关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:

展开Show Notes
很怕这种蒙眼狂奔的CEO,想得可能还没主持人清楚。对于实际落地问题都选择打太极相信自己。问产品模式是不是依赖规模效应,怎么解决?回答是增长靠口碑产品做好总能解决; 问产品数据壁垒是个人数据,像微信是这样的不是更有优势,答案是认知更重要,认知就能颠覆大厂; 商业模式没想清楚没闭环,理想是出售个人模型给大平台,收分成。这得多大的ME规模?大厂才愿意来付费调用你平台的个人数据。模型训练成本是一天一美金,数据不上云,训练好的模型才上云,那就是在端侧训练,一美金成本是安装ME.bot的人出?如果只是讲故事那也漏洞百出。。。。
Cell细胞:有个可用阈值的 https://www.xiaoyuzhoufm.com/episode/686dd81f60f8f77d4091453a
浩Sean:确实漏洞百出,但作为一个科学家创业,也还能理解,实际上这里面有不少内容是对做某些方向的人是有启发的
用了一天,感觉这不是就是带记忆的 llm,那我为啥不用 chat gpt 和 Gemini 呢,模型能力又强又会说话。
Kevin_Hb4c
Kevin_Hb4c
2025.7.14
gpt3出圈时,我也是第一时间想到和陶博士同样的思路,但些点我没想通与博士交流一下:1.如何界定成功的复制了“我”,如果没法界定就没法闭环。2.假设真的100%复制了此刻的“我”,也很难随时100%同步。3.人是主观的,即便1和2都成立,大概率只接受理想中的自己,而非真实的自己。
Cell细胞:可以换个场景从内容消费者视角看 https://www.xiaoyuzhoufm.com/episode/686dd81f60f8f77d4091453a
阿互
阿互
2025.7.16
我觉得产品逻辑很绕,而且坦露自己的内心,我会保持慎重,交给一个靠不住的东西,我九成九是不愿意的
李朗雪
李朗雪
2025.7.16
去年也想着做上载智能这件事,看到了心识宇宙这个项目,一直在追踪,听了陶总两期播客,真的都很有启发!包括我也很想做用agent代替自己快速和别人的agent聊天,帮助筛选伴侣,效率党表示真的很想要这个应用!但去年后来又想了想,那么多的分身、数字生命,这个已经拥挤不堪的世界会不会变得越来越拥挤了。
Hiraethhome
Hiraethhome
2025.7.15
Ummm使用AI的最终目的是用TA作为我和外界所有沟通的代理,甚至我的情感表达也由TA代劳? 这点我实在不是很能认同。这期节目的录制是由嘉宾的secondme 代劳的么?
Rebecca_Rpnc
Rebecca_Rpnc
2025.7.15
30:27 人生三种关系,自我与物理世界的,自我与他人的,自我与自我的。能尝试去优化第三种关系,本身就蛮有意义!
第二人生
第二人生
2025.7.15
非常有质量的一次交谈,只有真正下场去了解陪伴,才能知道和为“陪伴”,愿意分享真实想法、脆弱与需求,让彼此进入“可被看见”的层面。欢迎一起探讨分享
鬼大师
鬼大师
2025.7.14
33:50 我还是我,他也是我。感觉就是造了个概念。
ParisLilijo
ParisLilijo
2025.11.06
这个可以做“screen interview”给交友软件,哈哈
HD776699d:这才是一个真的有解决问题的场景
Cell细胞
Cell细胞
2025.7.15
51:00 哇 前几天录了一期播客 很多观点和大佬一样 小火炉播客争议背后:一个技术乐观主义者的播客探索
豆包上面不就可以训练一个用你自己声音、自己思维的ME identity 了吗?
xstarcity
xstarcity
2025.11.29
刚看到一个思路,要完成这个转变,必须有一个了解每一个人的llm,或许是second me的一个应用场景?

Karpathy 认为,我们正在经历一种心态转变。

从为另一个人写作,转向为 LLM 写作。

这个视角的转换太绝了。

在这个新范式下,写作者的任务不再是降维或者是修饰。

而是尽可能清晰准确,逻辑严密地把信息喂给 LLM。

一旦 LLM 彻底理解了这个概念,它就成了那个终极的中介。

它面对小白用户,可以把你的思想翻译成大白话。

它面对专家用户,可以提炼出你最硬核的逻辑。

它甚至可以把你的文字转化成苏格拉底式的对话,或者是代码,或者是图表。

Karpathy 的这个洞察,让我意识到 AI 正在重构知识传播的底层协议。
xstarcity
xstarcity
2025.11.17
1:11:29 这让我想起昨天听到一期节目,曼祺问工具调用为什么要训练到大模型里面,而不是通过agentnt的直接调用?瞬间想起我们一个线上实时对话agent曾经各种问题案例,很多问题必须在用户的真实场景里面才会暴露出来,如果有个second me估计能瞬间总结的很好。

这种场景还有很多,所有过往经历很多需要总结的时候,这个自我记忆有用
岩韧
岩韧
2025.10.23
我,就这么一个平凡的我,宇宙里的一粒尘埃而已,我不知道有什么理由要建立一个second me
听下来感觉和社交媒体对社会,对青少年的影响类似:越来越多的伪人,以及,因为缺乏与真实世界连接而导致的精神健康问题 😅
FinnYan
FinnYan
2025.9.16
确实一旦理解了做 me 的这个观点,真的就能认可并认为这是合理的未来
芝麻_5fRg
芝麻_5fRg
2025.7.18
好奇这个模型会强化自己的缺陷和不足吗?
宛若20年前的黄仁勋……大有可为
Cell细胞
Cell细胞
2025.7.15
56:08 前几天关于 AI 代替人 做播客 做了一个分享 ,观点好像!http://xhslink.com/m/7F0jOcTpOWo