125: 用AI复刻一个「我」，与心识宇宙陶芳波聊身份模型

晚点聊 LateTalk

127分钟 ·1 年前

8155

「感觉自己永恒了。」

本期节目的嘉宾，心识宇宙创始人陶芳波有一套自己的 AI 助手分类法，分类标签都是人称代词：

第一类 AI 助手主攻陪伴，对应人称代词 her，就像电影《她》中承接主人公各种情绪的“萨曼莎”；第二类助手负责执行具体任务，类似《钢铁侠》中的智能管家“贾维斯”，对应人称代词 him。

陶芳波创立的心识宇宙（Mindverse），正在做第三类 AI 助手：me。他们想帮用户复制自己的“第二自我”，构建“身份大模型”（AI Identily Model)。这模型的认知、偏好、价值观和用户个人对齐，能代表用户发起、完成或验收工作。

创业前，陶芳波一直沿着 AI 研究的主线前进。他先后就读于清华大学、伊利诺伊大学香槟分校，毕业后第一份工作是在 Facebook 使用机器学习方法挖掘社交关系，随后到阿里达摩院神经符号实验室，调动跨学科知识，让 AI 模拟人脑。GPT-3 到来后，他决定下场创业。

陶芳波认为，当下已经有足够多的工具满足用户的日常需求。普通用户可能并不需要更多 AI 技术加成的工具，但需要一个 AI 版的第二自我，代理自己去和世界交互。

大部分创业公司让模型和用户对齐的方式还是把历史对话、用户偏好等内容作为上下文输入模型，每个用户使用的底层模型相同，只有上下文不同。心识宇宙团队则主张根据用户数据微调模型，把记忆、情感、价值观参数化。

除了打造身份模型的方式外，陶芳波还在本期播客中分享了身份模型的具体使用场景，以及如何通过产品设计让身份模型和用户“共生”，由此减少用户上传数据的阻力、方便身份模型迭代。

在陶芳波的终极想象里，人人拥有身份模型，意味着现实中运行的社会网络可以被复制到线上，不过在线上交互的 AI 不受人类打字、讲话速度限制，效率更高。身份模型替代人类收发任务、相互协作，人们将会从被迫使用各种工具的状态中解放出来。

本期嘉宾：心识宇宙创始人 陶芳波（即刻 @Tao水木八公）

时间线跳转：
- 边创业边研究机器学习的 9 年求学生涯
01:52 大四开始第一段创业，做微博时代的达人撮合平台
04:21 读博前，自由度更高的神经网络成为显学
07:00 专攻数据挖掘方向，建模恐怖分子组织架构
10:56 读博期间的另一个创业项目：学生外卖

- 从 Facebook 到阿里，做能参与人类社会活动的 AI
13:33 既然 AI 有自主性，就要做有社会参与的 AI
16:13 过于发达的工具，让人成了工具的接口
19:28 毕业后，先去 Facebook 为社交网络建模
20:51 阿里时期，阅读认知科学、禅宗相关的书，思考如何造人

- 创业与重定向：从做 him/her 到做 me
25:46 GPT-3 出现，亲自下场的时候到了
28:16 Mindverse 重定向，从做 him/her 到做 me
33:03 用户训练完身份模型后，“觉得自己永恒”了
35:33 两个 AI 身份项目：Me.bot 开箱即用，Second Me 对外开源
37:26 不是 AI 分身，而是 AI 身份
44:04 Me.bot 的最新功能：共鸣、Talks
01:14:02 大量需要一个 AI 身份介入、互动的场景已经存在了
01:17:40 中国互联网数据孤岛和 AI 的通用性矛盾，一定会被打破
01:19:49 用开源模型、本地训练的方式帮用户克服递交数据的心理壁垒
01:23:31 设想中的商业模式：身份即服务

- 身份模型的训练方法
01:25:36 不用 RAG，把对个人的理解内化在参数中
01:29:37 把客观数据变成主观数据，重新抽象、总结
01:36:30 微调不会让模型忘掉知识，但可以放大个人相关的知识
01:39:19 公司周年庆上，身份模型预测出自己的讲话内容
01:41:41 一百份思考、一百份笔记，足够训练出一个 Second Me
01:42:43 模型应该每天微调一次，就像人每晚睡觉时形成记忆
01:44:36 只有让 AI 和用户“共生”，才能降低传输数据的阻力

相信非共识项目有成为共识的那一天01:49:35 大厂有更多数据，更适合做身份模型，但小公司没负担、更高效01:53:00 买量不可取，更希望通过口碑获取用户01:54:54 不赶 AI Agent 的热门，2026 可能也是身份模型之年

剪辑制作：甜食

本期主播：孙海宁（微信 @_HaydenSun）
![]hv.z.wiki

☆《晚点聊 LateTalk》建立「播客听友群」啦！☆

欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流，第一时间收听新节目。
这里有更多互动，更多话题讨论。欢迎贡献选题 & 推荐嘉宾。

请先添加「晚点」小助手的微信号，备注：“晚点聊”，我们邀请您入群。

关注公众号《晚点 LatePost》和《晚点对话》，阅读更多商业、科技文章：

展开Show Notes

JA产品稽查官

2025.7.15

很怕这种蒙眼狂奔的CEO，想得可能还没主持人清楚。对于实际落地问题都选择打太极相信自己。问产品模式是不是依赖规模效应，怎么解决？回答是增长靠口碑产品做好总能解决; 问产品数据壁垒是个人数据，像微信是这样的不是更有优势，答案是认知更重要，认知就能颠覆大厂; 商业模式没想清楚没闭环，理想是出售个人模型给大平台，收分成。这得多大的ME规模？大厂才愿意来付费调用你平台的个人数据。模型训练成本是一天一美金，数据不上云，训练好的模型才上云，那就是在端侧训练，一美金成本是安装ME.bot的人出？如果只是讲故事那也漏洞百出。。。。

Cell细胞:有个可用阈值的 https://www.xiaoyuzhoufm.com/episode/686dd81f60f8f77d4091453a

浩Sean:确实漏洞百出，但作为一个科学家创业，也还能理解，实际上这里面有不少内容是对做某些方向的人是有启发的

共6条回复

依盖队香蕉采购员小李

2025.7.15

用了一天，感觉这不是就是带记忆的 llm，那我为啥不用 chat gpt 和 Gemini 呢，模型能力又强又会说话。

Kevin_Hb4c

2025.7.14

gpt3出圈时，我也是第一时间想到和陶博士同样的思路，但些点我没想通与博士交流一下：1.如何界定成功的复制了“我”，如果没法界定就没法闭环。2.假设真的100%复制了此刻的“我”，也很难随时100%同步。3.人是主观的，即便1和2都成立，大概率只接受理想中的自己，而非真实的自己。

Cell细胞:可以换个场景从内容消费者视角看 https://www.xiaoyuzhoufm.com/episode/686dd81f60f8f77d4091453a

阿互

2025.7.16

我觉得产品逻辑很绕，而且坦露自己的内心，我会保持慎重，交给一个靠不住的东西，我九成九是不愿意的

Hiraethhome

2025.7.15

Ummm使用AI的最终目的是用TA作为我和外界所有沟通的代理，甚至我的情感表达也由TA代劳？这点我实在不是很能认同。这期节目的录制是由嘉宾的secondme 代劳的么？

李朗雪

2025.7.16

去年也想着做上载智能这件事，看到了心识宇宙这个项目，一直在追踪，听了陶总两期播客，真的都很有启发！包括我也很想做用agent代替自己快速和别人的agent聊天，帮助筛选伴侣，效率党表示真的很想要这个应用！但去年后来又想了想，那么多的分身、数字生命，这个已经拥挤不堪的世界会不会变得越来越拥挤了。

Rebecca_Rpnc

2025.7.15

30:27 人生三种关系，自我与物理世界的，自我与他人的，自我与自我的。能尝试去优化第三种关系，本身就蛮有意义！

戈叶普契安勃赫斯列夫

2025.7.17

宛若20年前的黄仁勋……大有可为

第二人生

2025.7.15

非常有质量的一次交谈，只有真正下场去了解陪伴，才能知道和为“陪伴”，愿意分享真实想法、脆弱与需求，让彼此进入“可被看见”的层面。欢迎一起探讨分享

鬼大师

2025.7.14

33:50 我还是我，他也是我。感觉就是造了个概念。

ParisLilijo

2025.11.06

这个可以做“screen interview”给交友软件，哈哈

HD776699d:这才是一个真的有解决问题的场景

岩韧

2025.10.23

我，就这么一个平凡的我，宇宙里的一粒尘埃而已，我不知道有什么理由要建立一个second me

nata_XcJF:理由就是购物网站想更懂你

芝麻_5fRg

2025.7.18

好奇这个模型会强化自己的缺陷和不足吗？

nata_XcJF:先想想会有多少人愿意把自己的负面真实坦诚地喂给AI？

Cell细胞

2025.7.15

51:00 哇前几天录了一期播客很多观点和大佬一样

小火炉播客争议背后：一个技术乐观主义者的播客探索

HD981465b

2025.7.15

有没有可能它的潜在客群是ToB，ToC只是让它更“强大”而已

nata_XcJF:C端自愿把海量个人数据交给平台让平台去打包卖给B端是吧😏

nata_XcJF:不是否认你说的，而是听起来嘉宾目标确实就是这个😏

半山野菩萨

2025.7.14

豆包上面不就可以训练一个用你自己声音、自己思维的ME identity 了吗？

xstarcity

2025.11.29

刚看到一个思路，要完成这个转变，必须有一个了解每一个人的llm，或许是second me的一个应用场景？

Karpathy 认为，我们正在经历一种心态转变。

从为另一个人写作，转向为 LLM 写作。

这个视角的转换太绝了。

在这个新范式下，写作者的任务不再是降维或者是修饰。

而是尽可能清晰准确，逻辑严密地把信息喂给 LLM。

一旦 LLM 彻底理解了这个概念，它就成了那个终极的中介。

它面对小白用户，可以把你的思想翻译成大白话。

它面对专家用户，可以提炼出你最硬核的逻辑。

它甚至可以把你的文字转化成苏格拉底式的对话，或者是代码，或者是图表。

Karpathy 的这个洞察，让我意识到 AI 正在重构知识传播的底层协议。

xstarcity

2025.11.17

1:11:29 这让我想起昨天听到一期节目，曼祺问工具调用为什么要训练到大模型里面，而不是通过agentnt的直接调用？瞬间想起我们一个线上实时对话agent曾经各种问题案例，很多问题必须在用户的真实场景里面才会暴露出来，如果有个second me估计能瞬间总结的很好。

这种场景还有很多，所有过往经历很多需要总结的时候，这个自我记忆有用

邪恶上海青

2025.10.03

听下来感觉和社交媒体对社会，对青少年的影响类似：越来越多的伪人，以及，因为缺乏与真实世界连接而导致的精神健康问题 😅

FinnYan

2025.9.16

确实一旦理解了做 me 的这个观点，真的就能认可并认为这是合理的未来

打开小宇宙查看更多精彩评论