年中特辑:用AI克隆自己,我们做了一个纪录片

年中特辑:用AI克隆自己,我们做了一个纪录片

29分钟 ·
播放数1195
·
评论数25

当你听到一个和自己一模一样的声音在说话,而那并不是你,会是什么感觉?这一期,我们决定拿自己当材料试一试。

这是一期实验性的声音纪录片,我们打算用AI克隆自己的声音,自动生成一期短节目周报,并把制作和讨论的过程记录下来。

最初,想讨论的问题看来很简单:AI声音能取代真人播客吗?但拿着这个问题去问了其他主播、技术开发者、运营和市场人员,自己也进行了多次讨论后,我们发现,大家的想法远不止于技术本身,这场讨论的复杂程度不断升级。

我们听一个人说话,究竟是在听什么?是内容,是声音,还是声音背后那个具体的、会犯错的人?

一种声音说,真正难的从来不是让AI像人,而是它能不能承载播客最令人珍视的东西:信任,真诚,和陪伴。

另一种声音问,信任和陪伴因何成立?那些以错误、空白、犹豫为表现的真人时刻,真的不可替代吗?当从小与AI对话长大的一代人出现,我们今天对真人的执着,会不会只是一种迟早被重新估价的偏爱?

这期节目不提供答案,我们只想把寻找答案的过程呈现给你。这些讨论之后,AI周报已经成了最不重要的成果,你可以在结尾听到它。也别错过最后凌乱而真实的彩蛋。

-就这么愉快地决定了-

00:54 我们要做,声音纪录片

04:03 越来越复杂了

06:25 直到剪辑师告诉我,我才知道音频是假的

06:47 口齿不清的师兄,可以做视频号了

-“不对”-

07:27 AI周报第一版

10:35 我的数字人跟我很像,但就是说不上来哪里不对

12:37 嘉宾哽咽了几秒,我觉得这期有了

13:40 新时代忒修斯之船

-信任-

15:20 “Mengyi是真人吗?”

15:59 人的完全暴露,是真正动人的地方

16:48 播客的投放产出比很低,品牌为什么还要投

18:03 气口、停顿、嗯嗯啊啊其实都可加进去

-高估?-

18:58 人是假的,情感是真的

22:13 轻易可替代的与难以替代的

24:14 正因为你有鼻炎,所以我选择睡前听

24:42 顿挫感反而让我很舒服

-尾声-

26:31 AI周报

28:32 彩蛋

感谢以下朋友的真人声音出镜(按出场顺序排列):

丁教 声动活泼联合创始人 CEO,科技早知道主播

Koji 十字路口创始人

刘飞 半拿铁/三五环 主播

段玉龙 北京广播电视台主持人

雨白 有知有行内容主编,播客《知行小酒馆》《不熄灯》主播

Nixon 《脑放电波》主播,硬件产品经理,前媒体记者

安替 国际新闻人

欧里 前播客平台运营

小方 美妆大厂营销人

璟怡 医疗健康品牌数字营销经理

徐文建Kris Cola/ListenHub 联合创始人 & CTO

冯雷Leo Cola/ListenHub 创始人 & CEO

主播:明月 国荣 游识猷

脚本:明月

后期:Yann

欢迎收听果壳时间,这是一档果壳推出的播客节目,主播们会和嘉宾一起,提供多学科视角,还原科技的复杂性,将热议话题深挖一层。

你可以在小宇宙、苹果播客、喜马拉雅、网易云音乐、微博、QQ音乐、豆瓣、荔枝、Spotify等平台找到我们。

欢迎留下评论,你的意见对我们很重要。

展开Show Notes
置顶
这期半小时的节目,用了比以往多很多的制作精力,算一次新尝试。欢迎大家留言说说你们听结尾AI声音的感受,会难受吗?能坚持听完两分钟吗?😂
这期辛苦啦
明月odette
:
谢谢刘飞老师支持
Alan_Lee
Alan_Lee
6天前
除了羽白和其他嘉宾说的情绪、音色这些因素,我觉得AI模仿明月老师声音更像、游识猷老师声音更容易被听出来可能和两位老师的语速、字与字之间的拖音和发音方法有很大关系(就像南北方言的差异,南方方言发音更复杂,游老师虽然普通话发音很好,但还是能听出来是福建或者周边方言区的人,就是说话时发音方法的区别)。AI在模仿人声音的时候还不能理解语意,对字与字、词与词之间的停顿、音节转换甚至个人发音习惯这些细节处理的不好,所以熟悉真人声音的人很容易就听出来了。再加上用僵化的声音处理本该有情绪变化的地方,让人很难长时间集中注意力听下去。
我觉得ai模仿和真人的声音还是很容易区别的啊。比如每天早上我都会听声动早咖啡,听完以后听一財播客。但假如一財播客是短节目,那主播就是那个ai女声,哪怕只有10分钟,我都听不下去。或者更确切地说,是听不进去。ai的声音几句可以,一旦成段地往外吐,对我来说就很难吸收进脑子。有时候节目的标题明明是感兴趣的,但ai主播也会把我的收听体验全给糟蹋了!
明月odette
:
听AI讲10分钟很长了,我听一两分钟就会爆炸
紫白茉莉:是啊,我也听不下去,所以一听是ai就划走不听了。现在基本上一財播客的十分钟短节目都不太听。但三联数字刊的有些长文也是ai读的,竟然还可以听下去。你要不要试试。
3条回复
后面明月的ai声音完全听不出来,游老师一听就能分辨出来,感觉明月平时说话尾音变化不多,所以ai很好模拟,游老师说话尾音变化很多,ai数据太少模拟不了。
明月odette
:
也是一个可能。我们发现不同的工具跟每个人的声音是否“合拍”也很玄学,需要抽卡的运气,我的声音用另一个工具做出来就贼诡异
略_qdSk
略_qdSk
7天前
明月老师的AI声音真的是AI的吗,真的好像明月老师自己说出来的,除了明月老师偶尔有些句子的结尾有点哽咽感🤔
明月odette
:
大概这个AI跟我很相配😂
Nixon_Hu
Nixon_Hu
8天前
来了,在各位主播都要被迫学习“是否授权声音”的当下,节目很有意义
明月odette
:
谢谢Nixon~
ASAP_otYM
ASAP_otYM
7天前
明月的声音绝对是梦中情声
明月odette
:
哎呀妈呀😅
AGENT橘
AGENT橘
4天前
辛苦了 一年的努力
HD449163c
HD449163c
8天前
游识猷老师采集的时候故意夹起来了吗,跟平常不像啊。
明月odette
:
这也是我们没太搞明白的地方,同一个工具,训练我的声音第一次就很像,但游游的换了好几次素材,效果都不算很好。而换一个工具,我的声音训练出来却很古怪
明月odette
:
哇刚发现这是一位100h+的朋友,非常感谢!
00:35 天呐
明月odette
:
看来没防备的时候真的区别没那么明显?
angel安琪小精灵:简直是一模一样!
3条回复