E147|Suno引爆音乐圈,与音乐人聊聊AI生成音乐与艺术的随机数

E147|Suno引爆音乐圈,与音乐人聊聊AI生成音乐与艺术的随机数

68分钟 ·
播放数10121
·
评论数53

AIGC的风终究是吹到了音乐圈——今年3月,“音乐届的ChatGPT” Suno V3粉墨登场,用户只需要在Suno上输入一句话的提示词,即可在数秒内生成两首两分钟的完整歌曲,从作词、作曲、演奏到人声演唱一气呵成,大大降低了普通人创作音乐的门槛。

已经习惯了各类“AI歌手翻唱”的听众和用户迅速拥抱了Suno,从《宫保鸡丁咏叹调》到《让我们荡起双桨》重金属,从英语、日语、俄语到普通话甚至是粤语,网友们自发上传的作品包罗万象,网易云音乐、QQ音乐等平台也迅速上线了SunoAI音乐专区,甚至还推出了定期更新的官方推荐歌单。

本期《硅谷101》邀请到了来自音乐和AI音乐生成领域的两位嘉宾,分享他们对以Suno为代表的文生音乐模型的看法,以及AI如何影响音乐产业的未来。

【主播】
泓君Jane,硅谷101创始人,播客主理人
【嘉宾】
冯建鹏,美国哈特福德大学哈特音乐学院打击乐讲师,百老汇全职演奏家,知名音乐博主“叨叨冯”(Youtube@daodaofeng)
Roger Chen,Meta Music Tech Lead

【你将听到】
02:26 为什么大家感觉是Suno是最火的呢?因为他敢最先把自己的文生音乐模型公之于众
02:43 【测评一】“找不到工作的悲伤摇滚乐”,结果并不悲伤
07:30 能听但没有态度,AI只能写出不愤怒的摇滚乐
11:02 AI写的歌可以达到业界平均水平,但无法出挑成为头部作品
14:40 速度是音乐创作最重要的指标之一,为什么AI写不出80 BPM的音乐?
18:26 AI写歌与人类作曲不是一个逻辑,只能从左到右按顺序写,没有全局观
22:07 训练素材足够全面和丰富,AI可能写出Taylor Swift水平的歌曲?
25:55 同样的音乐,水平不同的演唱者演奏出来也不一样
27:20 【测评二】英雄主题的交响乐,听感能得7分,作为乙方它不及格
33:40 Suno不能按提示词生成指定的乐器,它只追求听上去大概相似
37:48 AI生成音乐是无法抗拒的洪流,但暂时做不到像音乐家一样写歌
43:13 【测评三】挑战规则严谨的赋格,Suno会表现得更好吗?
47:05 赋格研究在AI音乐有20年历史,不过在巴赫的原曲面前还很稚嫩
52:32 音乐技术与心理学:Mp3技术是如何被发明出来的?
53:57 音乐的本质是“有组织的声音”,这是文生音乐大模型的底层逻辑
58:58 最怕无聊?艺术需要跳出人类总结
63:12 创作者的脑洞大开:在音乐里加入随机数机制

【提示词参考】
开场曲
《The future is now》 by Suno, an opening music for a podcast called Silicon Valley 101, discussing innovative technology, AI and business stories, jazz, easy, catchy.
【测评一】
05: 56 《Struggling in the shadows》by Suno, sad story of not finding a job, Classic Rock, 80 BPM, Guitar, Base, Drum, Keyboard.
【测评二】
27:46/29:42 《Hero themed symphony》by Suno, instrumental, strings, woodwinds, brass, timpani
【测评二】
30:27 《Hero themed symphony》by Suno, instrumental, strings, woodwinds, brass, timpani, Classical, 19th century.
【测评三】
46:21 赋格曲 by Suno,Toccata and Fugue in D Minor. Dark and dramatic, featuring solo organ creating a serious and powerful mood.
结束曲
《Silicon Pulse》 by Udio, closing note for the episode of AIGC music, hip pop, extended intro and outro.

【补充信息】
BPM
beats per minute,度量速度的音乐单位,每分钟多少拍(BPM)表示一个指定的音符,例如四分音符,在一分钟内出现的次数,BPM的数值越大代表速度越快。

Fairly Trained:
由来自前Stability AI、Humanistic AI等科技公司高管、知名好莱坞律所和音乐界人士发起的非盈利组织,对涵盖图像、音乐和歌曲生成的人工智能模型进行认证,证明他们已申请使用受版权保护的训练数据的许可。

赋格:
为拉丁文“fuga”的译音,是盛行于巴洛克时期的一种复调音乐体裁,又称“遁走曲”,是复调音乐中最为复杂而严谨的曲体形式。赋格的结构与写法比较规范。乐曲开始时,以单声部形式贯穿全曲的主要音乐素材称为“主题”,与主题形成对位关系的称为“对题”,之后该主题及对题可以在不同声部中轮流出现,主题与主题之间也常有过渡性的乐句作音乐的对比。

掩蔽效应:
是指由于出现多个同一类别(如声音、图像等)的刺激,导致被试不能完整接受全部刺激的信息。具体分为视觉掩蔽效应和听觉掩蔽效应。其中,听觉掩蔽效应是指人的耳朵只对最明显的声音反应敏感,而对于不敏感的声音,反应则较为不敏感。例如在声音的整个频率谱中,如果某一个频率段的声音比较强,则人就对其它频率段的声音不敏感了。

卷积神经网络(Convolutional Neural Network,CNN):
卷积神经网络是一种深度学习网络,主要用于识别图像和对其进行分类,以及识别图像中的对象。在卷积神经网络 (CNN )出现之前,人们通常使用耗时的人工特征抽取方法来识别图像中的对象。现在,卷积神经网络提供更加可扩展的方法来执行图像分类和对象识别任务:卷积神经网络利用线性代数原理(特别是矩阵乘法)来识别图像内的图案。卷积神经网络从其他神经网络中脱颖而出的地方在于:卷积神经网络在图像、语音或音频信号输入方面表现出超高的性能。

【监制】
杜秀
【后期】
AMEI
【Shownotes】
杜秀

【BGM】
The future is now——Suno & 杜秀
Lazy Art - Martin Landstrom
Bubble Bee - The Fly Guy Five
Silicon Pulse —— Udio & 杜秀

【在这里找到我们】
公众号:硅谷101
收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客
海外用户:Apple Podcast|Spotify|TuneIn|Youtube|Amazon Music
联系我们:podcast@sv101.net

Special Guests: Roger Chen and 冯建鹏.

展开Show Notes
嘉宾对suno的缺陷一针见血,没法很好地契合使用者的情绪和表达。但根据我的经验,只要生成量够大,还是能做出出彩的旋律,其实跟人类自己作曲也是一样的
豆Jayce:又是prompt engineer的范式
Y_Qpvx
Y_Qpvx
2024.4.19
认同叨叨冯的观点,目前ai用的是统计学,音乐是有理论逻辑的。但是如果让ai学习底层逻辑理论的话,很快就能满足甲方需求了,只要需求提得清晰。
但个人还是认为ai创作的能力很快就能追上人类,因为进化速度太快了。
QUEEN-KONG
QUEEN-KONG
2024.4.22
作为个画画的,听嘉宾解释ai对音乐理解还有哪些不足的时候就想起了几年前的自己,那时候也对各种新软件产出的图分析程序理解上还有些什么问题、人工参与能改进什么,但要不了多久就。。。。大家都被大数据榨汁了TへT音乐面对ai最大的护城河可能是那帮律师搞出来的超强版权法
感觉嘉宾对suno 的细节不是特别了解哎。自定义模式可以用元标签控制歌曲各部分的风格,比如插入一段rap,也可以插入间奏和指定乐器
cyh_D4Oy:是的,有intro、verse、bridge、chorus、outro之类的标签来标记歌词段落,这样才会有开场有递进有高潮。而且也需要一定量随机找到符合自己口味的旋律。嘉宾和主持人可以再多调研一下。
作为访谈主播,好佩服鸿君,录制水平已经举重若轻了
小帅_美国加拿大华人访谈:* 泓
我的播客“能源聚宝盆”每一期的结尾都是AI中文说唱,而且歌词是我自己写的,歌词在第一期show notes就有
星辰大海的边界:厉害了
电力小师太:来来来,你也可以,用你的声音
Anttrush
Anttrush
2024.4.22
居然能在这儿碰到叨叨冯老师😝之前在B站看过他的视频,挺有启发性的。
另一位嘉宾一开始发言就惊艳我了,后来一说果然是交叉学科的人才。
最后还是夸夸泓君,功课做的很足,主持水平还是这么赞!
Neorwell
Neorwell
2024.4.22
最后两位嘉宾的讨论让我想起了刘慈欣写的小说“诗云”。尽管可以利用技术穷尽所有的排列组合从而生成所有的诗篇,但是哪一首才是真正能打动人的呢?恐怕还是需要人来判断。也许有一天能够实现,那将是一种怎样的智慧生命,无法想象!
蛮够意思的一期,蹲个视频版~
硅谷101陈茜:大概五月初上线 😊
卡比巴拉巴拉巴拉:好嘞👌🏻
杰森仙森
杰森仙森
2024.4.19
主持人逻辑清晰,问题一针见血。嘉宾叨叨冯专业度更是没话说。不过作为外行,感觉生成的音乐都还挺好听的
大爷快照
大爷快照
2024.4.23
52:12 我本科学的也是类似的东西 学了超多先锋音乐 然后毕业作品做的事随机生成音乐的一个小装置... 真的超级打开思维
不只是音乐 包括电影 文学 画作 我觉得都是这个道理…虽然内行可能会有一些对于前景的自私的想法 但也无法阻止ai创造的可能 甚至觉得哪天真的能实现 ai创造出好的作品也非常值得期待
Neorwell
Neorwell
2024.4.22
最后两位嘉宾的讨论让我想起了刘慈欣写的小说“诗云”。尽管可以利用技术穷尽所有的排列组合从而生成所有的诗篇,但是哪一首才是真正能打动人的呢?恐怕还是需要人来判断。也许有一天能够实现,那将是一种怎样的智慧生命,无法想象!
ikrf
ikrf
2024.4.20
感觉ai还不能理解“沉默”或者说“空白”对人类情绪的影响,和真人作品相比,ai的作品总是很“满”,好像音乐就一定要时刻有音符,而人类作品中会有很多长拍或者空拍来影响人的预期
57:08 挺有趣的,用理性解释感性思维
嬴嬴嬴
嬴嬴嬴
2024.4.19
听了这么多期,发现女嘉宾的逻辑更清晰,更言之有物,听感更好,我们想听更多女性的声音!社会对男的要求很低,大概率划水没有逻辑爹爹不休,真的劝退!
孤寡老人_mX3H:53:47 我听完了.真的觉得你是没事找事.不尊重嘉宾.不尊重播主.也不尊重女权.
嘿你们在说啥呢:啊?
6条回复
悠灵的灵
悠灵的灵
2024.4.20
是的!一部水片的电影配乐
28:37 感觉这一段还挺好听的😂
15:30 哀乐里一些片段就是取自以前的音乐,并放慢速度
belindajx
belindajx
8天前
最后的这段ai嘻哈音乐可以用惊艳来形容…………