AI时代我们为什么还是必须人工转录?

AI时代我们为什么还是必须人工转录?

42分钟 ·
播放数3741
·
评论数15

内容简介

访谈转录工作是口述历史项目实施过程中的关键一环,而传统课堂培养缺少对这一环节的详细指导。本期节目中,茉莉留声机团队成员将带来转录稿制作的一手经验与感悟。

嘉宾介绍

Alma:在历史和人类学田野漫游的社会学人。

阿真:长期唠陈嗑导致永久性头部损伤的口述历史工作者。

呆西:一边算钱一边转录的口述历史爱好者。

七斤:没有被迫营业只是丧感很重的设计史研究者。

Shownotes

01:56 什么时候做?谁来做?理想与现实之间的权衡

08:17 AI转录?是基操但要降低预期

09:23 茉莉成员怎样校对AI转录稿?

11:47 转录稿的面貌是准确率和效率平衡的结果

12:35 实操中的不同版本:逐字稿、“完整稿”和受访人审核稿

17:04 技术之外,难以被不同大脑统一的标点符号

22:39 口头禅、冗词、口误和脏话——删还是不删?

23:40 表情、肢体动作、情绪、氛围——社交线索怎么记录?

26:05 专业术语与时空背景的调研与查证

28:13 从口语到文字的挑战——如何书写方言?

35:18 心路:转录“小事”要“躬行”

关于变声茉莉

「变声茉莉」是口述历史组织「茉莉留声机」推出的一档泛文化播客。在这里你可以听到各种口述历史实践、先锋的人文社科议题、超高浓度的成长秘籍和犀利的轰炸场面!欢迎订阅节目,让我们一起把学术研究和公共讨论玩出新花样。

关于茉莉留声机

「茉莉留声机」是为公众提供优质口述历史教育和服务的非营利性组织。「留声机」是口述历史的技术缘起,也代表了我们客观、严谨、真实的立场与态度,「茉莉」则象征我们扎根中国、与世界对话的本土实践。从2019年成立至今,我们已获得超过二十万次阅读,聚集逾一万名订阅者,触达约十万名泛受众。欢迎关注微信公众号「茉莉留声机」了解更多。

创作团队

主持|Alma

嘉宾|阿真 呆西 七斤

策划|江泓 伏杨

音频制作|李司晨 伏杨

视觉|陈星楠

运营|碴子

展开Show Notes
变声茉莉
变声茉莉
2025.5.01
置顶
转发一位读者在茉莉留声机交流群里提的问题:正在做一个族群变迁的口述历史(其中部分内容涉及方言),受访人虽散布各地但都会方言,在访谈前是否要提醒他用方言谈,还是顺其自然他用哪一种方式谈都行?另外,如果是顺其自然按对方选择的语言记录,会否在同一个项目中出现一些词义的转录前后不一致的表达问题?🤔@阿真
阿真拖拉机:通常来说,以历史调研为主要目的的口述历史项目,会尽可能让受访者在“自然状态”下进行叙述,即如果没有研究者的介入,他们会如何回忆和讲述这段历史。对于叙述中方言的使用和出现是研究者非常愿意关注的,因为语言使用/切换的背后可能是特定历史时期文化特征的体现,也可能是特定内容在官方语言中的不可言说性的表征,还可能是受访人“乡音寄托”背后情感的流露。 听众谈到的词义的一致性问题,这是所有口述历史访谈都会遇到的,因为语言的丰富性,即使是在同一种语言的叙事下,也会有一词多义,同义表达的情况出现。如果是在转录阶段,这个问题可以通过词汇对照表的编纂、转录稿批注等方法解决。如果涉及更进一步的内涵挖掘,则需要研究者自己按照研究需要制定分析方案,对关键词和主题进行同义归类、重复剔除、一致性统筹等工作,那更多多涉及的就是研究分析的技艺,而不单纯是转录问题了。 当然,对访谈语言进行选择本质上还是取决于项目目标,如果调研除了历史研究还有对方言史料收集的关注,可以选择要求受访人使用特定语言进行讲述,又比如项目有后期视频制作和转化的需求,要考虑观众的观看理解成本,那么请受访人用官方通用语言来讲述或许是更合适的选择。 以上供大家参考。
这几天就是因为整理机器转录音文字,非常烦躁,工作量太大了,头疼!不过要是自己听录音整理,更崩溃!
almaa:AI打底,人工精进😄
blueleon
blueleon
2025.5.06
比起感叹号,还可以在括号后面写上更多,定性研究不光关注语言,受访者的肢体,情绪,表达方式,都可以被详细记录在案~ More detail~ more close to the context.
肥而不腻
肥而不腻
2026.4.03
36:14 为什么一定要转录文字呢?在音频或者视频文件上,直接剪辑(跟转文字的删减逻辑一样),呈现字幕。这么一个带字幕的视频(音频)文件,作为输出或者展示,不行吗?现在科技也支持在视频中语音检索,或许这是未来工具或者流程的一个方向之一。(门外汉幼稚发言)
阿真拖拉机:谢谢你的问题,是非常有价值的思考!我从「为什么一定要转录文字呢?」和你说的那种方式会怎样发展两个方面说说我的看法。 作为口述历史一线从业者,做转录稿依然是目前行业内的规定动作,原因主要和口述历史项目的成果转化相关,具体来说,有以下三点: 首先,在我们的播客里有提到,其实绝大多数口述历史访谈作品在现阶段与读者见面的形式依然是文本(无论是书籍、专著、公众号),聆听一个小时音频获得的信息量和阅读一个小时还是非常不同的,将录音转化为转录稿或进一步加工为文本作品能够为受访者和作品争取到更多的观众。 其次,在进行口述历史调研的时候,我们的资料来源不仅只有单个受访人的访谈录音,还会有大量的文献资料、日记、书信、新闻报纸等等,要在不同载体类型的史料中进行交叉验证和系统分析,比如词频分析、关键词提取、话语分析等等,如果没有转录稿,就很难进行,目前的技术还难以实现文本、图片、视音频资料之间的互相验证;同样的,如果访谈受访人数量众多,在不同受访的证词和回忆之间进行历史分析,用视音频操作的效率也会非常低。 第三个原因就是伦理的考察,很多口是历史访谈涉及到受访人的隐私、或是敏感信息,在转录编辑过程中我们需要进行大量的脱敏、匿名处理,而这些处理大多数时候不是简单的替换,还需要查证、脚注说明,并与受访人核对等等,如果直接用音视频处理一方面技术依然达不到,另一方面也会造成音视频听起来失真。 你说的技术和发展方向当然是好的,我们也很希望有朝一日技术能够做到精确定位、多载体融合互证、高效索引,让更多人能够高效聆听到自己想对话的「过去的声音」,但就像我们在播客里分享的,口述历史本身是关于人的工作,具身地进行对话、转录、分析(转录本身也是一种分析),能收获的到知识、洞见、感受、思考,或许是外部的工具永远难以替代的。 个人见解,供你参考。
肥而不腻:感谢,学习了
无意间选择来听的播客,才发现我曾经做过的类似任务(不同于主播们的口述历史,我的任务主要是调研内容的转录哈)竟然还有这么多门道!amazing funny!!
变声茉莉
:
欢迎关注,我们后续会为大家带来更多的类似内容~
文龙福村
文龙福村
2025.5.06
很有意思的一期👍
变声茉莉
:
感谢支持~
almaa
almaa
2025.4.30
19:07 哈哈哈哈哈哈
那么问题来了,哦,噢,喔,Oh,到底第四个wo是什么,是什么啊啊啊啊
Eli_Castro
Eli_Castro
2025.4.30
很有收获!