一年时间从0到1亿美元估值,要做语音领域的Scale AI,为什么语音数据比文本数据珍贵1000倍?

一年时间从0到1亿美元估值,要做语音领域的Scale AI,为什么语音数据比文本数据珍贵1000倍?

10分钟 ·
播放数82
·
评论数0

简介

当大家都在讨论AI走出屏幕进入真实世界时,却忽视了AI学会“说话”前要先“听懂”人类真实对话这一关键问题。David AI这家创业公司在不到一年时间里成为全球顶级AI实验室的重要数据供应商,完成2500万美元A轮融资,致力于解决语音AI高质量对话音频数据极度匮乏的难题,揭示了语音数据在AI时代的巨大价值。

重点内容速览

01|语音AI的数据困境

  • 文本领域有大规模数据集,音频领域缺乏类似“通用爬虫”,且互联网音频多为单声道,非AI语音模型所需的多声道分离格式。
  • 先进端到端语音模型对音频质量要求高,需完全分离的多声道对话数据,当前可用音频数据量远不能满足训练需求,且现有数据集缺乏真实世界对话的丰富性和复杂性。

 02|David AI的解决方案

  • 定位为“音频数据研究实验室”,用严谨态度构建音频数据集,主动研究AI模型发展方向,提前预测数据需求并收集准备。
  • 建立全球性平台,精心设计数据生产系统,根据研究目标设计对话场景,招募合适参与者,用专业录音设备,对收集数据精细后处理和标注。
  • 采用产品化模式,主动开发标准化数据产品推向市场,实现规模经济,降低单位数据成本,可持续性强。 

03|AI进入真实世界的趋势

  • AI从文本时代过渡到多模态时代,语音是关键界面,AI应用从屏幕走向现实世界依赖高质量语音训练数据。
  • 市场对语音数据需求迫切,David AI快速实现八位数年收入,众多科技巨头成为其客户。
  • 数据基础设施领域从“通用化”向“专业化”转变,David AI专注音频数据建立技术护城河,商业竞争力强,有机会成为语音AI时代的基础设施提供商。

 04|David AI的成长历程

  • 创始人在Scale AI共事,匆忙申请Y Combinator,接触机器人公司后找到业务方向,从周末搭建的电话应用起步。
  • 第一个客户合同1000美元,Y Combinator训练营结束时签下第一个六位数合同,几个月后签七位数合同,现与多家科技巨头和领先音频AI实验室合作。
  • 不到一年从1000美元合同到2500万美元A轮融资,再到超1亿美元估值。 

05|投资角度的意义

  • 2500万美元A轮融资由Alt Capital和Amplify Partners联合领投,知名投资机构和前沿音频研究领域天使投资人参与。
  • 投资者带来资金、行业经验和网络资源,Jack Altman加入董事会提供战略指导。
  • 投资者看好从文本到语音的转变趋势,David AI解决语音AI开发者紧迫需求,商业模式简单有效,建立了可持续竞争优势。 

06|对AI行业发展的思考

  • 数据基础设施在AI发展中至关重要,专业化的数据基础设施公司将更重要,满足特定类型数据的复杂精细需求。
  • AI行业从“通用化”向“专业化”转变,特定领域专业化解决方案更有效。
  • 类似“picks and shovels”商业模式,提供基础设施和工具的公司商业模式更可持续。
  • 语音AI发展可能带来人机交互方式变革,降低技术使用门槛,但也会引发隐私安全和社交方式等方面的问题。

嘉宾观点摘录

“现在的公司对数据非常饥渴。David AI的美妙之处在于它解决了语音AI开发者今天面临的紧迫需求,但它也是一个相对简单的解决方案。如果他们需要数据,就卖给他们数据,你不需要把它复杂化。” ——Amplify Partners的Sarah Catanzaro “这很有道理,每个人都知道过去几年一直是以ChatGPT为代表的基于文本的AI,现在每个人都开始想办法将AI引入语音领域。” ——First Round Capital的Liz Wessel

文字版内容

欢迎阅读深思圈文章一年时间从0到1亿美元估值,要做语音领域的Scale AI