Akool:第二个Sora引爆AI视频生成

Akool:第二个Sora引爆AI视频生成

7分钟 ·
播放数15
·
评论数0

时间线

  • 2022年: Akool 公司成立。
  • 2024年: OpenAI 发布 Sora,通过文本提示生成电影级预渲染视频,重新定义了人工智能驱动的媒体创作,引起公众关注。
  • 发布功能: Akool 发布 Akool Live Camera 功能,被称为“第二个 Sora”。
  • 商业: Akool 宣布公司年收入达到超过4000万美元 ARR。

人物介绍

  • 陆家骏博士 (Dr. Jiajun Lu): Akool 的首席执行官兼创始人。他在源材料中表达了对 Akool Live Camera 的愿景和影响,认为该技术正在改变视频的制作方式,并在全球产品发布会、企业会议甚至医疗保健等领域开辟新的可能性。
  • AI洞见研究院团队: 该团队对 Akool Live Camera 进行了深度分析和拆解,并在其节目和文章中分享了对该技术的看法和功能介绍。他们在源材料中提供了对 Akool Live Camera 的详细解读,并将其与 Sora 进行了对比。

发布公司: Akool (硅谷AI视频生成公司,成立于2022年)

关键产品/功能: Akool Live Camera (Akool直播套件的一部分)

核心突破/定位:

  • 实时性与低成本: 与 OpenAI 的 Sora 主要聚焦于高质量的预渲染视频生成不同,Akool Live Camera 解决了 AI 视频生成在“实时性”和“低成本”方面的两大瓶颈。
  • 无脚本实时生成: 支持无脚本的实时视频生成,内容根据上下文、语气和观众互动实时生成,无需预录、脚本或后期制作。
  • “实时互动的 AI 拟人化”: 代表一个全新的品类——实时 AI 视频生成,专注于动态虚拟形象的实时响应能力。
  • 模糊实体与数字化身界限: 通过捕捉面部表情、语音和手势等自然人类互动,生成超逼真的虚拟形象,使其能够在当下自然互动,几乎 indistinguishable from real people (与真实人物难以区分),最低延迟为 500 毫秒。

主要功能模块:

  1. AI 虚拟数字人 (AI Virtual Human):
  • 功能:创建无缝、逼真的虚拟形象,实时镜像说话者的表情、手势和语气,并动态响应观众提示。可以作为用户的“24小时分身”。
  • 效果:大大提升内容生产效率,节省成本和时间。
  • 类型:支持即时数字人 (2步创建) 和超级数字人 (支持手势、情感)。
  • 引用:“无缝、逼真的虚拟形象,可实时镜像说话者的表情、手势和语气,动态响应观众提示。”
  1. AI 视频翻译 (AI Video Translation):
  • 功能:即时翻译超过 150 种口语语言,同时保留语音特征并同步嘴唇动作,实现直播活动中的多语言交流。只需输入视频链接即可进行翻译并生成校对文件。
  • 效果:在视频中,“说日语的人,立马有了一个说英文的分身。” “当人转移了话题,数字人自动转移关注点。就像有一个多语言演讲者内置到你的摄像头。”
  • 引用:“即时翻译150多种口语语言,同时保留语音特征并同步嘴唇动作,实现直播活动中逼真的多语言交流。”
  1. 实时换脸 (Live Faceswap):
  • 功能:精确实时换脸并保留情感,使说话者能够在保持真实表现的同时呈现不同身份。
  • 效果:为团队提供强大灵活的沟通方式。
  • 引用:“精确实时换脸并保留情感,使说话者能够在保持真实表现的同时呈现不同身份。”
  1. AI 视频生成 (AI Video Generation):
  • 功能:即时生成无脚本、超逼真的视频,内容根据上下文、语气和观众互动实时生成 (此功能仍在开发中)。
  • 效果:“你会发现视频随着用户的语言,视频的画面在不断的改变。”
  • 引用:“即时生成无脚本、超逼真的视频,无需预录、脚本或后期制作。内容根据上下文、语气和观众互动实时生成。(这个功能还在开发汇总)”

技术基础:

  • 基于先进的人工智能视频生成技术构建。
  • 结合了高级面部映射、神经语音引擎和上下文感知人工智能生成技术。
  • 能够根据实时反馈调整虚拟形象的行为。

为什么被称为“第二个 Sora”:

  • Sora 颠覆了视频生成的质量。
  • Akool 解决了“实时性”和“低成本”两大瓶颈。
  • Akool Live Camera 在直播、虚拟会议和增强现实游戏等无脚本环境中表现出色,与 Sora 通过文本提示构建叙事的方式不同。
  • 引用:“Akool解决『实时性』和『低成本』两大瓶颈;与Sora通过文本提示构建叙事不同,Akool Live Camera在直播、虚拟会议和增强现实游戏等无脚本环境中表现出色。”

应用场景:

  • 重新定义视频的制作方式。
  • 开辟实时视频应用的新可能性:
  • 全球产品发布会
  • 企业会议
  • 医疗保健领域
  • 直播、虚拟会议、增强现实游戏
  • 引用 AKOOL 首席执行官兼创始人陆家骏博士:“有了Akool Live Camera,我们不仅在改进视频,更在改变视频的制作方式。从全球产品发布会到企业会议,甚至医疗保健领域,我们正在为实时视频的应用开辟新的可能性。”

目标用户及价值:

  • 专业人士、教育工作者、创作者和全球团队: 提供实时连接与协作的新途径。
  • 首席执行官可以跨地区发表主题演讲,虚拟形象调整语言和手势。
  • 教师可以根据学生反馈实时调整课程。
  • 创作者无需露面即可触达全球观众。
  • 解决痛点: 缓解摄像头疲劳、焦虑以及 Zoom 时代带来的倦怠感。
  • 隐私选项: 用户可以选择完全关闭摄像头,经同意后,虚拟形象可以完全代表用户进行直播。
  • 引用:“Akool Live Camera为专业人士、教育工作者、创作者和全球团队实时连接与协作开辟了新途径。” “最重要的是,AKOOL为用户提供了完全关闭摄像头的选项。经同意后,虚拟形象可以在直播中完全代表用户,缓解摄像头疲劳、焦虑以及Zoom时代带来的倦怠感。”

商业表现:

  • ARR (年经常性收入) 已超 4000 万美金。
  • 拥有不断增长的企业需求。
  • 引用:“更疯狂的是,Akool 已经是超4000万美金ARR年收入的公司。” “凭借4000万美元的发票应收账款和不断增长的企业需求,AKOOL证明实时人工智能视频不再是一个概念——它正在发生。”

抢先体验:

  • 访问官网:akool.com/live-camera
  • 注册获取使用权限。