0:00 DeepMind的新人工智能为视频生成配乐和对话
1:12 Perplexity现在显示温度、货币转换和简单数学的结果,这样你就不必使用谷歌了
1:58 Runway的新视频生成AI Gen-3提供了改进的控制
2:45 TikTok广告和品牌内容现在将包括创作者和股票演员的AI头像
4:07 Autify推出Zenes,一个用于软件质量保证的AI代理
4:56 Perplexity AI通过软银协议在日本寻找用户
6:25 YC支持的Hona旨在减少律师事务所和其消费者客户之间的沟通摩擦
7:22 苹果 Apple Intelligence 重磅功能要等到明年
文字版
#DeepMind表示正在开发人工智能技术,用于为视频生成配乐。他们称这项技术为V2A(即“视频转音频”),认为它是人工智能生成媒体的重要组成部分。通过描述视频场景和音轨,V2A技术可以生成音乐、音效甚至对话,并与视频进行同步。然而,DeepMind承认V2A技术并非完美,因此暂时不会向公众发布。他们强调正在征集来自创作者和电影制作人的反馈,以便在进行持续研发和测试后才考虑对外开放。同时,DeepMind还强调V2A技术对于档案保管者和处理历史片段的人来说尤其有用。然而,这类生成性人工智能也有可能对电影和电视行业造成影响。当前,未来的发展还需平衡法律保护和行业利益之间的关系。
#Perplexity现在通过卡片直接显示关于天气、时差、货币换算和简单数学等实际查询的结果,避免用户前往谷歌等搜索引擎。公司CEO表示这些基本查询现在应该在搜索引擎上快速工作。另外,Perplexity还在与Tako合作,展示类似股价等信息。然而,Perplexity最近因未正确署名福布斯等媒体的原创报道而引发争议,相关批评者担心AI搜索引擎将侵占出版物的商业利益。目前,Perplexity的首席商务官表示公司已在探讨与出版物的收入分享协议,以帮助出版商获得持续收入。
#Runway公司推出了新一代AI模型Gen-3 Alpha,能够从文本描述和静态图像生成视频片段。该模型在视频生成速度和保真度上有了“重大”改进,还提供了对视频结构、风格和动作的精细控制。虽然Gen-3 Alpha存在一些局限性,包括最多只能生成10秒的片段,但Runway承诺这只是下一代模型系列中的第一个。该公司还计划发布一套新的保障措施,包括审查系统和来源验证系统。与此同时,大量的生成AI视频工具可能会对电影和电视行业产生颠覆性影响,甚至导致创意工作需求大幅减少。
#TikTok宣布推出了创作者和股票演员的生成式AI头像,用于品牌内容和广告。公司还推出了“AI配音”工具,帮助创作者和品牌扩大广告和品牌内容的影响力。新的“定制头像”旨在代表创作者或品牌发言人,他们可以选择多语言头像以扩大全球影响力。此外,还推出了“库存头像”,由授权商用的付费演员创建,旨在为企业内容增加人情味。新工具的推出引起了一些担忧,但TikTok表示创作者可以控制是否使用其肖像,还能确定价格、授权和头像使用权限。AI配音工具可翻译视频内容并将其配音成10种语言,包括英语、日语、韩语和西班牙语。此外,TikTok最近披露61%的用户曾在TikTok上直接购买或在看到广告后购买商品。这些新功能将作为“TikTok交响乐”的一部分提供,该套解决方案于五月份推出,旨在帮助营销人员编写剧本、制作视频和提升现有资源。尽管面临可能在一年内出售应用程序才能避免在美国被禁止的风险,TikTok仍在拓展其广告业务。
#Autify推出了名为Zenes的AI代理,旨在为软件工程师提供软件质量保证服务。这一创新引起了投资者的关注,其中包括全球资本合伙人和LG Technology Ventures。Autify的联合创始人认为,Zenes可以通过分析产品需求文档生成测试用例、编写自动化测试代码并自动维护测试代码,将测试用例创建时间减少55%。该公司计划利用新的资金实现更多AI功能,同时与LG CNS合作,拓展到韩国市场。自2016年成立以来,Autify的服务已扩展到16个国家,并且客户数量也在不断增长。
#Perplexity与软银合作,将在日本市场提供免费一年订阅其高级服务Perplexity Pro。这一举措不仅彰显了Perplexity的国际野心,也突显了移动运营商的动机。软银并不是唯一与Perplexity合作的运营商,德国电信也于去年四月与其达成合作。此外,软银正积极关注人工智能,并举足轻重地考虑可能与Perplexity合作开展其他利用AI的服务。Perplexity 目前拥有一系列投资者,包括 贝索斯探险, IVP, NEA, 红杉资本, 英伟达和Databricks。Perplexity Pro提供高级功能,例如自由选择最新的大型语言模型(LLM),从而获得更全面的信息搜索和数据处理能力。同时,升级版Perplexity还提供了根据搜索历史生成多种风格高质量图像以及通过聊天工具定制搜索结果和提供支持的AI配置功能。该应用目前的定价为,iOS版本为3,000日元/月,30,000日元/年,网页版本为20美元/月,200美元/年。 Perplexity近期已宣布获得62.7万美元的融资,估值已达到10亿美元。该公司目前可能正在筹集其他资金,估值在25亿至30亿美元之间。
#Hona是一家由YC支持的公司,旨在减少律师事务所和其消费者客户之间的沟通摩擦。创始人Manny Griffiths在妻子车祸后与个人伤害律师合作时,意识到许多客户对于案件进展的缺乏信息和沟通感到不满。根据Hona调查,44%的负面Google评论是由于消费者对律师事务所沟通失效而感到不满。为填补此沟通隔阂,Hona推出了一种通信门户,通过技术向客户发送自动更新,并提供AI生成的案件更新、教育资源和客户问题答案。此举不仅帮助律师事务所提高效率,还让消费者在案件过程中获得更多的支持和安心感。 Hona公司目前已获得了950万美元的融资,并计划将服务扩展至电子签名工具及结算付款等领域。
#苹果公司在WWDC24上推出的"Apple Intelligence"人工智能服务,虽然在主题演讲中展示了多项创新功能,但据彭博社记者马克・古尔曼透露,部分核心功能要到2025年才正式发布。这一消息表明,尽管"Apple Intelligence"计划在2024年秋季以"预览版"形式上线,但包括Siri理解设备内容、语义索引、AI控制设备和屏幕感知等重磅特性将缺席,预计这些功能将在明年推出。
古尔曼认为,苹果选择分批推出功能的原因是为了充分解决技术问题,并完善对非美国英语的支持。尽管一些主要功能尚未就绪,今年秋季的"Apple Intelligence"依然将带来一些亮点,例如新的Siri用户界面、键入式Siri功能,以及改进的语音识别能力,即使用户说话有误,Siri也能更好地理解意图。
这一策略反映出苹果对产品质量的高标准和对用户体验的深思熟虑,即便在竞争激烈的AI领域,苹果依然坚持其产品完善后再全面推向市场的传统。对于期待"Apple Intelligence"的消费者和开发者来说,虽然需要耐心等待完整体验,但可以预期苹果将带来更加成熟和可靠的AI服务。