【AI日报】EP.187 7月125 字节发布同声传译模型Seed LiveInterpret;秘塔搜索API上线Aishaobing的个人播客

【AI日报】EP.187 7月125 字节发布同声传译模型Seed LiveInterpret;秘塔搜索API上线

6分钟 ·
播放数144
·
评论数0

【AI模型】 🗣️ 字节跳动发布同声传译模型 Seed LiveInterpret 2.0

* 中英同传翻译质量达业界顶尖水平

* 具备低延迟(仅需3秒)和实时声音复刻功能

* 显著提升跨语言交流的自然度和流畅性

详情链接: arxiv.org

【AI应用】 🔎 秘塔搜索 API 上线

* 定价0.03元/查询,为开发者提供Bing Search API的替代方案

* 支持多模态搜索能力

* 无使用门槛,开发者可即测即用,提升接入效率

【设计工具】 🎨 Lovart AI 正式版全球发布

* 首个人工智能设计 Agent,通过自然语言交互和全链路设计能力重塑创作体验

* 新功能 ChatCanvas 支持多轮对话和实时调整布局、配色

* 针对中国市场优化“星流 Agent”,支持中文语义和国风审美

【AI模型】 🎤 李沐团队发布 Higgs Audio v2,开创语音合成新纪元

* 基于1000万小时语音数据训练,成为行业新标杆

* 支持多语言对话生成、声音克隆及韵律自动调整

* 适用于虚拟主播、语音助手等实时语音聊天和音频内容创作场景

【行业动态】 🎬 Sora2浮出水面:OpenAI 欲在生成式AI视频领域重夺C位

* OpenAI 正在积极开发 Sora2,以应对谷歌Veo3的竞争

* Sora2 尚未公开发布,但未来几周内可能有更多消息

* 竞争对手谷歌Veo3已向大学生免费开放

【行业动态】 🏗️ OpenAI与Oracle携手扩展Stargate项目

* 项目容量将扩大至超过5吉瓦,目标是到2029年实现10吉瓦

* 预计将创造超10万个工作岗位,推动美国AI发展

* 项目已获得超过190亿美元的资金支持

【AI功能】 🖼️ Google Photos新增AI功能:照片秒变动漫、一键生成视频

* 利用Veo2模型,可将静态照片轻松转为6秒动态视频

* Remix功能由Imagen AI驱动,支持将照片转换为动漫、漫画等多种艺术风格

* 新增“创建”标签页,整合多种创意工具,提供一站式创作体验

【AI功能】 ✨ YouTube Shorts将推全新AI 特效 照片秒变视频

* 图片转视频功能可让静态照片在6秒内生成视频,提升短视频创作效率

* AI 特效可将涂鸦、自拍等简单素材转化为精美艺术作品

* 新一代Veo3视频生成器将同步生成音频,提供更完整的创作方案

【AI模型】 📜 谷歌推出 Aeneas 模型:为古代文本解读开辟新路径

* 由谷歌DeepMind推出,旨在帮助历史学家解读古代铭文

* 能够分析古代文本的相似性,填补文本空白,减轻历史研究者的负担

* 将文本转化为“历史指纹”,帮助历史学家在更广泛的背景下解读铭文

详情链接: deepmind.google

【开发工具】 💻 GitHub Spark横空出世:一句话打造Web应用

* 允许用户通过自然语言描述需求,快速生成完整的Web应用

* 提供全托管运行环境,支持一键部署和PWA适配,简化开发流程

* 与GitHub生态深度整合,支持多模型选择,提升开发效率

详情链接: github.blog

【硬件产品】 ✒️ 华为M-Pencil Pro发布

* 定价699元,具备16384级压感和侧旋功能,提升创作真实感

* 笔尾智慧键可一键唤起小艺智能助手,提升操作便捷性

* 支持星闪精确查找功能,精确定位50米范围内的手写笔