【AI日报】EP.187 7月125 字节发布同声传译模型Seed LiveInterpret；秘塔搜索API上线

Aishaobing的个人播客

6分钟 ·1 年前

145

·

0

【AI模型】 🗣️ 字节跳动发布同声传译模型 Seed LiveInterpret 2.0

* 中英同传翻译质量达业界顶尖水平

* 具备低延迟（仅需3秒）和实时声音复刻功能

* 显著提升跨语言交流的自然度和流畅性

详情链接: arxiv.org

【AI应用】 🔎 秘塔搜索 API 上线

* 定价0.03元/查询，为开发者提供Bing Search API的替代方案

* 支持多模态搜索能力

* 无使用门槛，开发者可即测即用，提升接入效率

【设计工具】 🎨 Lovart AI 正式版全球发布

* 首个人工智能设计 Agent，通过自然语言交互和全链路设计能力重塑创作体验

* 新功能 ChatCanvas 支持多轮对话和实时调整布局、配色

* 针对中国市场优化“星流 Agent”，支持中文语义和国风审美

【AI模型】 🎤 李沐团队发布 Higgs Audio v2，开创语音合成新纪元

* 基于1000万小时语音数据训练，成为行业新标杆

* 支持多语言对话生成、声音克隆及韵律自动调整

* 适用于虚拟主播、语音助手等实时语音聊天和音频内容创作场景

【行业动态】 🎬 Sora2浮出水面：OpenAI 欲在生成式AI视频领域重夺C位

* OpenAI 正在积极开发 Sora2，以应对谷歌Veo3的竞争

* Sora2 尚未公开发布，但未来几周内可能有更多消息

* 竞争对手谷歌Veo3已向大学生免费开放

【行业动态】 🏗️ OpenAI与Oracle携手扩展Stargate项目

* 项目容量将扩大至超过5吉瓦，目标是到2029年实现10吉瓦

* 预计将创造超10万个工作岗位，推动美国AI发展

* 项目已获得超过190亿美元的资金支持

【AI功能】 🖼️ Google Photos新增AI功能：照片秒变动漫、一键生成视频

* 利用Veo2模型，可将静态照片轻松转为6秒动态视频

* Remix功能由Imagen AI驱动，支持将照片转换为动漫、漫画等多种艺术风格

* 新增“创建”标签页，整合多种创意工具，提供一站式创作体验

【AI功能】 ✨ YouTube Shorts将推全新AI 特效照片秒变视频

* 图片转视频功能可让静态照片在6秒内生成视频，提升短视频创作效率

* AI 特效可将涂鸦、自拍等简单素材转化为精美艺术作品

* 新一代Veo3视频生成器将同步生成音频，提供更完整的创作方案

【AI模型】 📜 谷歌推出 Aeneas 模型：为古代文本解读开辟新路径

* 由谷歌DeepMind推出，旨在帮助历史学家解读古代铭文

* 能够分析古代文本的相似性，填补文本空白，减轻历史研究者的负担

* 将文本转化为“历史指纹”，帮助历史学家在更广泛的背景下解读铭文

详情链接: deepmind.google

【开发工具】 💻 GitHub Spark横空出世：一句话打造Web应用

* 允许用户通过自然语言描述需求，快速生成完整的Web应用

* 提供全托管运行环境，支持一键部署和PWA适配，简化开发流程

* 与GitHub生态深度整合，支持多模型选择，提升开发效率

详情链接: github.blog

【硬件产品】 ✒️ 华为M-Pencil Pro发布

* 定价699元，具备16384级压感和侧旋功能，提升创作真实感

* 笔尾智慧键可一键唤起小艺智能助手，提升操作便捷性

* 支持星闪精确查找功能，精确定位50米范围内的手写笔

在小宇宙打开