【AI日报】EP.120 3月22 OpenAI发布三个新语音模型；快手搜索全面接入DeepSeek R1

## AI日报新闻提要

**1. OpenAI 推出全新语音转录模型 gpt-4o-transcribe，语音转文字准确率飙升**

* OpenAI 发布三款新语音模型：gpt-4o-transcribe, gpt-4o-mini-transcribe 和 gpt-4o-mini-tts。

* gpt-4o-transcribe 在英语转录中错误率低至 2.46%。

* 支持多种复杂环境下的转录，具备噪声消除和语义语音活动检测等技术。

* 详情链接:www.openai.fm

**2. 快手搜索 AI 升级：DeepSeek R1 全面接入，搜索体验迎来质变!**

* 快手搜索功能全面接入 DeepSeek R1 大模型。

* 提升搜索效果和用户体验，推动用户活跃度增长。

* 快手 AI 内容创作平台“可灵 AI”整合 DeepSeek，提升创作效率。

**3. Claude 推出网络搜索功能，提供实时信息与来源引用**

* Anthropic 公司为其 AI 助手 Claude 添加网络搜索功能。

* 搜索结果转化为对话式回答，并精确标注信息来源。

* 目前仅向美国付费用户开放，未来计划推广至其他国家。

**4. 字节推文生图框架 InfiniteYou：可保持人脸特征，场景随便换**

* 字节跳动推出 InfiniteYou (InfU) 图像生成工具。

* 根据文字描述生成高质量的个性化图像，可保留人脸特征。

* 核心技术 InfuseNet。

* 项目链接: bytedance.github.io

* 详情链接:top.aibase.com

**5. 腾讯元宝功能上新支持分析复杂 Excel 表格**

* 腾讯元宝新功能支持自然语言处理 Excel 表格。

* 快速读取数据并进行计算，突出显示重要信息。

* 简化 Excel 操作流程。

**6. Krea AI 发布“Video Training”功能可以训练自己的专属视频风格**

* Krea AI 推出“Video Training”功能。

* 用户可上传图像和视频素材，训练专属的 AI 视频风格模型。

* 基于 Wan2.1 模型。

* 详情链接:www.krea.ai

**7. DomoAI 推出语音图像生成数字人功能：数字内容创作迎来新突破**

* DomoAI 新功能支持上传语音和图像生成会说话的数字人。

* 支持口型同步，可生成不同长度的短视频，中文支持出色。

* 详情链接:www.domoai.app

**8. Sider AI 推出 Deep Research 功能：能自动模拟人类研究行为，还能生成可视化交互式报告**

* Sider AI 推出 Deep Research 功能。

* 模拟人类研究行为并自动生成可视化报告。

* 实时笔记和透明的信息来源。

* 详情链接:sider.ai

**9. 高中生利用《我的世界》搭建 AI 模型评测网站，全民参与评判模型优劣**

* MC-Bench 网站通过《我的世界》游戏提供 AI 模型评测。

* 用户可在不知情的情况下对 AI 生成的建筑进行投票。

* 详情链接:mcbench.ai

**10. 谷歌前科学家出品! Reka 开源 Reka Flash3，能力超 Gemma327B**

* Reka AI 推出首个开源模型 Reka Flash3。

* 210 亿参数的通用推理模型。

* 从零开始训练，性能出色。

* 详情链接:top.aibase.com

**11. 生数科技 Vidu 获得 7 部千万级网文 IP 概念短片改编授权**

* 北京生数科技公司的 AI 视频生成平台 Vidu 获得 7 部千万级网文 IP 的短片改编授权。

* 涵盖奇幻、科幻、江湖和都市情感等多种题材。

**12. 全球首款儿科大模型问世，助力儿童医疗服务升级**

* 百川智能与北京儿童医院及小儿方健康联合推出全球首个儿科大模型——“福棠・百川”。

* 涵盖儿童常见病及疑难病症的知识体系，具备强大的临床推理能力。

* 推出“AI 儿科医生”应用。