【AI日报】EP.156 5月28 阿里开源长文本深度思考模型QwenLong-L1；GPT-4o语音模式上线唱歌功能

【AI日报】

1. **阿里开源长文本深度思考模型QwenLong-L1**

- 阿里巴巴发布QwenLong-L1-32B，首个通过强化学习训练的长文本推理模型。

- 该模型在七个长文本情境文档问答基准测试中表现出色。

- 提供高性能模型、优化数据集、强化学习方法及评估体系，推动长文本AI应用产业化。

- 详情链接: [GitHub](github.com)

2. **GPT-4o语音模式新增唱歌功能**

- GPT-4o的高级语音模式升级，新增唱歌功能，支持自然语音交互。

- 新增笑声、哭声等情感表达功能，拓展了AI在娱乐和教育领域的应用场景。

- 响应延迟仅320毫秒，支持更自然的情感交流。

3. **秘塔AI搜索推出全新“极速”模型**

- 秘塔AI搜索的新模型实现最高400tokens/秒的响应速度。

- 在单张H800GPU上大幅提升搜索效率，大部分问题可在2秒内得到解答。

- 提供测速站点（kuai.metaso.cn）让用户体验快速响应。

4. **谷歌推出LMEval开源框架**

- LMEval是用于简化和标准化大型语言及多模态模型评估的工具。

- 支持跨平台模型对比，提供增量评估和可视化分析功能。

- 详情链接: [GitHub](github.com)

5. **谷歌Chrome浏览器新增Gemini AI助手**

- Gemini AI助手通过实时感知屏幕内容并提供个性化帮助，提升用户体验。

- 仅向AI Pro和AI Ultra订阅用户开放，目前处于测试版。

- 未来计划扩展至更多场景与设备，提升整体用户体验。

6. **阿联酋全民免费使用ChatGPT Plus**

- 阿联酋将成为全球首个向全体居民免费提供ChatGPT Plus服务的国家。

- 计划构建1千兆瓦的人工智能计算集群，提升地区AI地位。

- OpenAI与阿联酋合作，开发符合本土需求的AI解决方案。

7. **苏州成立60亿元人工智能母基金**

- 苏州成立了一支60亿元的人工智能产业专项母基金，聚焦算力基础设施、数据、人才等领域。

- 推动‘人工智能+制造业’等行业融合应用，加速产业转型升级。

- 预计2024年园区将聚集超1800家AI企业，助力苏州成为国家级AI发展试验区。

8. **Kyutai Unmute发布**

- Kyutai实验室推出的Unmute系统为文本大语言模型赋予强大的语音交互能力。

- 个性化定制功能只需10秒语音样本即可生成专属AI声音。

- 详情链接: [Unmute](unmute.sh)

9. **Claude即将大升级**

- 上下文窗口扩展至百万字符，大幅提升超长文本处理能力。

- 新增记忆功能，实现多轮对话更连贯、个性化的响应。

- 扩展输出Token限制及多文件格式支持，增强企业级应用场景。

10. **百度心响iOS版正式上线**

- 百度心响iOS版的上线标志着智能体应用普及的新阶段。

- 提供旅游攻略生成、深度研究支持以及健康咨询服务。

- 用户可在APP Store免费下载心响iOS版。

11. **夸克发布行业首个“高考深度搜索”**

- 夸克推出的“高考深度搜索”功能，帮助考生和家长高效获取权威信息。

- 数据来源于自建高考知识库，包括历年志愿数据及就业考研信息。

- 使用检索增强生成技术，确保内容准确性。

12. **Chrome v137开发者工具重磅升级**

- Chrome v137引入Gemini AI智能助手，通过智能标注、CSS修改、性能洞察等功能提升开发效率。

- 智能标注功能简化性能分析流程，快速理解复杂性能数据。

- AI驱动CSS调试，一键修改与保存，显著提升前端开发效率。

13. **美团AI业务进展**

- 美团的基础大模型能力接近GPT-4o水平，将推出业务决策助手。

- 内部工程师的52%代码由AI生成，提升工作效率。

- 推出NoCode编程工具，面向非技术用户，简化编程过程。

14. **Direct3D-S2横空出世**

- Direct3D-S2通过创新的空间稀疏注意力机制，大幅提升高分辨率3D图像生成的质量与效率。

- 前向传播速度提升3.9倍，反向传播速度提升9.6倍。

- 开源计划预计5月底前公布，推动3D生成技术在全球范围内的普及与应用。

- 详情链接: [GitHub](github.com)

15. **OpenAI计划2026年推出首款AI硬件**

- OpenAI正在研发一款由ChatGPT驱动的全新AI硬件，预计2026年发布。

- 这款产品将整合到日常生活的方方面面，提供无缝的智能体验。