【AI日报】EP.156 5月28 阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能Aishaobing的个人播客

【AI日报】EP.156 5月28 阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能

6分钟 ·
播放数120
·
评论数0

【AI日报】

1. **阿里开源长文本深度思考模型QwenLong-L1**

   - 阿里巴巴发布QwenLong-L1-32B,首个通过强化学习训练的长文本推理模型。

   - 该模型在七个长文本情境文档问答基准测试中表现出色。

   - 提供高性能模型、优化数据集、强化学习方法及评估体系,推动长文本AI应用产业化。

   - 详情链接: [GitHub](github.com)

2. **GPT-4o语音模式新增唱歌功能**

   - GPT-4o的高级语音模式升级,新增唱歌功能,支持自然语音交互。

   - 新增笑声、哭声等情感表达功能,拓展了AI在娱乐和教育领域的应用场景。

   - 响应延迟仅320毫秒,支持更自然的情感交流。

3. **秘塔AI搜索推出全新“极速”模型**

   - 秘塔AI搜索的新模型实现最高400tokens/秒的响应速度。

   - 在单张H800GPU上大幅提升搜索效率,大部分问题可在2秒内得到解答。

   - 提供测速站点(kuai.metaso.cn)让用户体验快速响应。

4. **谷歌推出LMEval开源框架**

   - LMEval是用于简化和标准化大型语言及多模态模型评估的工具。

   - 支持跨平台模型对比,提供增量评估和可视化分析功能。

   - 详情链接: [GitHub](github.com)

5. **谷歌Chrome浏览器新增Gemini AI助手**

   - Gemini AI助手通过实时感知屏幕内容并提供个性化帮助,提升用户体验。

   - 仅向AI Pro和AI Ultra订阅用户开放,目前处于测试版。

   - 未来计划扩展至更多场景与设备,提升整体用户体验。

6. **阿联酋全民免费使用ChatGPT Plus**

   - 阿联酋将成为全球首个向全体居民免费提供ChatGPT Plus服务的国家。

   - 计划构建1千兆瓦的人工智能计算集群,提升地区AI地位。

   - OpenAI与阿联酋合作,开发符合本土需求的AI解决方案。

7. **苏州成立60亿元人工智能母基金**

   - 苏州成立了一支60亿元的人工智能产业专项母基金,聚焦算力基础设施、数据、人才等领域。

   - 推动‘人工智能+制造业’等行业融合应用,加速产业转型升级。

   - 预计2024年园区将聚集超1800家AI企业,助力苏州成为国家级AI发展试验区。

8. **Kyutai Unmute发布**

   - Kyutai实验室推出的Unmute系统为文本大语言模型赋予强大的语音交互能力。

   - 个性化定制功能只需10秒语音样本即可生成专属AI声音。

   - 详情链接: [Unmute](unmute.sh)

9. **Claude即将大升级**

   - 上下文窗口扩展至百万字符,大幅提升超长文本处理能力。

   - 新增记忆功能,实现多轮对话更连贯、个性化的响应。

   - 扩展输出Token限制及多文件格式支持,增强企业级应用场景。

10. **百度心响iOS版正式上线**

    - 百度心响iOS版的上线标志着智能体应用普及的新阶段。

    - 提供旅游攻略生成、深度研究支持以及健康咨询服务。

    - 用户可在APP Store免费下载心响iOS版。

11. **夸克发布行业首个“高考深度搜索”**

    - 夸克推出的“高考深度搜索”功能,帮助考生和家长高效获取权威信息。

    - 数据来源于自建高考知识库,包括历年志愿数据及就业考研信息。

    - 使用检索增强生成技术,确保内容准确性。

12. **Chrome v137开发者工具重磅升级**

    - Chrome v137引入Gemini AI智能助手,通过智能标注、CSS修改、性能洞察等功能提升开发效率。

    - 智能标注功能简化性能分析流程,快速理解复杂性能数据。

    - AI驱动CSS调试,一键修改与保存,显著提升前端开发效率。

13. **美团AI业务进展**

    - 美团的基础大模型能力接近GPT-4o水平,将推出业务决策助手。

    - 内部工程师的52%代码由AI生成,提升工作效率。

    - 推出NoCode编程工具,面向非技术用户,简化编程过程。

14. **Direct3D-S2横空出世**

    - Direct3D-S2通过创新的空间稀疏注意力机制,大幅提升高分辨率3D图像生成的质量与效率。

    - 前向传播速度提升3.9倍,反向传播速度提升9.6倍。

    - 开源计划预计5月底前公布,推动3D生成技术在全球范围内的普及与应用。

    - 详情链接: [GitHub](github.com)

15. **OpenAI计划2026年推出首款AI硬件**

    - OpenAI正在研发一款由ChatGPT驱动的全新AI硬件,预计2026年发布。

    - 这款产品将整合到日常生活的方方面面,提供无缝的智能体验。