【AI日报】EP.170 6月24 月之暗面首款自主智能体Kimi-Researcher;MiniMax推音色设计功能Aishaobing的个人播客

【AI日报】EP.170 6月24 月之暗面首款自主智能体Kimi-Researcher;MiniMax推音色设计功能

9分钟 ·
播放数97
·
评论数0

【AI日报】

1. 月之暗面发布首款自主智能体Kimi-Researcher,多轮搜索与推理能力强,在HLE测试中超越谷歌和OpenAI同类产品。Kimi-Researcher基于k-系列模型,通过端到端强化学习训练,在HLE测试中Pass@1得分率26.9%,Pass@4准确率40.17%。未来将开源基础预训练模型,助力AI社区发展。

2. MiniMax推出Voice Design音色设计功能,用户可通过自然语言描述生成个性化语音,支持多种语言、口音和音色组合。该功能与Speech-02模型结合,降低了语音合成领域的音色匹配难度。

   - 国内版: minimaxi.com/audio

   - 海外版: minimax.io/audio

3. 火山引擎上线AI智能推荐域名功能,依托方舟大模型平台,帮助企业快速找到符合品牌需求的热门域名。用户输入关键词,AI生成关联性强、富有创意的域名,并提供多样化选择。

   - 体验地址: www.volcengine.com

4. Anthropic推出Claude Code for VSCode插件,优化开发者编码体验,强化在AI编码领域的战略布局。插件支持代码编辑、测试和Git工作流管理,活跃用户群增长160%。

5. Google推出Gemini2.5 Flash-Lite模型,具备实时生成交互界面的能力,支持多模态输入,内置可控思考预算功能,在多个领域展现潜力,适合高吞吐量场景。

6. 苹果考虑以300亿美元收购AI初创公司Perplexity,旨在提升Siri和Safari服务,增强搜索市场竞争力。这是苹果历史上最大规模并购计划之一。

7. 月之暗面开源Kimi-2506多模态模型,视觉理解能力显著增强,支持更高分辨率图像处理。Kimi-2506在多模态推理和视觉理解方面表现出色,单张图像总像素达320万。

8. Firecrawl即将推出开源AI问答引擎Fireplexity,依托其强大的网页抓取功能,为开发者提供低成本替代方案。Fireplexity核心功能与Perplexity类似,支持定制。

9. 智能机器人公司银河通用获宁德时代领投超10亿元融资。首款具身大模型机器人Galbot G1已推出并实现应用,侧重上肢操作能力,未来有望与宁德时代形成战略协同。

10. 字节跳动发布DreamActor-H1视频生成系统,采用扩散变换器技术,解决视频生成中真实性和自然性问题。输入商品和角色照片,自动生成带货视频,在保持人和产品身份完整性方面优于现有技术。

11. Google Gemma团队发布Magenta RealTime,一个开源AI音乐生成模型,专注于实时创作,助力音乐创作者和开发者。Magenta RealTime基于Transformer架构,参数规模为8亿,支持文本提示,实时调整音乐风格与情感。

    - 产品链接: huggingface.co

12. 开源AI设计工具Jaaz发布Lovart AI的本地化替代品,支持本地运行,为设计师提供灵活高效的创作体验。Jaaz兼容多种图像生成模型,具高兼容性。

    - Jaaz项目地址: github.com