【AI日报】EP.171 6月25 即梦灰测图片3.1模型;ElevenLabs推出AI语音助理11aiAishaobing的个人播客

【AI日报】EP.171 6月25 即梦灰测图片3.1模型;ElevenLabs推出AI语音助理11ai

6分钟 ·
播放数124
·
评论数0

### AI日报新闻提要

1. **即梦灰测图片3.1模型**

   - 3.1模型在艺术风格化上表现更精准,视觉特征更明确。

   - 生成的图片细节更真实,如皮肤、毛发和材质纹理。

   - 增强了电影感和故事感,场景更丰富。

2. **ElevenLabs推出AI语音助理11ai**

   - 以语音交互为核心,支持超过5000种声音和自定义专属语音。

   - 支持MCP多通道协议,可集成多种工具实现高度个性化工作流。

   - 支持70多种语言,具备自动检测功能,适合全球市场应用。

3. **百度发布多智能体协同AI IDE“Comate AI IDE”**

   - AI辅助编码全流程,提升开发效率。

   - 多智能体协同,支持自定义任务。

   - 设计稿一键转代码,增强前端开发体验。

   - 详情链接: [comate.baidu.com](comate.baidu.com)

4. **苹果利用“归一化流”技术推出创新AI生图模型**

   - TarFlow模型通过拆分图像块生成,避免了压缩造成的质量损失。

   - STARFlow在潜空间工作,并支持调用现有语言模型优化文本提示处理。

   - 苹果采用“归一化流”技术开发新的AI生图模型,区别于传统的扩散模型。

5. **Grok Web即将推出“文件”选项卡**

   - 整合多种文件类型,提升工作效率。

   - 提供统一界面,便于浏览、创建和编辑文件。

   - 增强功能性,满足多样化工作需求。

6. **OmniGen2重塑开源多模态模型应用场景**

   - 双组件架构结合视觉语言模型和扩散模型,实现高效可控生成式AI。

   - 文本生成图像功能支持高保真、符合美学标准的图像生成。

   - 指令引导图像编辑性能达到开源模型前沿水平,可完成复杂修改任务。

   - 详情链接: [huggingface.co](huggingface.co)

7. **ScholAI重磅来袭!基于MCP的智能学术神器**

   - 多源论文搜索:支持从arXiv、专业会议及期刊等多个权威学术平台检索论文。

   - 自动获取CCF排名:内置CCF排名查询功能,用户可快速了解目标期刊或会议的学术影响力。

   - 语义查询分析:通过自然语言处理技术,理解用户研究兴趣,精准匹配相关论文。

   - 详情链接: [github.com](github.com)

8. **豆包推出可视化AI编程**

   - 豆包推出可视化AI编程功能,用户可直接在预览界面编辑网页应用。

   - 该功能降低了编程门槛,使非技术背景用户也能快速搭建网页应用。

   - 已支持多文件上传、GitHub仓库引入等专业功能。

9. **饿了么推出智能AI助手“小饿”**

   - 通过语音唤醒“小饿”,骑手可轻松完成接单、确认到店等操作。

   - 实时分析骑手位置和订单状态,主动推送天气预警和路线封路提示。

   - 根据历史数据和订单热力图,提供收入预估和优化接单策略的建议。

10. **张雪峰直言:AI能取代我最好!**

    - 张雪峰表示:“能被取代最好!”反映出他对AI的乐观态度。

    - AI在高考志愿填报中取得了显著进展,但仍面临挑战。

    - 教育工作者需与考生和家长加强沟通,帮助他们更好地运用AI工具。

11. **微软重磅发布设备端小模型Mu**

    - Mu模型拥有3.3亿参数,专为简化Windows设置设计。

    - 高效本地处理,响应速度快,降低隐私风险。

    - 未来将支持更多硬件平台,扩展用户群体。