AI日报】EP.165 6月14 阿里开源3D数字人项目MNN TaoAvatar;MiniMax Agent上线Aishaobing的个人播客

AI日报】EP.165 6月14 阿里开源3D数字人项目MNN TaoAvatar;MiniMax Agent上线

8分钟 ·
播放数122
·
评论数0

**AI日报**

1. **阿里开源3D数字人项目MNN TaoAvatar**

   - 阿里巴巴集团开源了在手机上运行的3D数字人应用MNN TaoAvatar,支持虚拟客服和虚拟主播。

   - 该应用可在手机上以90FPS流畅运行,结合3D高斯溅射技术实现毫米级精细控制。

   - 开源生态提供丰富API和工具,支持多模态输入,降低开发门槛。

   - 详情链接: [github.com](github.com)

2. **MiniMax Agent上线**

   - MiniMax官方宣布其AI生产力工具MiniMax Agent迎来重大升级,新增智能图像搜索、稳定的图像生成、多语言支持及多样化文档导出功能。

   - 新增智能图像搜索与生成功能,适用于设计、营销和内容创作。

   - 引入反思模式,增强长任务处理能力,特别适合需要深度推理的场景。

   - 新增中文、日文、韩文支持,优化Python绘图功能。

   - 详情链接: [agent.minimax.io](agent.minimax.io)

3. **罗永浩数字人直播即将首秀百度电商**

   - 知名电商主播罗永浩宣布其数字人形象将在百度电商平台开启直播带货,首次尝试数字人直播。

   - 百度电商平台已有超10万数字人主播,数字人直播可使商家运营成本下降超80%,GMV平均提升62%。

   - 此次尝试可能推动直播电商行业向智能化、高效率、低成本方向发展。

4. **OpenAI员工套现潮达30亿美元**

   - 自2021年以来,OpenAI员工通过多次股权出售累计套现近30亿美元,软银成为最大买家。

   - 员工股权变现频率高,但可能加速离职。激烈的AI人才竞争中,OpenAI面临巨大压力,如何留住核心团队是关键挑战。

5. **OpenAI重磅升级ChatGPT Projects**

   - ChatGPT Projects新增深度研究和语音模式,支持内外部数据检索,提升移动办公便捷性。

   - 深度研究支持复杂场景,语音模式集成提高实时协作需求。

   - 移动端增强支持多模态交互,扩展使用场景。

   - 详情链接: [help.openai.com](help.openai.com)

6. **Meta新型模型助力机器人在未知环境中实现物体操控**

   - Meta推出的V-JEPA2模型通过观察视频和物理交互构建世界模型,提升机器人在动态环境中的操作能力。

   - 支持零-shot机器人规划,广泛应用于物流和制造业。

   - 详情链接: [ai.meta.com](ai.meta.com)

7. **AMD与OpenAI联合发布强大AI芯片**

   - AMD与OpenAI推出了最新的Instinct MI400和MI350系列AI芯片,MI350系列显著提升了AI计算性能,MI400系列则面向下一代旗舰AI计算需求。

   - MI350系列GPU提供卓越的AI计算性能,内存带宽高达8TB/s,推理性能提升35倍。

   - ROCm7平台整合多个顶级AI平台,提供超过3.5倍推理性能提升,助力开发者高效工作。

8. **Imagen4登陆Gemini**

   - Google旗下的Gemini平台通过集成最新一代的Imagen4图像生成模型,实现了从复杂细节到文本渲染的全面升级。

   - 细节呈现卓越,支持聊天中直接生成和调整图像,适用于设计、营销及教育等领域。

   - 详情链接: [research.google](research.google)

9. **谷歌AI助力气候预测**

   - 谷歌研究人员结合物理建模与生成AI的新方法,通过R2D2模型将全球气候预测提升至约10公里的分辨率,大幅降低计算成本并提高预测准确性。

   - R2D2模型结合物理与AI优势,提升预测准确性且能高效推广至未见过的情景。

   - 详情链接: [research.google](research.google)

10. **Gartner预测生成AI应用将实现50%的交付时间缩减**

    - Gartner预测到2028年,80%的生成AI商业应用将在现有数据管理平台上开发,交付时间缩短50%。

    - 检索增强生成(RAG)将成为开发生成AI应用的重要基础,提供灵活性和可解释性。

    - 企业应评估现有平台的转型潜力,整合RAG技术并利用元数据保护安全。