Vol.034 | OpenAI推出图像生成模型GPT Image 1.5，向免费 ChatGPT 用户开放

每日AI新资讯

11分钟 ·5个月前

2

·

0

一、产品与技术动态

1. 模型发布与升级

小米：发布并以 MIT 协议开源 3090 亿参数大模型MiMo-V2-Flash，推理速度快、成本低，多项测试表现优于部分国产竞品，适配多场景，同步推出低价 API 及试用活动，有望重塑开源模型格局。

阿布扎比 G42：发布 87 亿参数开源印英语言模型NANDA87B（早期版本升级），可自由使用，支持多种印地语处理与多任务执行，旨在推动印度语言技术可及性。

艾伦人工智能研究所（Ai2）：发布开源视频语言模型Molmo2及九个新数据集，模型参数小、成本低且功能增强，强调数据透明与定制化，提升企业对模型的掌控力。

OpenAI：推出图像生成模型GPT Image 1.5，向免费 ChatGPT 用户开放，实现四大升级，成本下调、使用门槛降低，解决图像一致性难题，同时升级 ChatGPT 编辑工具，组建安全合规团队保障内容合法。

谷歌：发布Gemini2.5Flash Native Audio 更新，语音助手指令遵循率从 84% 提升至 90%，基准测试函数调用准确率达 71.5%，开发者可通过 Gemini API 测试。

2. 新应用与功能上线

DoorDash：推出 AI 社交应用Zesty，率先在旧金山湾区和纽约市试点，用户通过自然语言对话获取个性化餐厅推荐，支持分享互动，助力其 “超越外卖” 战略落地，面临用户下载意愿挑战。

谷歌：推出实验性 AI 助手CC（基于 Gemini），面向美加付费订阅用户早期体验，每日早晨主动整理信息并以 “日程前瞻” 简报形式推送，可生成日程概览提醒重点事项。

豆包手机助手：与中兴合作的 nubia M153 工程机引发抢购热潮，首批售罄，F 码申请停止，近一两周无货；多次声明功能规则，辟谣监管约谈传闻。

加密货币交易所 Gemini：将预测市场产品Gemini Predictions推向全美 50 州，用户可围绕真实事件预测交易，平台合规便捷，限时免手续费，或推动预测市场走向主流。

3. 技术架构与语言创新

普渡大学等机构：提出 “内存计算” 新型架构，利用类脑算法突破传统冯・诺依曼架构的 “内存墙” 瓶颈，有望大幅降低 AI 能耗，拓展其应用场景。

日本数据科学家本田崇人：推出全新开源编程语言Sui，设计精炼，宣称可让 LLM 100% 准确编写代码，或为 AI 辅助编程带来突破。

二、企业战略与合作

1. 收购与生态集成

红帽：收购专注 AI 模型测试和安全防护的Chatterbox Labs，旨在增强企业级 AI 安全能力、完善开源 AI 平台，未来计划将相关技术逐步开源。

OpenAI：宣布与Apple Music集成，用户可通过自然语言指令创建歌单、查找音乐，后续将纳入更多应用丰富 ChatGPT 生态。

2. 产品更新与组织战略

Meta：对 Ray-Ban Meta 和 Oakley Meta HSTN 智能眼镜进行 v21 软件更新，新增 “对话聚焦”（增强嘈杂环境听力）、与 Spotify 合作的 “视觉配乐” 功能，先面向早期体验计划参与者。

Mozilla：任命 Anthony Enzor-DeMeo 为新 CEO，其强调用户对软件透明性的需求，计划将 Firefox 转型为现代 AI 浏览器，扩展为可信软件生态系统，重视隐私与用户控制权。

三、行业生态与竞争格局

1. 海外扩张与地缘博弈

OpenAI：任命英国前财长奥斯本主导 “星际之门” 海外扩张计划，已与英、阿签约，正与 50 多国洽谈 “主权 AI” 合作；此前 Anthropic 聘请英前首相苏纳克，AI 巨头延揽前政要，标志大模型竞赛升级为多维博弈。

2. 垂直赛道与开源趋势

开源领域持续创新，小米、Ai2、G42 等相继发布开源模型，中国开源模型此前已展现领先态势，此次小米大模型开源进一步强化开源生态竞争力；垂直赛道（如美食社交、预测市场）成为企业拓展 AI 应用的重要方向。

四、人才与组织调整

Mozilla：完成 CEO 换届，新 CEO Anthony Enzor-DeMeo 明确公司 AI 转型与隐私保护战略，推动 Firefox 及生态系统升级。

OpenAI：通过高管任命（奥斯本）、生态集成（Apple Music）、产品迭代（GPT Image 1.5）多维度推进全球化与商业化，强化市场竞争力。

在小宇宙打开