Vol.034 | OpenAI推出图像生成模型GPT Image 1.5,向免费 ChatGPT 用户开放
11分钟
·
2
·
0
一、产品与技术动态
1. 模型发布与升级
- 小米:发布并以 MIT 协议开源 3090 亿参数大模型MiMo-V2-Flash,推理速度快、成本低,多项测试表现优于部分国产竞品,适配多场景,同步推出低价 API 及试用活动,有望重塑开源模型格局。
- 阿布扎比 G42:发布 87 亿参数开源印英语言模型NANDA87B(早期版本升级),可自由使用,支持多种印地语处理与多任务执行,旨在推动印度语言技术可及性。
- 艾伦人工智能研究所(Ai2):发布开源视频语言模型Molmo2及九个新数据集,模型参数小、成本低且功能增强,强调数据透明与定制化,提升企业对模型的掌控力。
- OpenAI:推出图像生成模型GPT Image 1.5,向免费 ChatGPT 用户开放,实现四大升级,成本下调、使用门槛降低,解决图像一致性难题,同时升级 ChatGPT 编辑工具,组建安全合规团队保障内容合法。
- 谷歌:发布Gemini2.5Flash Native Audio 更新,语音助手指令遵循率从 84% 提升至 90%,基准测试函数调用准确率达 71.5%,开发者可通过 Gemini API 测试。
2. 新应用与功能上线
- DoorDash:推出 AI 社交应用Zesty,率先在旧金山湾区和纽约市试点,用户通过自然语言对话获取个性化餐厅推荐,支持分享互动,助力其 “超越外卖” 战略落地,面临用户下载意愿挑战。
- 谷歌:推出实验性 AI 助手CC(基于 Gemini),面向美加付费订阅用户早期体验,每日早晨主动整理信息并以 “日程前瞻” 简报形式推送,可生成日程概览提醒重点事项。
- 豆包手机助手:与中兴合作的 nubia M153 工程机引发抢购热潮,首批售罄,F 码申请停止,近一两周无货;多次声明功能规则,辟谣监管约谈传闻。
- 加密货币交易所 Gemini:将预测市场产品Gemini Predictions推向全美 50 州,用户可围绕真实事件预测交易,平台合规便捷,限时免手续费,或推动预测市场走向主流。
3. 技术架构与语言创新
- 普渡大学等机构:提出 “内存计算” 新型架构,利用类脑算法突破传统冯・诺依曼架构的 “内存墙” 瓶颈,有望大幅降低 AI 能耗,拓展其应用场景。
- 日本数据科学家本田崇人:推出全新开源编程语言Sui,设计精炼,宣称可让 LLM 100% 准确编写代码,或为 AI 辅助编程带来突破。
二、企业战略与合作
1. 收购与生态集成
- 红帽:收购专注 AI 模型测试和安全防护的Chatterbox Labs,旨在增强企业级 AI 安全能力、完善开源 AI 平台,未来计划将相关技术逐步开源。
- OpenAI:宣布与Apple Music集成,用户可通过自然语言指令创建歌单、查找音乐,后续将纳入更多应用丰富 ChatGPT 生态。
2. 产品更新与组织战略
- Meta:对 Ray-Ban Meta 和 Oakley Meta HSTN 智能眼镜进行 v21 软件更新,新增 “对话聚焦”(增强嘈杂环境听力)、与 Spotify 合作的 “视觉配乐” 功能,先面向早期体验计划参与者。
- Mozilla:任命 Anthony Enzor-DeMeo 为新 CEO,其强调用户对软件透明性的需求,计划将 Firefox 转型为现代 AI 浏览器,扩展为可信软件生态系统,重视隐私与用户控制权。
三、行业生态与竞争格局
1. 海外扩张与地缘博弈
- OpenAI:任命英国前财长奥斯本主导 “星际之门” 海外扩张计划,已与英、阿签约,正与 50 多国洽谈 “主权 AI” 合作;此前 Anthropic 聘请英前首相苏纳克,AI 巨头延揽前政要,标志大模型竞赛升级为多维博弈。
2. 垂直赛道与开源趋势
- 开源领域持续创新,小米、Ai2、G42 等相继发布开源模型,中国开源模型此前已展现领先态势,此次小米大模型开源进一步强化开源生态竞争力;垂直赛道(如美食社交、预测市场)成为企业拓展 AI 应用的重要方向。
四、人才与组织调整
- Mozilla:完成 CEO 换届,新 CEO Anthony Enzor-DeMeo 明确公司 AI 转型与隐私保护战略,推动 Firefox 及生态系统升级。
- OpenAI:通过高管任命(奥斯本)、生态集成(Apple Music)、产品迭代(GPT Image 1.5)多维度推进全球化与商业化,强化市场竞争力。