Vol.032 | OpenAI 推出GPT-5.2

Vol.032 | OpenAI 推出GPT-5.2

20分钟 ·
播放数5
·
评论数0

一、产品与技术迭代

  1. 模型与工具发布OpenAI 推出GPT-5.2,定位 “最适合日常专业使用”,较 GPT-5.1 在生成效率、技术性能、成本控制上显著提升,优化 “AI 代理工作流”,将逐步在 ChatGPT 上线,优先向付费用户开放,约三个月后下线 GPT-5.1;同步官宣 ChatGPT “成人模式” 预计 2026 年一季度推出,上线前将完善年龄预测技术。
    谷歌推出多项新功能:① 基于 Gemini 3 Pro 的AI 研究代理 Gemini Deep Research,首次开放 API,功能升级且减少 AI 幻觉,测试表现优异;② 实验性浏览器Disco(仅支持 macOS),其 GenTabs 功能可将标签页实时转化为定制化 Web 应用,后续将融入正式版 Chrome;③ 升级 AI 虚拟试穿功能,用户上传自拍即可几秒生成全身数字形象试衣,已在美国上线,同步运营 Doppl 应用并更新 “可购物发现流”。
    其他企业产品:① 拓竹科技依托腾讯混元 3D 3.0 大模型推出 3D 手办生成器印你,用户上传一张图片即可生成专属 3D 手办,创作流程简化为三步,提升建模精度与细节;② 钉钉 8.1.10 版本升级,新增 “AI 灵动回复”“听记 AI 问答” 功能,同步升级 DingTalk A1 硬件,实现软硬件深度协同;③ Cohere 推出搜索模型Rerank4,上下文窗口扩展至 32K,采用跨编码器架构,支持多语言与自学习,分快速版和专业版适配不同场景;④ Runway 推出首个通用世界模型GWM-1,以三个专业化分支落地,同时重大升级 Gen4.5 视频生成模型,推动其向工业级工具迈进。
  2. 开源技术动态智谱多模态开源周落幕,GLM 团队发布多款多模态模型,最后一天开源SCAIL、RealVideo 等四项视频生成核心技术,旨在激发社区创新,推动通用人工智能发展。
    英伟达在 NeurIPS 大会推出自动驾驶 AI 模型AR1,为全球首个行业级开放推理 VLA 模型,可处理文本图像、模拟人类推理,已在 GitHub 和 Hugging Face 发布,供研究人员非商业定制。

二、企业合作与战略布局

  1. 重大合作与投资迪士尼与 OpenAI 达成三年战略协议,成为 Sora 首个主要内容授权伙伴,迪士尼投资 10 亿美元,授权 OpenAI 使用超 200 个角色创作视频与图像,双方预计 2026 年初上线首批功能。
    挪威机器人公司 1X 与瑞典投资公司 EQT 达成战略合作,2026-2030 年将向 EQT 旗下 300 余家公司投放至多 1 万台人形机器人 Neo,首批用于制造、仓储与物流领域,后续将逐步推进家庭市场。
  2. 企业战略调整Meta 计划 2026 年春季发布极有可能闭源的 “牛油果” 模型,训练过程疑似采用阿里 Qwen 等开源成果,因 Llama4 失利,战略从开源转向闭源。
    车企 Rivian 举行活动,宣布设计自研 AI 芯片、推出自动驾驶功能与 AI 语音助手,将相关功能整合进订阅服务,意在改善现金流、建立竞争优势。

三、行业人才与资本动态

  • 腾讯向字节 AI 研究员开出翻倍薪资挖角,部分核心研究员已接受邀约,反映出互联网行业战略重心转移,以及腾讯在大模型基础研究领域的竞争焦虑,AI 人才战风向逆转。

四、行业监管与版权争议

  1. 版权相关动态迪士尼向谷歌发出停止侵权通知,指控其 AI 模型侵犯《冰雪奇缘》等作品版权,谷歌回应称已建立版权控制机制,双方关系良好;此举凸显好莱坞在 AI 时代的两难处境,授权谈判与诉讼并行或成常态。
    印度政府发布工作文件,提出 AI 版权新模式,包含一揽子许可、商业化后付费、集中式版税管理三大要素,拟设 CRCAT 征收版税,有望成为全球 AI 版权政策参考范本。
    纽约州州长签署美国首个专门针对 AI 生成内容的法案,要求广告商披露 AI 生成内容,使用已故人士形象需获得同意,以保护消费者和艺术家权益。
  2. 行业应用争议埃尔萨尔瓦多计划未来两年将 Grok 聊天机器人引入超 5000 所公立学校,覆盖超 100 万学生,引发关于 AI 教育应用合理性的讨论。

五、行业竞争格局

  • OpenAI 与谷歌在 AI 代理赛道激烈角力,谷歌抢先推出 Gemini Deep Research 后,OpenAI 迅速发布 GPT-5.2 并宣称超越竞品,标志着 AI 代理战争正式拉开序幕。