OpenAI GPT-5:博士智能登场,AGI之争再起

OpenAI GPT-5:博士智能登场,AGI之争再起

16分钟 ·
播放数0
·
评论数0

OpenAI正式发布了其新一代旗舰模型GPT-5,即日起向大部分用户推出,并在文本、编程、数学等多个领域全面领先。该模型达到了“博士级别智能”,引入了“按需思考”和四种“人格”等创新功能,并被视为OpenAI迈向通用人工智能(AGI)的重要一步,尽管其性能提升和AGI定位仍存在争议。

GPT-5发布与核心特性

  • 发布概况: 北京时间8月8日凌晨1点发布,即日起向免费、Plus、Pro、Team用户推出,冲上大模型竞技场榜首。
  • 智能与人格: 达到“博士级别智能”,支持“按需思考”,并拥有“愤世嫉俗者、机器人、倾听者、书呆子”四种人格。
  • 模型融合: 集成多模态、推理等能力,相当于融合GPT和o系列模型,旨在淘汰所有旧模型。

AI能力全面提升

  • 编程与Agent能力: 被OpenAI称为“迄今为止最好的编程模型”,在SWE-bench验证测试中得分74.9%,并得到Cursor和Windsurf等AI编程公司认可。
  • 推理与事实性: 在GPQA科学知识基准测试中获得新的SOTA(88.4%),事实准确性方面错误率仅为o3的五分之一。
  • 长背景信息处理: 在OpenAI-MRCR基准测试中,长背景信息检索能力显著优于o3和GPT-4.1,且优势随输入长度增加而扩大。

模型版本与经济性

  • 多版本家族: 包含GPT-5、GPT-5-mini、GPT-5-nano和GPT-5-pro四个版本。
  • API定价: GPT-5的API输入/输出价格分别为每百万token 1.25美元/10美元,mini和nano版本价格更低,且与竞争对手相比成本相当或更低。
  • 用户访问与限制: 免费用户用量有限,超限自动转至mini;GPT-5-pro仅供Pro订阅用户使用。

安全与用户体验优化

  • 安全训练: 引入“安全完成”新形式,减少不必要的过度拒绝,并提供拒绝原因和安全替代方案。
  • 解决“阿谀奉承”: 显著减少了模型过度讨好和无意义表情符号的使用(从14.5%降至不到6%)。
  • 定制化与记忆: 支持自定义聊天功能(调整性格、界面颜色),具备更强的记忆功能,Pro用户可接入Gmail和谷歌日历自动规划日程。

市场反响与未来展望

  • 竞争与争议: 马斯克在X平台称Grok 4击败GPT-5;OpenAI发布会因“视觉欺骗”方式呈现基准测试而引发性能夸大争议。
  • AGI定位: Sam Altman认为GPT-5是迈向AGI的重要一步,但承认它不是AGI,且缺少模型在部署过程中持续学习的能力。
  • 市场估值: OpenAI估值飙升至5000亿美元(约合3.6万亿人民币),比年初翻了一倍。