OpenAI GPT-5：博士智能登场，AGI之争再起

康乐的AI万事屋

16分钟 ·9个月前

0

·

0

OpenAI正式发布了其新一代旗舰模型GPT-5，即日起向大部分用户推出，并在文本、编程、数学等多个领域全面领先。该模型达到了“博士级别智能”，引入了“按需思考”和四种“人格”等创新功能，并被视为OpenAI迈向通用人工智能（AGI）的重要一步，尽管其性能提升和AGI定位仍存在争议。

GPT-5发布与核心特性

发布概况： 北京时间8月8日凌晨1点发布，即日起向免费、Plus、Pro、Team用户推出，冲上大模型竞技场榜首。

智能与人格： 达到“博士级别智能”，支持“按需思考”，并拥有“愤世嫉俗者、机器人、倾听者、书呆子”四种人格。

模型融合： 集成多模态、推理等能力，相当于融合GPT和o系列模型，旨在淘汰所有旧模型。

AI能力全面提升

编程与Agent能力： 被OpenAI称为“迄今为止最好的编程模型”，在SWE-bench验证测试中得分74.9%，并得到Cursor和Windsurf等AI编程公司认可。

推理与事实性： 在GPQA科学知识基准测试中获得新的SOTA（88.4%），事实准确性方面错误率仅为o3的五分之一。

长背景信息处理： 在OpenAI-MRCR基准测试中，长背景信息检索能力显著优于o3和GPT-4.1，且优势随输入长度增加而扩大。

模型版本与经济性

多版本家族： 包含GPT-5、GPT-5-mini、GPT-5-nano和GPT-5-pro四个版本。

API定价： GPT-5的API输入/输出价格分别为每百万token 1.25美元/10美元，mini和nano版本价格更低，且与竞争对手相比成本相当或更低。

用户访问与限制： 免费用户用量有限，超限自动转至mini；GPT-5-pro仅供Pro订阅用户使用。

安全与用户体验优化

安全训练： 引入“安全完成”新形式，减少不必要的过度拒绝，并提供拒绝原因和安全替代方案。

解决“阿谀奉承”： 显著减少了模型过度讨好和无意义表情符号的使用（从14.5%降至不到6%）。

定制化与记忆： 支持自定义聊天功能（调整性格、界面颜色），具备更强的记忆功能，Pro用户可接入Gmail和谷歌日历自动规划日程。

市场反响与未来展望

竞争与争议： 马斯克在X平台称Grok 4击败GPT-5；OpenAI发布会因“视觉欺骗”方式呈现基准测试而引发性能夸大争议。

AGI定位： Sam Altman认为GPT-5是迈向AGI的重要一步，但承认它不是AGI，且缺少模型在部署过程中持续学习的能力。

市场估值： OpenAI估值飙升至5000亿美元（约合3.6万亿人民币），比年初翻了一倍。

在小宇宙打开