首页 > 科技快讯 > AI领域迎来重大突破！GPT-5震撼发布，性能全面升级、多领域“屠榜”，告别“幻觉”？

AI领域迎来重大突破！GPT-5震撼发布，性能全面升级、多领域“屠榜”，告别“幻觉”？

晰数塔互联网快讯
2025-08-08 20:49

本文源自:金融界

北京时间8月8日凌晨，OpenAI正式发布了备受瞩目的新一代人工智能模型GPT-5。这场长达1个多小时的线上发布会规格之高、细节之多，引发了全球科技界的广泛关注。GPT-5的发布，不仅标志着AI技术的一次巨大飞跃，更被视为构建“超级智能”的重要一步。

性能全面升级，多领域“屠榜”

GPT-5在多个领域的表现都迎来了全面提升。在文本生成、Web开发和视觉感知能力领域，GPT-5均排名第一；在硬提示、编码、数学、创造力、长查询等方面也毫无悬念地拔得头筹。在代号为“峰会”的测试中，GPT-5保持着截至目前最高的Arena分数，堪称实至名归的“屠榜”者。

OpenAI首席执行官Sam Altman对GPT-5的评价极高，他比喻说，如果说GPT-4像中学生，GPT-5就像大学生，而GPT-5则是第一次让他真正感觉像在与一位博士级别的专家交谈。他甚至断言，GPT-5是世界上编码能力最强、写作能力最强以及在医疗保健领域最强的模型。

告别“幻觉”，AI更可靠

“AI幻觉”一直是困扰大型语言模型的难题，但GPT-5在这方面取得了显著进步。与GPT-4o相比，GPT-5在联网搜索时回答出现事实错误的概率降低了45%；在独立思考时，回答出错的概率更是比OpenAI o3降低了80%。

此外，GPT-5还引入了四种全新的“人格”模式，包括犬儒、机器人、倾听者和学霸，用户可以根据自己的喜好设定ChatGPT与自己互动和回答问题的方式。

编码能力逆天，“软件按需生成”时代来临

GPT-5的编码能力堪称逆天。在多个编码基准测试中，GPT-5的表现均优于其他任何模型。在人类最终测试中取得42%的成绩，在SWE基准测试中更是达到了75%的成绩。

在发布会上，OpenAI的后期训练负责人Yann Dubois现场演示了GPT-5的强大编码能力，要求它生成一个用于学习法语并带有互动游戏的网站。GPT-5在短短几秒钟内就编写了数百行代码，并直接展示了网站的前端界面。

此外，GPT-5还展示了一款仅靠一段提示词就创作的3D游戏，其画面精致，物理效果也十分逼真。

更安全、更“诚实”

OpenAI对GPT-5进行了超过五千小时的测试，以确保其安全性。GPT-5在更可靠地处理多步骤任务方面表现更好，不会像以前那样“自信地撒谎”。对于一些可能涉及安全风险的问题，GPT-5会采用“安全补全”机制，在保持安全约束的前提下，给出尽可能有帮助的答案。

全面开放，多版本满足不同需求

GPT-5向所有用户开放，包括普通用户、Plus会员和Pro会员。普通用户可以免费体验GPT-5，但用量有限；Plus会员可获得更多使用量；Pro会员则可以访问具备更强推理能力的GPT-5 Pro版本。GPT-5系列还包括GPT-5-mini、GPT-5-nano等版本，以满足不同用户的需求。

在定价方面，标准版GPT-5每百万输入Token 1.25美元，每百万输出Token 10美元，mini版和Nano版的定价则相对较低。

集成架构，智能调度子模型

GPT-5采用了内嵌式三位一体集成架构，由处理常规问题的GPT-5-main模型、解决复杂任务的GPT-5-thinking深度思考模型、实时决策的路由机制以及额度使用完后启动的mini版本组成。路由机制会根据对话类型、复杂程度、工具需求以及用户的明确意图，快速决定使用哪个模型，自动匹配最适合的模型，用户无需手动切换。

发布于：北京