首页 > 科技快讯 > 我们扒完了GPT-5全网爆料，奥特曼和OpenAI 这次的饼真不好画了

我们扒完了GPT-5全网爆料，奥特曼和OpenAI 这次的饼真不好画了

晰数塔互联网快讯
2025-08-05 18:36

本文来自微信公众号：APPSO （ID：appsolution），作者：发现明日产品的，原文标题：《我们扒完了 GPT-5 全网爆料，奥特曼和 OpenAI 这次的饼真不好画了》

如果炒作是奥运项目的话，Sam Altman的奖牌数将创下纪录。

在X上，这是网友对这段时间GPT-5营销狂轰滥炸的锐评。

从OpenAI宣布自己达到了IMO金牌水平以来，对它高热度营销的诟病就一直没有停下来过。

几乎每天，都有一点关于GPT-5的消息被「不经意」地放出。一会儿是Altman在播客上感叹自己「相对于AI毫无用处」；一会儿是The Information深度报道其内部挑战重重；一会儿又是在X上晒出与GPT-5的聊天截图……

大家的胃口是被吊足了，但关于产品的核心信息，却始终若隐若现。

过去一段时间来，GPT-5貌似一直是「最热的未来产品」。从去年开始就陆续有媒体在爆料，发布时间的传闻从去年一路传到今年8月。

结果是，OpenAI的确在刷新各种benchmark，但大家期待的GPT-5却迟迟没有现身。

根据OpenAI官方模型发布公告整理

OpenAI的benchmark越是刷新，大家的兴奋感反而越低。毕竟，马斯克都要靠二次元动漫角色Ani来获得流量关注了，而Grok 4刷新了多少榜单根本提不起大家的兴趣。

所以，OpenAI看起来也转向了一种新节奏，靠不断「暗示」、不断「吊胃口」来保持热度。

我们整理了近期所有关于GPT-5的爆料和报道，试图跳出这套营销叙事，看清在漫长的预热背后，OpenAI接下来到底在押什么注。GPT-5在真正到来之前，还有哪些值得关注的信号。

GPT-5的核心升级，统一了基础和推理模型

与以往更新不同，GPT-5的最大亮点并非空泛的跑分提升，而是在多模态、软件工程和AI智能体（Agent）这三个极具实用价值的领域，展现了相当大的性能提升。

实现「完整的多模态」能力

这是最新爆料中最大、也最令人兴奋的特性。据专栏SemiconSam博主@Jukanlosreve公开的一份专家电话会议纪要透露，GPT-5最显著的特点是「多模态能力的显著提升，实现了一个完整的多模态模型」。

这意味着它在处理和生成图文、音视频等多种信息流上的能力将远超以往，有望带来「吉卜力时刻」的用户体验，并在发布后登顶绝大多数评测榜单。

软件工程能力的大幅提升

GPT-5不再局限于解决算法竞赛题，而是能深入到大型、陈旧、复杂的企业级代码库中进行修改和维护。这被视为OpenAI直接挑战Anthropic Claude在编程领域优势地位的重磅武器。

一位测试者甚至表示，在他们的横向比较中，GPT-5的表现优于Anthropic的Claude Sonnet 4。

同时，作为OpenAI最重要的合作伙伴，微软内部员工在测试后透露，GPT-5在产出高质量代码的同时，并没有消耗更多的计算资源。

X上有用户分享通过OpenAI API免费尝试了GPT-5，并用它做了一个六边形振动测试的HTML页面，看起来效果确实很不错。

真正可用的AI Agent

更强的推理能力，意味着GPT-5能更好地理解和执行复杂的多步骤指令，从而以更少的人工监督来执行多步骤任务，向着能够自主完成任务的「AI智能体」迈出了关键一步。

例如，有媒体称它可以遵循一套复杂的规则，来判断自动客服代理是否应该批准退款，而此前的模型则需要大量具体案例才能学会。

攻克主观领域的「通用验证器」

为了解决推理模型难以评估的问题，OpenAI开发了一项名为「通用验证器」（universal verifier）的技术。

值得关注的是，这项名为「通用验证器」的工作，还是Ilya之前带领的超级对齐团队在去年完成的。

它的本质上是另一个AI，专门负责检查和评估主模型的回答质量，即使是在没有标准答案的场景下。因此GPT-5不仅在编程和数学等可验证领域表现出色，在创意写作、策略分析等主观性更强的领域也取得了进步。

这项技术也是OpenAI能在国际数学奥林匹克竞赛中摘金的关键。

Reddit上也有网友分享自己透过OpenAI API获得了GPT-5的访问权限，并用GPT-5生成了一张图片，他在评论区里面提到生成这张图片用了50多秒，他倾向于认为所使用的并不是GPT-5 mini版本。

而我们使用ChatGPT-4o生成的图像则更像是简笔画。

要实现上述强大的功能，GPT-5依赖于其最核心的一项变化：一个能自动为用户选择最优解的智能调度系统。

综合多家媒体的报道，与以往单纯追求更大参数规模的路径不同，GPT-5旨在将传统的GPT语言模型与专注于推理的「o」系列模型（如o1、o3）整合在一起。

如果你跟我一样曾经对GPT-4o、o4、GPT-4.1等令人眼花缭乱的模型名称感到困惑，那么GPT-5的首要目标就是终结我们的「选择困难症」。

ChatGPT内提供的模型，有擅长编码、分析、处理日常任务、写作、推理等等

一些研究人员推测，GPT-5可能并非单一模型，而是一个智能「路由系统」，能根据用户问题的难度，动态选择调用最合适的模型来处理。

对于简单请求：它会调用更快速、成本更低的GPT系列模型，实现即时响应。

对于复杂难题：如STEM（科学、技术、工程和数学）或深度编程问题，它会自动切换到更强大的推理模型，进行更深入的「思考」，确保答案的质量。

OpenAI ChatGPT负责人Nick Turley对此的愿景是：「我们的目标是让普通用户无需再思考该用哪个模型」。相反，目标是让GPT-5自动为用户的任务选择最佳模型。

发布、版本与最后的悬念

时间：虽然早在2023年末，就有媒体称OpenAI可能会在2024春季或夏季发布GPT-5。然而到了2024年5月，OpenAI的官方当时表示，

近些日子已经开始训练公司的「下一代前沿模型」，预计这个新系统将达到通往AGI（通用人工智能）的「下一个能力水平」。

到了2025年，有关发布时间的传闻消息更加密集。六月份，在奥特曼的访谈视频里，他说GPT-5「可能是在今年夏天的某个时候」会发布。

七月份，有媒体称为了应对欧盟的AI监管法律生效，OpenAI会在七月底发布GPT-5。之后，The Verge又透露OpenAI计划在八月初推出GPT-5。

昨天，X上还有网友截到了奥特曼发文说20个小时之后见，不过这条推文很快被删掉了，也无法证实奥特曼是否有发布该则推文。

而随着最近几天Perplexity、Cursor、Microsoft Copilot、Flowith、以及ChatGPT macOS应用和网站上，都开始有出现GPT-5的踪迹，我想发布的时间应该不会再拖太久。

更确切的信息，则是几天前《连线》杂志报道Anthropic切断了OpenAI对Claude API的访问。

OpenAI被指利用API对Claude的功能（如编码和创意写作）进行测试，并与其自家模型进行比较，而这被视为「构建竞争产品」，其行为是违反了Anthropic的商业条款。

OpenAI则对此表达了失望，称自己也为Anthropic提供了类似的API访问权限。

很明显这应该是OpenAI在为GPT-5最后的发布做准备。

目前，综合多个消息源的信息，GPT-5的发布时间仍是指向2025年8月初。

X上还有网友等麻了，揪着一条OpenAI研究员发布推文的时间，说这是为GPT-5的发布时间埋下了彩蛋，8:05就说明是八月五号。

「因为一天有1440分钟，为什么他刚好就在8:05发布了这则推文，这肯定不是巧合。」

Boris Power是OpenAI应用研究负责人，这条推文发布时间在相差13个小时时差的地区（加州时间）会显示8:05 AM。

GPT-5的发布时间快定下来吧，不然大家都等「疯」了。

版本：预计GPT-5将提供多个版本。主要的「推理整合版」将通过ChatGPT和API提供；「迷你版」（mini）也将登陆ChatGPT和API；而「纳米版」（nano）预计将仅通过API提供。

微软与OpenAI的协议：在那份披露的电话记录中，提到微软与OpenAI的新合作协议，实质是微软在利用OpenAI来弥补自身模型研发的不足（如优化Copilot和Bing），为自己的独立研发争取时间。协议中有意模糊了AGI的定义，更侧重于短期的技术互补。

协议中提到AGI的规定是，「当OpenAI实现通用人工智能后，微软将失去使用该初创公司先进技术的部分权利」。

爆料博主信息，他发推文表示自己不是电话记录里面那个回答的人，他觉得可以通过出售这个赚很多钱，但他决定免费发布。

挑战不断，GPT-5艰难的诞生背景

在这些亮眼的功能和发布信息背后，是一段充满挑战的研发历程，除了爆料里面提到OpenAI近期使用了17万至18万张GPU来完成GPT-5的训练，这一惊人的训练规模。

要理解GPT-5为何会选择这条路，根据The Information的独家报道，我们回顾了OpenAI近几年的技术演进路线。

1、缩放为王与「Orion」的陨落

从2020年的GPT-3到2023年的GPT-4，OpenAI乃至整个行业都信奉着「缩放定律」（Scaling Law）。即更大的模型、更多的数据，就能带来更强的智能。这一策略催生了ChatGPT的辉煌，但模型在逻辑、数学等需要严谨推理的领域始终步履维艰。

然而，这条路的尽头似乎比预想的更早到来。

在内部，一个代号为「Orion」的宏大项目曾被寄予厚望，它本该是GPT-5的前身，但现实却泼了一盆冷水。

研究人员发现，传统的预训练方法开始遭遇瓶颈，高质量的网络数据日益枯竭，许多在小模型上验证有效的训练技巧，在模型规模扩大后便神秘失效。

最终，Orion未能实现预期的性能飞跃，惨遭降级，并在2025年2月以GPT-4.5的名义悄然发布，很快便无人问津。这标志着OpenAI第一次在「缩放定律」这条路上撞上了南墙。

2、推理的成功与Q*的惊喜

幸运的是，另一条道路早已在悄然探索中。早在ChatGPT诞生之前，公司内部一个名为MathGen的团队就在默默研究如何让模型解决数学竞赛难题。

他们的工作，最终与强化学习（RL）和测试时计算（test-time computation，允许模型在推理过程中多思考一会儿）等技术结合，在2023年底引发了一场内部地震。

这就是后来广为人知的Q*（或称Strawberry）技术突破。它让模型首次能够解决从未见过的数学问题，其表现出的推理能力让研究员们震惊不已，甚至「看到了模型在思考、在犯错、在回溯、在沮丧，就像在阅读一个人的思考过程」。

3、「天才」的诞生与烦恼

Q*的突破直接催生了专注于推理的o系列模型（o1、o3）。这些「母体模型」在内部测试中展现出惊人的能力，它们被给予了更多的英伟达芯片算力，甚至被赋予了联网搜索和调用代码库的能力，从而在科学等领域取得了非凡的进步。

但「天才」也有烦恼。当研究人员试图将强大的o3母体模型转化为一个能与普通人对话的聊天版本时，它的性能出现了严重退化。一位内部人士将其形容为，为了迁就人类的语言，而将一个「用自己独特逻辑思考的天才」强行「降智」。

近期奥特曼的「凡尔赛」时刻

在焦急的等待中，OpenAI的高层也不断地在释放一些信号以更好的预热GPT-5。

CEO Sam Altman近期在一次播客节目中分享了一个亲身经历。

他向GPT-5提出了一个自己无法理解的难题，结果模型完美地解答了。他形容那一刻自己「感觉相对于AI毫无用处」，并称之为一种「怪异的感觉」。这无疑极大地拉高了外界的期待。

昨天，他又在X上分享了自己与GPT-5的聊天页面，他向GPT-5提问什么是最发人深省的AI题材电视剧，截图显示GPT-5向他推荐了《万神殿Pantheon》和《Devs》。

有用户评论说从这个截图看不出GPT-5和现在的ChatGPT有什么区别，但是这波热度是又被奥特曼拿下了。

ChatGPT agent发布的时候，我在社交媒体上看到一个评论。

里面说，以前是OpenAI做什么，大家跟着做什么，现在可能是Anthropic做什么，大家跟着做什么。

他提到OpenAI现在方方面面都比不上Anthropic，编程、幻觉抑制、安全、以及MCP都是属于Anthropic，而OpenAI却只是一直说自己拿了哪些benchmark。

今天，OpenAI看起来又拿下了一个榜单，「最会营销」的榜单。

在Anthropic、Google、Meta、xAI等强大对手的激烈竞争下，这次发布可能对OpenAI至关重要。

Logan Kilpatrick是Google DeepMind集团产品经理，Steven Heidel是OpenAI技术工程师，预计Gemini 3也快要发布。

GPT-5不仅要赢回在特定领域，像是编程这块失去的阵地；更要向世界证明，OpenAI是依然有能力引领AI走向更自主、更通用的未来前进。

附上部分参考资料地址：

https://www.theinformation.com/articles/inside-openais-rocky-path-gpt-5

https://www.theinformation.com/articles/openais-gpt-5-shines-coding-tasks

https://www.businessinsider.com/openai-ceo-sam-altman-teases-gpt-5-2025-8

https://www.theverge.com/notepad-microsoft-newsletter/712950/openai-gpt-5-model-release-date-notepad

https://www.wired.com/story/anthropic-revokes-openais-access-to-claude/

https://www.zdnet.com/article/this-one-feature-will-make-gpt-5-a-game-changer-if-openai-gets-it-right/

https://www.zdnet.com/article/openai-teases-imminent-gpt-5-launch-heres-what-to-expect/

欢迎加入APPSO AI社群，一起畅聊AI产品，获取#AI有用功，解锁更多AI新知

我们正在招募伙伴

简历投递邮箱hr@ifanr.com

✉️邮件标题「姓名+岗位名称」（请随简历附上项目/作品或相关链接）

秦英林：向品质进发

黄仁勋拿下200万美元大奖，罕见流露感性一面

热点科技快讯

人类唯一的出路: 变成人工智能（五）

本文来自微信公众号：Wait But Why（ID：wbwtimurban），...

报告：抖音海外版下载量突破10亿大关挑战Facebook

新浪科技讯北京时间2月28日早间消息，据美国财经媒体CNBC援...

推荐科技快讯

移动办公如何高效？谷歌研究了两年，发现了这七个秘密

神译局是36氪旗下编译团队，关注科技、商业、职场、生活等领域，...

人类唯一的出路：变成人工智能（三）

本文来自微信公众号：Wait But Why（ID：wbwtimurban），...

热门点击排行

问界商标转让释放信号：赛力斯与华为合作持续深入

报告：抖音海外版下载量突破10亿大关挑战Facebook

科技快讯分类导航

互联网创业

人工智能

大数据分析

行业热点

我们扒完了GPT-5全网爆料，奥特曼和OpenAI 这次的饼真不好画了

秦英林：向品质进发

黄仁勋拿下200万美元大奖，罕见流露感性一面

人类唯一的出路: 变成人工智能（五）

报告：抖音海外版下载量突破10亿大关 挑战Facebook

移动办公如何高效？谷歌研究了两年，发现了这七个秘密

人类唯一的出路：变成人工智能（三）

报告：抖音海外版下载量突破10亿大关挑战Facebook