首页 > 科技快讯 > 我们扒完了GPT-5全网爆料,奥特曼和OpenAI 这次的饼真不好画了

我们扒完了GPT-5全网爆料,奥特曼和OpenAI 这次的饼真不好画了

本文来自微信公众号:APPSO (ID:appsolution),作者:发现明日产品的,原文标题:《我们扒完了 GPT-5 全网爆料,奥特曼和 OpenAI 这次的饼真不好画了》

如果炒作是奥运项目的话,Sam Altman的奖牌数将创下纪录。

在X上,这是网友对这段时间GPT-5营销狂轰滥炸的锐评。

从OpenAI宣布自己达到了IMO金牌水平以来,对它高热度营销的诟病就一直没有停下来过。

几乎每天,都有一点关于GPT-5的消息被「不经意」地放出。一会儿是Altman在播客上感叹自己「相对于AI毫无用处」;一会儿是The Information深度报道其内部挑战重重;一会儿又是在X上晒出与GPT-5的聊天截图……

大家的胃口是被吊足了,但关于产品的核心信息,却始终若隐若现。

过去一段时间来,GPT-5貌似一直是「最热的未来产品」。从去年开始就陆续有媒体在爆料,发布时间的传闻从去年一路传到今年8月。

结果是,OpenAI的确在刷新各种benchmark,但大家期待的GPT-5却迟迟没有现身。

根据OpenAI官方模型发布公告整理

OpenAI的benchmark越是刷新,大家的兴奋感反而越低。毕竟,马斯克都要靠二次元动漫角色Ani来获得流量关注了,而Grok 4刷新了多少榜单根本提不起大家的兴趣。

所以,OpenAI看起来也转向了一种新节奏,靠不断「暗示」、不断「吊胃口」来保持热度。

我们整理了近期所有关于GPT-5的爆料和报道,试图跳出这套营销叙事,看清在漫长的预热背后,OpenAI接下来到底在押什么注。GPT-5在真正到来之前,还有哪些值得关注的信号。

GPT-5的核心升级,统一了基础和推理模型

与以往更新不同,GPT-5的最大亮点并非空泛的跑分提升,而是在多模态、软件工程和AI智能体(Agent)这三个极具实用价值的领域,展现了相当大的性能提升。

实现「完整的多模态」能力

这是最新爆料中最大、也最令人兴奋的特性。据专栏SemiconSam博主@Jukanlosreve公开的一份专家电话会议纪要透露,GPT-5最显著的特点是「多模态能力的显著提升,实现了一个完整的多模态模型」。

这意味着它在处理和生成图文、音视频等多种信息流上的能力将远超以往,有望带来「吉卜力时刻」的用户体验,并在发布后登顶绝大多数评测榜单。

软件工程能力的大幅提升

GPT-5不再局限于解决算法竞赛题,而是能深入到大型、陈旧、复杂的企业级代码库中进行修改和维护。这被视为OpenAI直接挑战Anthropic Claude在编程领域优势地位的重磅武器。

一位测试者甚至表示,在他们的横向比较中,GPT-5的表现优于Anthropic的Claude Sonnet 4。

同时,作为OpenAI最重要的合作伙伴,微软内部员工在测试后透露,GPT-5在产出高质量代码的同时,并没有消耗更多的计算资源。

X上有用户分享通过OpenAI API免费尝试了GPT-5,并用它做了一个六边形振动测试的HTML页面,看起来效果确实很不错。

真正可用的AI Agent

更强的推理能力,意味着GPT-5能更好地理解和执行复杂的多步骤指令,从而以更少的人工监督来执行多步骤任务,向着能够自主完成任务的「AI智能体」迈出了关键一步。

例如,有媒体称它可以遵循一套复杂的规则,来判断自动客服代理是否应该批准退款,而此前的模型则需要大量具体案例才能学会。

攻克主观领域的「通用验证器」

为了解决推理模型难以评估的问题,OpenAI开发了一项名为「通用验证器」(universal verifier)的技术。

值得关注的是,这项名为「通用验证器」的工作,还是Ilya之前带领的超级对齐团队在去年完成的。

它的本质上是另一个AI,专门负责检查和评估主模型的回答质量,即使是在没有标准答案的场景下。因此GPT-5不仅在编程和数学等可验证领域表现出色,在创意写作、策略分析等主观性更强的领域也取得了进步。

这项技术也是OpenAI能在国际数学奥林匹克竞赛中摘金的关键。

Reddit上也有网友分享自己透过OpenAI API获得了GPT-5的访问权限,并用GPT-5生成了一张图片,他在评论区里面提到生成这张图片用了50多秒,他倾向于认为所使用的并不是GPT-5 mini版本。

而我们使用ChatGPT-4o生成的图像则更像是简笔画。

要实现上述强大的功能,GPT-5依赖于其最核心的一项变化:一个能自动为用户选择最优解的智能调度系统。

综合多家媒体的报道,与以往单纯追求更大参数规模的路径不同,GPT-5旨在将传统的GPT语言模型与专注于推理的「o」系列模型(如o1、o3)整合在一起。

如果你跟我一样曾经对GPT-4o、o4、GPT-4.1等令人眼花缭乱的模型名称感到困惑,那么GPT-5的首要目标就是终结我们的「选择困难症」。

ChatGPT内提供的模型,有擅长编码、分析、处理日常任务、写作、推理等等

一些研究人员推测,GPT-5可能并非单一模型,而是一个智能「路由系统」,能根据用户问题的难度,动态选择调用最合适的模型来处理。

对于简单请求:它会调用更快速、成本更低的GPT系列模型,实现即时响应。

对于复杂难题:如STEM(科学、技术、工程和数学)或深度编程问题,它会自动切换到更强大的推理模型,进行更深入的「思考」,确保答案的质量。

OpenAI ChatGPT负责人Nick Turley对此的愿景是:「我们的目标是让普通用户无需再思考该用哪个模型」。相反,目标是让GPT-5自动为用户的任务选择最佳模型。

发布、版本与最后的悬念

时间:虽然早在2023年末,就有媒体称OpenAI可能会在2024春季或夏季发布GPT-5。然而到了2024年5月,OpenAI的官方当时表示,

近些日子已经开始训练公司的「下一代前沿模型」,预计这个新系统将达到通往AGI(通用人工智能)的「下一个能力水平」。

到了2025年,有关发布时间的传闻消息更加密集。六月份,在奥特曼的访谈视频里,他说GPT-5「可能是在今年夏天的某个时候」会发布。

七月份,有媒体称为了应对欧盟的AI监管法律生效,OpenAI会在七月底发布GPT-5。之后,The Verge又透露OpenAI计划在八月初推出GPT-5。

昨天,X上还有网友截到了奥特曼发文说20个小时之后见,不过这条推文很快被删掉了,也无法证实奥特曼是否有发布该则推文。

而随着最近几天Perplexity、Cursor、Microsoft Copilot、Flowith、以及ChatGPT macOS应用和网站上,都开始有出现GPT-5的踪迹,我想发布的时间应该不会再拖太久。

更确切的信息,则是几天前《连线》杂志报道Anthropic切断了OpenAI对Claude API的访问。

OpenAI被指利用API对Claude的功能(如编码和创意写作)进行测试,并与其自家模型进行比较,而这被视为「构建竞争产品」,其行为是违反了Anthropic的商业条款。

OpenAI则对此表达了失望,称自己也为Anthropic提供了类似的API访问权限。

很明显这应该是OpenAI在为GPT-5最后的发布做准备。

目前,综合多个消息源的信息,GPT-5的发布时间仍是指向2025年8月初。

X上还有网友等麻了,揪着一条OpenAI研究员发布推文的时间,说这是为GPT-5的发布时间埋下了彩蛋,8:05就说明是八月五号。

「因为一天有1440分钟,为什么他刚好就在8:05发布了这则推文,这肯定不是巧合。」

Boris Power是OpenAI应用研究负责人,这条推文发布时间在相差13个小时时差的地区(加州时间)会显示8:05 AM。

GPT-5的发布时间快定下来吧,不然大家都等「疯」了。

版本:预计GPT-5将提供多个版本。主要的「推理整合版」将通过ChatGPT和API提供;「迷你版」(mini)也将登陆ChatGPT和API;而「纳米版」(nano)预计将仅通过API提供。

微软与OpenAI的协议:在那份披露的电话记录中,提到微软与OpenAI的新合作协议,实质是微软在利用OpenAI来弥补自身模型研发的不足(如优化Copilot和Bing),为自己的独立研发争取时间。协议中有意模糊了AGI的定义,更侧重于短期的技术互补。

协议中提到AGI的规定是,「当OpenAI实现通用人工智能后,微软将失去使用该初创公司先进技术的部分权利」。

爆料博主信息,他发推文表示自己不是电话记录里面那个回答的人,他觉得可以通过出售这个赚很多钱,但他决定免费发布。

挑战不断,GPT-5艰难的诞生背景

在这些亮眼的功能和发布信息背后,是一段充满挑战的研发历程,除了爆料里面提到OpenAI近期使用了17万至18万张GPU来完成GPT-5的训练,这一惊人的训练规模。

要理解GPT-5为何会选择这条路,根据The Information的独家报道,我们回顾了OpenAI近几年的技术演进路线。

1、缩放为王与「Orion」的陨落

从2020年的GPT-3到2023年的GPT-4,OpenAI乃至整个行业都信奉着「缩放定律」(Scaling Law)。即更大的模型、更多的数据,就能带来更强的智能。这一策略催生了ChatGPT的辉煌,但模型在逻辑、数学等需要严谨推理的领域始终步履维艰。

然而,这条路的尽头似乎比预想的更早到来。

在内部,一个代号为「Orion」的宏大项目曾被寄予厚望,它本该是GPT-5的前身,但现实却泼了一盆冷水。

研究人员发现,传统的预训练方法开始遭遇瓶颈,高质量的网络数据日益枯竭,许多在小模型上验证有效的训练技巧,在模型规模扩大后便神秘失效。

最终,Orion未能实现预期的性能飞跃,惨遭降级,并在2025年2月以GPT-4.5的名义悄然发布,很快便无人问津。这标志着OpenAI第一次在「缩放定律」这条路上撞上了南墙。

2、推理的成功与Q*的惊喜

幸运的是,另一条道路早已在悄然探索中。早在ChatGPT诞生之前,公司内部一个名为MathGen的团队就在默默研究如何让模型解决数学竞赛难题。

他们的工作,最终与强化学习(RL)和测试时计算(test-time computation,允许模型在推理过程中多思考一会儿)等技术结合,在2023年底引发了一场内部地震。

这就是后来广为人知的Q*(或称Strawberry)技术突破。它让模型首次能够解决从未见过的数学问题,其表现出的推理能力让研究员们震惊不已,甚至「看到了模型在思考、在犯错、在回溯、在沮丧,就像在阅读一个人的思考过程」。

3、「天才」的诞生与烦恼

Q*的突破直接催生了专注于推理的o系列模型(o1、o3)。这些「母体模型」在内部测试中展现出惊人的能力,它们被给予了更多的英伟达芯片算力,甚至被赋予了联网搜索和调用代码库的能力,从而在科学等领域取得了非凡的进步。

但「天才」也有烦恼。当研究人员试图将强大的o3母体模型转化为一个能与普通人对话的聊天版本时,它的性能出现了严重退化。一位内部人士将其形容为,为了迁就人类的语言,而将一个「用自己独特逻辑思考的天才」强行「降智」。

近期奥特曼的「凡尔赛」时刻

在焦急的等待中,OpenAI的高层也不断地在释放一些信号以更好的预热GPT-5。

CEO Sam Altman近期在一次播客节目中分享了一个亲身经历。

他向GPT-5提出了一个自己无法理解的难题,结果模型完美地解答了。他形容那一刻自己「感觉相对于AI毫无用处」,并称之为一种「怪异的感觉」。这无疑极大地拉高了外界的期待。

昨天,他又在X上分享了自己与GPT-5的聊天页面,他向GPT-5提问什么是最发人深省的AI题材电视剧,截图显示GPT-5向他推荐了《万神殿Pantheon》和《Devs》。

有用户评论说从这个截图看不出GPT-5和现在的ChatGPT有什么区别,但是这波热度是又被奥特曼拿下了。

ChatGPT agent发布的时候,我在社交媒体上看到一个评论。

里面说,以前是OpenAI做什么,大家跟着做什么,现在可能是Anthropic做什么,大家跟着做什么。

他提到OpenAI现在方方面面都比不上Anthropic,编程、幻觉抑制、安全、以及MCP都是属于Anthropic,而OpenAI却只是一直说自己拿了哪些benchmark。

今天,OpenAI看起来又拿下了一个榜单,「最会营销」的榜单。

在Anthropic、Google、Meta、xAI等强大对手的激烈竞争下,这次发布可能对OpenAI至关重要。

Logan Kilpatrick是Google DeepMind集团产品经理,Steven Heidel是OpenAI技术工程师,预计Gemini 3也快要发布。

GPT-5不仅要赢回在特定领域,像是编程这块失去的阵地;更要向世界证明,OpenAI是依然有能力引领AI走向更自主、更通用的未来前进。

附上部分参考资料地址:

https://www.theinformation.com/articles/inside-openais-rocky-path-gpt-5

https://www.theinformation.com/articles/openais-gpt-5-shines-coding-tasks

https://www.businessinsider.com/openai-ceo-sam-altman-teases-gpt-5-2025-8

https://www.theverge.com/notepad-microsoft-newsletter/712950/openai-gpt-5-model-release-date-notepad

https://www.wired.com/story/anthropic-revokes-openais-access-to-claude/

https://www.zdnet.com/article/this-one-feature-will-make-gpt-5-a-game-changer-if-openai-gets-it-right/

https://www.zdnet.com/article/openai-teases-imminent-gpt-5-launch-heres-what-to-expect/

欢迎加入APPSO AI社群,一起畅聊AI产品,获取#AI有用功,解锁更多AI新知

我们正在招募伙伴

简历投递邮箱hr@ifanr.com

✉️邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)

相关推荐

DeepSeek打服OpenAI:GPT-5将免费
全网苦等GPT-5,超级对齐团队遗作成重要线索,奥特曼发话“惊喜很多”
OpenAI“截胡”IMO金牌,奥特曼为GPT-5献上“核弹级”预热
比尔·盖茨:GPT-5不会比GPT-4好多少
奥特曼回应Ilya/Jan离职,暗示GPT-5发布会推迟 |笔记
“剧透”一下OpenAI的GPT-5
奥特曼回忆OpenAI宫斗第一季:一生中最奇特的时刻
OpenAI宣布GPT-5推迟数月发布 技术整合难度成倍上升
训练18个月GPT-5跳票!AI大模型的泡沫要破裂了?
OpenAI奥特曼迎来史诗级劲敌!比马斯克可怕100倍!

网址: 我们扒完了GPT-5全网爆料,奥特曼和OpenAI 这次的饼真不好画了 http://m.xishuta.com/newsview139965.html

所属分类:行业热点