本文源自:金融界
北京时间8月8日凌晨,OpenAI正式发布了备受瞩目的新一代人工智能模型GPT-5。这场长达1个多小时的线上发布会规格之高、细节之多,引发了全球科技界的广泛关注。GPT-5的发布,不仅标志着AI技术的一次巨大飞跃,更被视为构建“超级智能”的重要一步。
性能全面升级,多领域“屠榜”
GPT-5在多个领域的表现都迎来了全面提升。在文本生成、Web开发和视觉感知能力领域,GPT-5均排名第一;在硬提示、编码、数学、创造力、长查询等方面也毫无悬念地拔得头筹。在代号为“峰会”的测试中,GPT-5保持着截至目前最高的Arena分数,堪称实至名归的“屠榜”者。
OpenAI首席执行官Sam Altman对GPT-5的评价极高,他比喻说,如果说GPT-4像中学生,GPT-5就像大学生,而GPT-5则是第一次让他真正感觉像在与一位博士级别的专家交谈。他甚至断言,GPT-5是世界上编码能力最强、写作能力最强以及在医疗保健领域最强的模型。
告别“幻觉”,AI更可靠
“AI幻觉”一直是困扰大型语言模型的难题,但GPT-5在这方面取得了显著进步。与GPT-4o相比,GPT-5在联网搜索时回答出现事实错误的概率降低了45%;在独立思考时,回答出错的概率更是比OpenAI o3降低了80%。
此外,GPT-5还引入了四种全新的“人格”模式,包括犬儒、机器人、倾听者和学霸,用户可以根据自己的喜好设定ChatGPT与自己互动和回答问题的方式。
编码能力逆天,“软件按需生成”时代来临
GPT-5的编码能力堪称逆天。在多个编码基准测试中,GPT-5的表现均优于其他任何模型。在人类最终测试中取得42%的成绩,在SWE基准测试中更是达到了75%的成绩。
在发布会上,OpenAI的后期训练负责人Yann Dubois现场演示了GPT-5的强大编码能力,要求它生成一个用于学习法语并带有互动游戏的网站。GPT-5在短短几秒钟内就编写了数百行代码,并直接展示了网站的前端界面。
此外,GPT-5还展示了一款仅靠一段提示词就创作的3D游戏,其画面精致,物理效果也十分逼真。
更安全、更“诚实”
OpenAI对GPT-5进行了超过五千小时的测试,以确保其安全性。GPT-5在更可靠地处理多步骤任务方面表现更好,不会像以前那样“自信地撒谎”。对于一些可能涉及安全风险的问题,GPT-5会采用“安全补全”机制,在保持安全约束的前提下,给出尽可能有帮助的答案。
全面开放,多版本满足不同需求
GPT-5向所有用户开放,包括普通用户、Plus会员和Pro会员。普通用户可以免费体验GPT-5,但用量有限;Plus会员可获得更多使用量;Pro会员则可以访问具备更强推理能力的GPT-5 Pro版本。GPT-5系列还包括GPT-5-mini、GPT-5-nano等版本,以满足不同用户的需求。
在定价方面,标准版GPT-5每百万输入Token 1.25美元,每百万输出Token 10美元,mini版和Nano版的定价则相对较低。
集成架构,智能调度子模型
GPT-5采用了内嵌式三位一体集成架构,由处理常规问题的GPT-5-main模型、解决复杂任务的GPT-5-thinking深度思考模型、实时决策的路由机制以及额度使用完后启动的mini版本组成。路由机制会根据对话类型、复杂程度、工具需求以及用户的明确意图,快速决定使用哪个模型,自动匹配最适合的模型,用户无需手动切换。
发布于:北京
相关推荐
AI领域迎来重大突破!GPT-5震撼发布,性能全面升级、多领域“屠榜”,告别“幻觉”?
创维壁纸电视618“屠榜”背后:全链路创新让对手“抄不了”
刚刚,GPT-5正式发布,奥特曼:这是全球最好的模型
2023年3月安兔兔安卓旗舰性能榜出炉,高通骁龙8Gen2再屠榜
NeurIPS 2019放榜:华人作者贡献42%,谷歌170篇屠榜;国内清华第一,腾讯领衔产业界
AI:跨越幻觉抵达真相
蚂蚁出手!这个万亿市值的领域,迎来重要进展
发布自研大模型,夸克App将迎来全面升级
我们扒完了GPT-5全网爆料,奥特曼和OpenAI 这次的饼真不好画了
出海速递 | 宁王闯欧洲:喜忧参半的海外淘金路/实测GPT-5:写作坠入谷底,编程一骑绝尘
网址: AI领域迎来重大突破!GPT-5震撼发布,性能全面升级、多领域“屠榜”,告别“幻觉”? http://m.xishuta.com/newsview140161.html