GPT-5基准测试泄露，被曝7月31日发布？打游戏如“魔法级AI” - 池汛池网

分享好友最新资讯首页最新资讯分类切换频道

GPT-5基准测试泄露，被曝7月31日发布？打游戏如“魔法级AI”

2025-08-07 05:27

编辑：Aeneas

【新智元导读】GPT-5要来了，来势汹汹！泄露的基准测试+Minecraft实测，直接让全网惊掉下巴：代号Zenith的GPT-5-pro在游戏中如行云流水，被称为「魔法级AI」。更有爆料称它将于7月31日发布，吊打Grok 4 Heavy！OpenAI这是又要掀桌了？

一大早，关于GPT-5的消息又来了。

这些泄露的GPT-5基准测试，很可能是真实的。

甚至还有一个炸裂消息：GPT-5将于7月31日发布。

为此，现在所有GPT-5模型，已正式退出WebDev竞技场。

不过还有另外的说法，来自Menlo Ventures投资人Deedy，以及The Verge、The Information等外媒，据说GPT-5会在8月亮相。

虽然GPT-5还没来，但有关它的实测已经全网满天飞了。

就在刚刚，又有一位放出了GPT-5在Minecraft中的实测。准确地说，是内部代号zenith的GPT-5-pro。

这位网友评价道：「令人印象深刻，简直就是魔法！OpenAI确实做出了一些令人难以置信的东西。」

在这个视频中，GPT-5行云流水地一次性完成了游戏任务，表现实在惊艳。

把网友们的期待值拉得这么高，GPT-5正式发布的时候必然得超级炸裂了，否则都不知道该怎么收场。

还有一个重磅爆料，来自知名爆料人Jimmy Apple。

根据他的说法，很多内部评估人员对GPT-5的评价是——比Grok 4 Heavy还要强。

GPT-5要来，全员屏息等待

现在，GPT-5的气息是越来越近了。

甚至有人发现，当自己在app中选择o3时，竟意外测试到了某个版本的GPT-5。

不小心测到GPT-5的人，越来越多。

关于它本周上线的消息，也得到了越来越多人的证实。

而The Verge的说法稍有不同，根据他们的情报，GPT-5将于8月初发布，包括mini和nano版本。

此前曾有开发者发现，GPT-5在内部被命名为「推理alpha版」。

同时，一个代号「o3-alpha」的模型，才上线了12小时就迅速下架，许多人公认：这就是GPT-5的早期壳。

根据OpenAI惯例，从测试到发布间隔最短仅4天，所以，GPT-5真的已经相当近了。

就在昨天，大家已经发现了GPT-5可以在LMArena上使用。同时被发现的还有Zenith模型。

下面这些实例，也已经被全网疯转。

生成来自遥远未来的星舰控制面板。

创建一个流媒体网站。

在机器人行走方面完美呈现SVG动画。

史上最好的菠萝防御游戏。

融合o系列和GPT系列

毫无疑问，现在GPT-5已经是全球最受期待的模型。

很多人相信，GPT-5将是一个意义非凡的里程碑，将吸引数百万用户加入AI生态系统。

接下来，我们会梳理一番过去这段时间，GPT-5被提及的种种蛛丝马迹。

在关于OpenAI智能体的一次直播中，GPT-5就曾被提及。

当时的关键信息是：这个令人惊叹的前沿模型，将首次统一两个系列的模型，集中了o系列在推理方面的突破，以及GPT系列在多模态方面的突破。

因为ChatGPT有各种型号的模型，每个模型都有自己独特的功能和突出的特点，如果GPT-5真的是每个单一模型最佳部分的集合，很显然用户体验将彻底改变。

比如用过o3的人就知道，从GPT-4o到o3的飞跃有多么疯狂。

这一点，早在今年2月，就得到了OpenAI CPO Kevin Weil的证实。

网友问道：你们会制作模型路由器，还是它们会以系统的方式更加统一？Weil表示，会更统一

另外还有一个疑似OpenAI内部员工的爆料。他表示，研究者们的确尝试了路由方法，不过产生了很多幻觉。

所以，他们在测试一个能规划、推理、可以像扩展一样运用智能体的模型。

然后就是外媒The Information的一些爆料了。

总结来说就是，GPT-5编码极强。

在自然科学领域，推理更深入；

在浏览器里自动完成复杂任务；

写作更流畅，逻辑更在线；

更重要的是：在编码上有炸裂提升！

根据一位体验者的说法，GPT-5不仅更善于解决学术和编程竞赛问题上，甚至在处理现实世界工程师面对的实际编程任务时，表现都更加惊艳了。

比如那种包含大量屎山遗留代码的庞杂代码库，它都能进行修改，完全没在怕的。

正是这种处理复杂场景的细致能力，让OpenAI的模型过去始终落后于Anthropic。毕竟在开发者群体中，大家都公认，Claude才是真正的编程王者。

一位体验者亲测后表示，GPT-5在编程上，甚至直接胜过了Anthropic的Claude Sonnet 4！

另外的说法就是，GPT-5不是一个统一的模型，而是一个路由器机制。

它会根据问题的类型，把你的提问发送给一个擅长闲聊GPT大模型，或是一个擅长逻辑和推理的o系列模型。

最终我们所看到的GPT-5的表现，就是这俩模型组合拳的效果。

甚至还有OpenAI高管私下这样预言——

我们在不换架构的前提下，有信心做到GPT-8。

也就是说，OpenAI并没有打算卷新架构，而是靠更聪明的调度、更强的推理、更多的后训练数据，一步一步把现有技术用到极致。

GPT-5，会给世界带来什么？

同时，奥特曼在最近的采访中关于「GPT-5让自己觉得毫无用处」的说法，让更多人期待值拉满了。

也有人说，GPT-5很可能是目前AI领域正在发生的最危险的事情之一。

比如奥特曼就在这次采访中提到，很多人整天都在和AI聊天，甚至把它当作自己的男友或女友。

还有一些孩子们，在成长过程中完全靠着滚动屏幕的方式获取多巴胺。这几件事都很危险。

当主持人问出：如何防止AI产生与社交媒体相同的负面影响？奥特曼诚实地承认道：我很害怕这件事，我没有答案。

令人担忧的是，就在前几天，一位OpenAI的投资人承认，自己因为整天使用ChatGPT，已经出现了一些不正常的状况。

也就是说，即使是有钱人，也会因为跟AI聊天被诱发精神病。

奥特曼甚至表示，自己对给地球上的每个人发放免费运行的GPT-5十分感兴趣。

当这些AI产品和服务以1/100成本被提供时，很显然，某些经济体会迅速转型和瓦解。

但是，不管会给世界造成怎样的狂潮，GPT-5要上线的架势，如今已经是无法阻挡了。

参考资料：

https://x.com/chetaslua/status/1949905375546708242

https://www.youtube.com/watch?v=0jDsWemXi3U

最新文章

音乐舒缓职工身心！市总工会心灵驿站受欢迎

为做好疫情防控常态化下干部职工心理关爱服务工作，加强对干部职工的人文关怀，积极营造崇尚劳动、共谋发展的浓厚氛围，近日，市

48名新队员光荣入队！一起来看新西小学一年级分批入队仪式

在“六一”国际儿童节到来之际，为了做好充分的少先队入队前教育工作，使首批入队的30%的队员达到入队的标准，同时为下一批入队

扶持个体户，山西出台24条措施！

3月8日，山西省出台《关于支持个体工商户倍增质升的若干措施》，力争大力激发我省个体经济发展活力，推动个体工商户倍增质升。据

服务的东莞网站制作东莞网页设计东莞网站建设

980元起网站建设+域名空间+企业邮箱全套服务。星河科技大型网络公司9年网站建设经验、网络营销、网站优化,企业邮箱，400电话，

字节跳动上百名员工食物中毒宣判！云海肴被罚3.9万元，案发第二天店内发现超10只活蟑螂

7月17日下午，曾致字节跳动新加坡公司百余名员工食物中毒，该事件餐饮供应商云海肴，被判最高罚款7000新加坡元（约3.9万元人民币

厂家直供依托咪酯

依托咪酯飞机:@opq2025产品价格:电议产品规格:25公斤/桶中文名称:依托咪酯中文别名:R-(+)-1-(1-苯乙基)-1-氢-咪唑-5-甲酸乙酯; (

创70年之最的欧洲足球决战，竟是一场“中国德比”？

在体育营销方面，海信持续追求深度和广度，通过科技力量的展示，借助体育赛事强大的辐射力，将中国品牌的品质和文化传递到世界各

建行阜阳市分行营业部持续写好“养老金融”大文章

中央金融工作会议提出，要做好养老金融等五篇大文章。养老金融是指为了应对老龄化挑战，围绕社会成员的各种养老需求所进行的金融

北京市发布首批116个市区重点融资需求项目总投资约1609亿元

京密路三期、城市运动中心（一期）、大红门数智产业大厦升级改造……1月24日上午，2025年北京市重点项目融资工作会上发布了116个

金铲铲之战正式进军海外，今年将在东南亚地区上线

2024年10月16日，的游戏开发商和发行商拳头游戏宣布，英雄联盟的自走棋策略手游现已在泰国、马来西亚和新加坡开启预注册。玩家可

推荐文章

云游戏《黑神话·悟空》喂饭级体验：办公本摸鱼神器，甚至只用电视就能玩！

鄂州公安：烟火升腾处，夜“警”与平安“同框”

童声“议”事龙池社区小居民变身文明“啄木鸟”

警方回答日常生活中如何避免个人信息泄露？

数智赋能再升级！中信银行“小天元”平台焕新助力中小企业发展

中信银行长春世纪广场支行开展“反诈是门必修课，筑牢防线守好责”主题宣传活动

相关文章

民生银行梅江支行开展香港留学教育规划主题沙龙活动

仅播6集就榜单第一，赵本山一出手，国产剧又有天花板了

亿田智能：与SMEG和思美科签署经销协议

比特币价格站上历史高位，还会继续涨吗

厄齐尔推特写＂诗＂怼中国究竟说了啥？权威翻译曝光

10万竞彩大奖花落谁家？(组图)

“和合共进”鲁南制药集团第一届生态伙伴大会举行（附名单）

工行合肥颍上路支行暖心服务圈粉客户

“疯狂英语”变“疯狂加盟”：项目书称9.9万加盟年收益2000万，李阳直播卖课遇冷转战线下