首页 > 业界 > 关键词  > GPT5最新资讯  > 正文

GPT5发布,槽点竟多过亮点:AGI没来,AI公司肉搏时代来了

2025-08-08 15:00 · 稿源: 硅星人Pro公众号

声明:本文来自于微信公众号 硅星人Pro,作者:Yoky,授权站长之家转载发布。

我们至今不知道让奥特曼“瘫倒在椅子上”的是什么力量。

因为人们等待许久的GPT-5发布,至少从大家第一时间对发布会的感受来看,居然是槽点,甚至笑料多过了亮点……

几个月前,甚至发布前,都不会有人想到,这么万众期待的模型发布,被传播最多的会是多张让人哭笑不得的错误图表:

而这几乎就是发布会给人们感受的一个缩影。

大量工作在争夺用户注意力上,不少不错的细节提升,但没有大的惊喜,甚至一度有些好笑,“AGI”还早,肉搏时代开启了。

GPT5来了,模型没有到AGI时刻,甚至连“aha moment”也没有。

正如发布前的剧透,GPT-5采用了“All in one”策略,将推理、编码、语音、研究等能力整合进单一模型,根据用户需求自动调取相应能力。在各个垂直领域,GPT-5都刷新了基准测试成绩,其中编程能力的进化最为显著,无论你是专业的开发者,还是小白尝试vibe Coding,它都在模型能力上做了优化。

API方面,他首次考虑到了广大用户的钱包,开启了一轮大降价。企业用户可以通过自己的预算来调低中高档位,分别为GPT-5标准版、GPT-5-mini版、GPT-5-nano版。其中GPT-5-mini 的价格低于谷歌的 Gemini2.5Flash,而 GPT-5Standard 的价格仅为 Claude4Opus 的十二分之一。

新模型的案例演示、再次被刷新的Benchmark、被打下来的API价格,几乎构成了这场发布会的全部。但不同的是,在最后三分一,OpenAI加入了一些并不那么炫酷的企业案例分享,展示了他们如何通过模型帮助企业构建自己的应用,同时增加了一个专门服务于企业的模型 GPT-5-chat:面向客服场景,延迟 <200ms。

而这些,才是GPT-5发布的真正意图:他们想要的已经不是技术Demo的掌声,而是企业客户的真金白银。GPT-5不是代际跨越的炸裂模型,而是OpenAI准备投入到商业肉搏的底牌。

结合Sam Altman此前在X上关于SaaS的预判,一旦企业能够基于GPT-5自主构建应用,传统SaaS模式确实面临冲击。

但这也证明了一个更深层的现实:整个AI行业都已从技术炫技转向商业落地的关键阶段,连OpenAI也不例外。

一个模型,多种智能

发布的开始,Sam Altman就代表OpenAI ,认为这不是一次简单的升级,而是一次智能的「次元跳跃」。

官方宣称它引入了一个全新的「智能路由」系统,能秒级判断你的问题难度,自动调用合适的「大脑」来回答。普通问题用「高效大脑」快速响应,复杂问题则自动切换到「深度思考大脑」。这种快思考和慢思考的结合,在今年更早的时候,已经有部分模型产品通过Autothink已经实现。

GPT-5首次把 GPT 系列与 o 系列推理模型融合,形成单一多模态架构。上下文窗口扩展至1M tokens,输出可达10万 tokens,支持 MCP(模型上下文协议)与并行工具调用。四个变体全部面向代码场景优化:

• gpt-5:旗舰,长链推理 + 全模态;

• gpt-5-mini:成本↓60%,保留90% 编程性能;

• gpt-5-nano:端侧离线32K,延迟 <40ms;

• gpt-5-chat:企业级对话,CI/CD 集成插件化。

针对不同的场景,GPT-5都做了单项优化,比如写作中的语感优化、语音对话功能多语种灵活切换能力,GPT-5也在新的 ARC-AGI-2上进行了测试。除 Grok4(思考)外,它的表现优于所有主要模型。

但最可圈可点的,是在整个Coding能力上再次提高了一个水准。代码能力覆盖了两种场景,一种是低提示词的非专业用户场景,

在发布会上,OpenAI 的后期训练负责人 Yann Dubois 使用 GPT-5现场演示,要求它生成一个用于学习法语、并带有互动游戏的网站。在短短几秒钟内,GPT-5就编写了数百行代码,并直接展示了网站的前端界面。他在 Zoom 上分享屏幕并进行了简单的点击操作,一个看起来非常酷炫的网站便生成了。

在 Canvas 中,GPT-5可以快速一次性完成前端应用程序,以保证没有免费又好用的编码模型的用户,能够实现真正的Vibe Coding。

在专业编程场景,GPT-5支持一键上传整个前后端仓库,秒级生成可视化“代码地图”,分层展示模块依赖、性能瓶颈及安全漏洞,并给出优先级列表;针对遗留代码,它能自动剔除无用依赖、统一命名风格、补全类型注解,同时生成 Git 回滚脚本,确保重构零风险。

同时模型原生支持 Python、Typescript、Rust、Go、Solidity 等20余种语言混合项目,可智能识别跨语言调用链,自动生成 FFI 绑定、序列化代码及对应的 Docker 多阶段构建文件,无需人工干预即可打通开发与部署全链路。

当然,尽管OpenAI一直在强调“GPT-5是世界上最好的编程模型”,但在 OpenAI 的展示中,却出现了Benchmark图的坐标轴“作弊”的行为,不仅有52.8>69.1这样的弱智错误,也实际上夸大了 GPT-5的能力提升。

抛开一些“小插曲”,GPT-5的确把“写代码”升级为“交付软件”,从单文件补全到跨语言、跨框架、端到端的工程代理。开发者获得的不仅是更快的自动补全,而是一键可部署、可测试、可维护的工程团队。

为了尽可能的保证模型的可用性,OpenAI花了不少时间用来降低模型幻觉。模型安全研究负责人 Alex Beutel 透露,OpenAI 为评估 GPT-5的潜在风险,累计投入逾五千小时进行深度测试,核心目标之一是杜绝模型向用户“撒谎”。

尽管相比 o3推理模型,GPT-5的幻觉有所收敛,但“言之凿凿的假话”仍是大型语言模型难以根除的顽疾;尤其在模型扮演智能体、执行多步骤任务时,这一隐患会被进一步放大。 不过,OpenAI 强调,GPT-5在连贯完成复杂流程方面更值得信赖。Beutel 指出,过去曾出现模型宣称已达成目标却实际未行动的情况,如今团队正着力堵住此类漏洞。

整体来说,GPT-5在模型、产品、场景进行了综合的优化提升,它可能不是某一个领域绝对的尖子生,但却是全能的ACE。

用低价突围商业化

“卷价格”常常被形容是中国大模型厂商们的做法,而这次OpenAI告诉大家,你们错了,我卷起来更狠。

面向个人用户,OpenAI采取了免费先用、分级限速的策略。从今天起,所有 ChatGPT 账号都能直接体验 GPT-5,无需排队。免费层每天有一定额度,用完即自动降级到 GPT-5-mini 继续对话。Plus 会员额度翻倍,Pro 会员则可调用“GPT-5Pro”这一高推理档位。换句话说,OpenAI 把7亿 C 端用户当成了「默认入口」,但真正的算盘并不在这里。

面向企业客户则出现了明显的低价抢市场。根据官网消息,标准版 GPT-5:输入1.25美元 / 百万 token,输出10美元 / 百万 token,比 GPT-4时代普遍低30–50%。mini 与 nano 再砍一刀,分别低至0.3美元和0.05美元 / 百万 token,几乎逼近自托管成本。

企业套餐还附带零保留、私有端点、并发翻倍,整体算下来,同等算力支出可节省40% 以上。

显然,OpenAI 这次把火力瞄准了 B 端:用超低 API 价格把企业从自研或竞争对手那里直接“挖”过来,C 端免费只是流量入口和口碑放大器。

显然,新的价格让这些“苦o3久矣”的开发者们十分满意,当GPT-5标准版仅为Claude4Opus十二分之一价格时,那些靠“性价比”立足的平替厂商将面临生存危机。

参考国内上一轮的模型“价格战”,基础模型市场将迎来残酷的优胜劣汰。中小模型厂商要么在垂直领域找到差异化定位,要么被迫退出竞争。

当然,推理成本的大幅下降直接降低了AI应用的准入门槛。当调用成本不再是制约因素,更多企业和开发者将尝试将AI能力集成到产品中。软件的边际成本持续降低,将催生新一轮应用创新浪潮,从工具类应用到消费级产品都将受益。

从技术突破到价格屠夫,从能力炫技到场景落地,OpenAI这次发布的核心逻辑异常清晰:用成本优势和产品整合来重塑整个AI生态的游戏规则。

当GPT-5以白菜价提供接近人类专家水平的能力时,它实际上是在向整个行业宣战——不仅要抢夺竞对的市场份额,更要让传统软件服务商感受到降维打击的压力。这种策略转变标志着AI行业从“技术驱动”正式迈入“商业驱动”阶段。

GPT-5不是技术的终点,而是商业肉搏战更进一步的信号。接下来,像是meta离谱高价抢夺人才,OpenAI发布会的“图表错误”,Anthropic断供二选一之类的事情,会比让人惊叹的模型大跃升和各种“Aha moment ”更多的出现在你面前。

举报

  • 相关推荐
  • GPT-5有望明天发布 OpenAI:免费无限使用

    OpenAI宣布将于太平洋时间7月4日上午10点(北京时间7月5日凌晨1点)举办重要直播活动。官方预告中"LIVESTREAM"误写为"LIVE5TREAM",引发网友猜测可能暗示GPT-5即将发布。消息称免费版ChatGPT将在标准设置下开放GPT-5对话功能,但会设置防滥用阈值;Plus和Pro用户则可享受更智能的GPT-5服务,包括语音交互、绘图创作等高级功能。此前CEO奥特曼曾透露GPT-5将整合多项前沿技术。若属实,这将是AI爱好者的重大福利,也将进一步提升ChatGPT的实用性和用户体验。

  • OpenAI正式发布GPT-5模型 网友:写作像诗人

    OpenAI在直播活动中正式推出新一代人工智能模型GPT-5,宣称其覆盖编程、数学、写作、健康咨询、视觉感知等核心领域,实现"公司迄今为止最重大的模型升级"。OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)形容,与GPT-5交互如同与各领域专家对话,其多维度能力突破将重塑人机协作模式。 分层开放策略满足多元需求 GPT-5将于本周四启动全球用户分批推送,免费用户与付�

  • GPT-5横空出世:API最低0.40美元,人人享“博士级智慧”

    OpenAI正式发布新一代旗舰模型GPT-5,CEO奥尔特曼称其智能水平如同与博士级专家对话。该模型在写作、编码、医疗等核心领域表现突出,幻觉率大幅降低80%,输出token数量减少50%-80%。GPT-5系列包含多个版本,其中GPT-5nano的API价格低至0.4美元/百万token,极具竞争力。基准测试显示GPT-5以68分位居榜首,超越Grok-4等对手。OpenAI同时宣布向所有用户开放使用,并计划升级语音模式,探索

  • 减少幻觉、不再谄媚!OpenAI:即日起 史上最强大的GPT-5将免费提供给用户

    这是我们迄今为止最智能、最快、最实用的模型,具有内置思维,可将专家级智能交到每个人手中。” OpenAI在官方新闻稿中写道,这是我们迄今为止最优秀的人工智能系统。GPT-5的智能性能远超我们之前的所有模型,在编码、数学、写作、健康、视觉感知等领域均拥有卓越的性能。 GPT-5 不仅在基准测试中超越了之前的模型,回答问题的速度也更快,而且最重要的是,它对现�

  • GPT-5和Claude 4 Opus谁更强?用这个AI大模型对比工具一眼明了

    OpenAI正式发布GPT-5,与Claude4Opus和Gemini2.5Pro进行对比测试。GPT-5在编程能力(SWE-bench测试74.9%)和数学推理(AIME2025测试94.6%)表现突出;Claude4Opus编程优异(72.5%)但数学较弱(33.9%);Gemini2.5Pro擅长长文本处理(100万token窗口)和多模态应用。价格方面,GPT-5和Gemini2.5Pro定价相近($1.25-$10),Claude4Opus较高($15-$75)。建议根据需求选择:GPT-5适合综合应用,Claude4Opus适合专业编程,Gemini2.5Pro适合长文档�

  • 奥特曼发布免费用GPT-5!基准图错误遭全网吐槽 马斯克也拆台了

    当地时间8月7日,OpenAI 推出全新人工智能模型 GPT-5。 据悉,GPT-5是OpenAI的首个统一”人工智能模型,它融合了o系列模型的推理能力以及GPT系列快速响应的优势。 借助GPT-5,ChatGPT能够代表用户完成多种任务,例如生成软件应用、管理用户日程或创建研究简报。 并且,GPT-5将作为默认模型向所有ChatGPT免费用户开放,用户也能借此体验深度推理功能。 不过,据媒体机器之心Pro”

  • GPT-5正式发布:与Claude 4、Gemini 2.5等主流大模型谁更胜一筹?

    2025年8月7日,OpenAI正式发布GPT-5,官方称其为"最智能、最快速、最实用"的AI模型。GPT-5在数学推理能力上大幅提升,在AIME2025测试中取得94.6%的高分,处理速度也有明显改善。但与竞争对手相比仍存在差距:Claude4在代码生成和逻辑推理方面表现优异,支持200K token长文本;Gemini2.5具备2M超大上下文窗口和全模态支持;国产模型DeepSeek R1在中文理解和性价比方面具有优势。AI�

  • OpenAI发布2款开源模型:gpt-oss系列 能力接近o3和o4-mini

    OpenAI发布开源模型系列GPT-OSS,包含120B和20B两个版本。120B旗舰模型适配单H100 GPU架构,20B轻量版适合边缘计算。两款模型均开放完整推理链监控接口,支持动态参数调节和任务微调优化,性能接近闭源的GPT-O3和O4-mini。该系列突破性地支持代理功能,包括网页交互和Python代码执行,在标准化测试中表现优异。开源策略为开发者提供高性能替代方案,重新定义了AI模型的应用边界。

  • AI日报:扣子空间网页设计功能上线;阿里Wan 2.2即将上线;​OpenAI即将发布 GPT-5

    【AI日报】今日AI领域重要动态:1)Coze推出网页AI设计功能,5分钟生成网页;2)通义千问发布Qwen-MT翻译模型,支持92种语言;3)ChatGPT全面推出Agent功能;4)阿里云Wan2.2视频生成AI即将上线;5)Anthropic推出审计Agent提升AI对齐测试;6)OpenAI计划8月发布GPT-5;7)谷歌发布无代码AI应用开发工具Opal;8)南洋理工与上海AI Lab推出PhysX-3D项目,为3D模型添加物理属性;9)快手开源KAT-V1大模型,40B版本性能接近DeepSeek-R1;10)讯飞星火X1升级版上线,在多语言和语音处理方面显著提升。(140字)

  • AI日报:GPT-5-Auto现身Mac客户端;阿里开源WebAgent项目WebShaper;腾讯推X-Omni多模态模型

    【AI日报】今日AI领域重要动态:1)阿里开源WebAgent项目WebShaper,GAIA评测超越Claude4-Sonnet;2)Moonvalley推出草图转视频功能,支持手绘生成电影级视频;3)腾讯X-Omni模型实现图文理解重大突破;4)百度搜索测试AI应用中心入口;5)Midjourney+新增个性化推荐功能;6)GPT-5或于2025年夏季发布;7)Ollama推出桌面客户端;8)OWL团队开源多智能体协作工具Eigent;9)OpenAI年收入激增至120亿美元;10)英伟达H20芯片因安全风险被约谈;11)万兴科技天幕2.0模型国内排名第四,与华为云共建AI视频实验室。

热文

  • 3 天
  • 7天