博士水平的GPT-5依然翻车 OpenAI奥特曼：AGI已失去意义

2025-08-12 08:58 · 稿源：快科技

据快科技8月11日消息，上周末OpenAI公司推出了传闻已久的GPT-5大模型，宣称是目前极为先进的人工智能模型，具备博士级智能水准。

GPT-5发布后在多个榜单上名列前茅，像编程、数学等榜单，总共斩获了25个榜首位置，评分成绩相当惊人。

然而上线后，GPT-5的实际表现遭人质疑，跑分第一并不意味着实际体验最佳，甚至不少用户觉得其表现有所退步，反应也变迟缓了，这恐怕是OpenAI旗舰大模型中翻车最快的一个了。

鉴于此，OpenAI公司在最近几天进行了整改，之前因GPT-5发布而下架的GPT-4o、o3、o4-mini、GPT-4.1以及GPT-4.5等模型，结果又不得不恢复GPT-4o模型的使用。

在GPT-5未上线前，它被视作最接近AGI的，也就是大众所期待的通用AI时代的标志，CEO奥特曼也曾一度鼓吹GPT-5就能达成AGI，可此次的表现也让他在AGI的表态上有所收敛。

今日在接受采访时，奥特曼表示AGI这个词已没什么意义了，各界对其定义分歧众多，与其一直纠结于这个模糊概念，倒不如专注AI的实际表现。

奥特曼称有人认为AGI就是能让AI完成世界上大部分工作，但这个标准本身就存在问题，因为工作类型不断在变，关键不在于这些定义，而是AI能力会呈指数级增长，人类会愈发依赖这些技术。

虽说奥特曼也承认GPT-5未达AGI的标准，不过他表示OpenAI依旧会将AGI当作终极目标去追寻。

博士水平的GPT-5依然翻车 OpenAI奥特曼：AGI已失去意义

（举报）

相关推荐

关键词：

OpenAI发布GPT-5-Codex：可完成7小时单次编程任务

OpenAI宣布推出新一代AI编程模型GPT-5-Codex，其最大亮点是创新的动态时间分配系统。不同于传统AI追求秒级响应”，该模型可根据任务复杂度灵活调整处理时长，从数秒到7小时不等，以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称，传统模型在任务初期即固定计算资源，而GPT-5-Codex能实时评估需求：动态决定加速推进、暂停语法核�

GPT-5-Codex 动态时间分配 AI编程模型
性能超越GPT-4o及Qwen2.5-VL，百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

百度发布超轻量级文字识别模型PP-OCRv5，仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型，尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别，适用于教育、医疗、法律等多行业数字化需求，累计下载量超900万，是GitHub上唯一Star数超5万的中国OCR项目。

PP-OCRv5 轻量级OCR 文字识别模型
马斯克：Grok 5模型有望实现通用人工智能的突破

马斯克旗下xAI公司正研发Grok 5模型，有望实现通用人工智能（AGI）重大突破。该模型采用全新架构设计，预计未来几周启动训练。若成功将代表AI从专用领域向通用认知能力的质的飞跃，被视为人工智能发展的终极目标。科技界密切关注xAI能否在激烈竞争的大模型赛道实现突破。

Grok 5 AGI
美团发布高效推理模型LongCat-Flash-Thinking：部分性能接近GPT5

9月23日，美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时，性能更强大、更专业，在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平（SOTA），部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力，扩展了形式化定理证明能力，成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出，多项基准测试成绩领先开源及闭源顶尖模型，已在HuggingFace、Github全面开源。

高效推理模型 LongCat-Flash-Thinking 开源模型
每日互动参与发起《人工智能安全行业自律倡议》守护人工智能产业可持续发展

9月17日，2025年国家网络安全宣传周人工智能安全治理分论坛在昆明召开，会上正式发布《人工智能安全行业自律倡议》。该倡议由中国网络空间安全协会联合多家科研院所、互联网头部企业、网络安全厂商及人工智能企业共同发起，提出筑牢安全根基、强化技管结合、深化协同共治等七方面共识，旨在推动构建可控、可信、可靠的人工智能产业生态，为全球人工智能治理贡献中国智慧。

人工智能安全行业自律倡议网络安全
市值一日暴增近3000亿港元，阿里迈向超级人工智能之路

9月24日，阿里巴巴股价创下四年新高，单日涨超9%，市值达到约3.32万亿港元，一日增加近3000亿港元。引爆股价的，是阿里集团每年一度的云栖大会。在会上，阿里释放多条重磅消息，尤其是在阿里集团CEO、阿里云智能集团董事长兼CEO吴泳铭的演讲结束后，阿里的股价表现就出现了明显的拉升。

阿里巴巴云栖大会股价
Qwen3-Max成阿里通义“地表最强”：性能超GPT5 数学推理直接满分

9月24日，2025云栖大会开幕，阿里通义千问旗舰模型Qwen3-Max重磅亮相，性能超越GPT-5、Claude+Opus 4等，跻身全球前三。该模型包含指令和推理两大版本，预训练数据量达36T tokens，总参数超万亿，具备极强编程和工具调用能力。在SWE-Bench测试中，指令版斩获69.6分全球第一；Tau2-Bench工具调用测试达74.8分，超越同类模型。推理增强版Qwen3-Max-Thinking在数学推理测试中获满分，国内首次突破。通义千问系列已实现全尺寸覆盖，包含三百多个模型。即日起，用户可在QwenChat免费体验Qwen3-Max，或通过阿里云百炼平台调用API服务。

云栖大会 Qwen3-Max 通义千问
百度文心大模型X1.1正式发布：超越DeepSeek R1、打平GPT-5

今天，在WAVE SUMMIT深度学习开发者大会2025上，百度文心大模型X1.1正式发布，在事实性、指令遵循、智能体等能力上均提升显著。百度王海峰介绍，文心大模型X1是基于文心大模型4.5训练而来的深度思考模型，升级后的X1.1主要采用了迭代式混合强化学习训练框架。一方面通过混合强化学习，同时提升通用任务和智能体任务的效果；另一方面通过自蒸馏数据的迭代式生产及训练

百度文心大模型深度学习智能体
十方融海：以开源生态为基，绘就“人工智能 +”产业融合新蓝图

国务院印发《关于深入实施“人工智能+”行动的意见》，推动AI技术与产业深度融合。深圳企业十方融海凭借AI大模型研发、产品创新及开源生态构建等领域的卓越实践，成为行业先锋。其开源模型如OpenBuddy、小智AI等突破传统技术局限，实现多模态交互与跨领域知识融合，覆盖教育、办公、养老、文体等多元场景。通过开放共享模式，十方融海有效降低AI应用门槛，激发行业创新活力，助力我国人工智能产业迈向新征程。

人工智能政策引领 AI大模型
小米15T/15T Pro发布：小米最强天玑旗舰 5400元起

9月25日，小米在海外正式发布15T和15T Pro两款旗舰手机。15T起售价650欧元（约5400元），15T Pro起售价800欧元（约6700元），均为12GB+256GB起步。两款机型设计基本一致，主要差异在核心配置：15T Pro搭载天玑9400+处理器、144Hz刷新率屏幕、90W有线+50W无线充电，后置三摄支持8K视频录制；15T采用天玑8400-Ultra、120Hz屏幕、67W有线快充。两者均配备6.83英寸OLED屏、5500mAh电池及相似影像系统。

小米15T 小米15T Pro

今日大家都在搜的词：

热文

3 天
7天

博士水平的GPT-5依然翻车 OpenAI奥特曼：AGI已失去意义

OpenAI发布GPT-5-Codex：可完成7小时单次编程任务

性能超越GPT-4o及Qwen2.5-VL，百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

马斯克：Grok 5模型有望实现通用人工智能的突破

美团发布高效推理模型LongCat-Flash-Thinking：部分性能接近GPT5

每日互动参与发起《人工智能安全行业自律倡议》守护人工智能产业可持续发展

市值一日暴增近3000亿港元，阿里迈向超级人工智能之路

Qwen3-Max成阿里通义“地表最强”：性能超GPT5 数学推理直接满分

百度文心大模型X1.1正式发布：超越DeepSeek R1、打平GPT-5

十方融海：以开源生态为基，绘就“人工智能 +”产业融合新蓝图

小米15T/15T Pro发布：小米最强天玑旗舰 5400元起

今日大家都在搜的词：

热文

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

小米17系列开售5分钟破25年国产手机首销纪录

小米17/Pro/Pro Max今日首销：4499元起

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Co

5299元！小米17标准版新增16GB+1TB版本：10月5日发售

雷军：小米17 Pro Max很多门店已经缺货

iPhone调休闹钟上热搜苹果客服回应：需手动设置

雷军晒第100次健身打卡提前3个月完成健身目标

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

京东双11购物节官宣：10月9日晚8点开启

微信新功能上线：长按图片“搜一搜” 检索购物转表一键达

华为WATCH GT 6/Pro系列手表发布售价1488元起

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

AI日报：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布

AI日报：接入MJ！夸克发布造点AI；Wan2.5-Preview发布；可灵推

理想i6正式上市：首销直减1万限时售价23.98万元

AI日报：生数科技推出Vidu Q2；火山引擎推出炉米Lumi；通义千问

雷军大方推荐友商产品：不买YU7 可以考虑Model Y和理想i6

小米非常非常缺人上热搜雷军谈小米成功秘诀

雷军称没什么好犹豫的：50岁正是闯的年纪

站长商机