首页 > 业界 > 关键词  > GPT-5发布最新资讯  > 正文

博士水平的GPT-5依然翻车 OpenAI奥特曼:AGI已失去意义

2025-08-12 08:58 · 稿源: 快科技

据快科技8月11日消息,上周末OpenAI公司推出了传闻已久的GPT-5大模型,宣称是目前极为先进的人工智能模型,具备博士级智能水准。

GPT-5发布后在多个榜单上名列前茅,像编程、数学等榜单,总共斩获了25个榜首位置,评分成绩相当惊人。

然而上线后,GPT-5的实际表现遭人质疑,跑分第一并不意味着实际体验最佳,甚至不少用户觉得其表现有所退步,反应也变迟缓了,这恐怕是OpenAI旗舰大模型中翻车最快的一个了。

鉴于此,OpenAI公司在最近几天进行了整改,之前因GPT-5发布而下架的GPT-4o、o3、o4-mini、GPT-4.1以及GPT-4.5等模型,结果又不得不恢复GPT-4o模型的使用。

在GPT-5未上线前,它被视作最接近AGI的,也就是大众所期待的通用AI时代的标志,CEO奥特曼也曾一度鼓吹GPT-5就能达成AGI,可此次的表现也让他在AGI的表态上有所收敛。

今日在接受采访时,奥特曼表示AGI这个词已没什么意义了,各界对其定义分歧众多,与其一直纠结于这个模糊概念,倒不如专注AI的实际表现。

奥特曼称有人认为AGI就是能让AI完成世界上大部分工作,但这个标准本身就存在问题,因为工作类型不断在变,关键不在于这些定义,而是AI能力会呈指数级增长,人类会愈发依赖这些技术。

虽说奥特曼也承认GPT-5未达AGI的标准,不过他表示OpenAI依旧会将AGI当作终极目标去追寻。

博士水平的GPT-5依然翻车 OpenAI奥特曼:AGI已失去意义

举报

  • 相关推荐
  • OpenAI发布GPT-5-Codex:可完成7小时单次编程任务

    OpenAI宣布推出新一代AI编程模型GPT-5-Codex,其最大亮点是创新的动态时间分配系统。 不同于传统AI追求秒级响应”,该模型可根据任务复杂度灵活调整处理时长,从数秒到7小时不等,以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称,传统模型在任务初期即固定计算资源,而GPT-5-Codex能实时评估需求:动态决定加速推进、暂停语法核�

  • 性能超越GPT-4o及Qwen2.5-VL,百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

    百度发布超轻量级文字识别模型PP-OCRv5,仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型,尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别,适用于教育、医疗、法律等多行业数字化需求,累计下载量超900万,是GitHub上唯一Star数超5万的中国OCR项目。

  • 马斯克:Grok 5模型有望实现通用人工智能的突破

    马斯克旗下xAI公司正研发Grok 5模型,有望实现通用人工智能(AGI)重大突破。该模型采用全新架构设计,预计未来几周启动训练。若成功将代表AI从专用领域向通用认知能力的质的飞跃,被视为人工智能发展的终极目标。科技界密切关注xAI能否在激烈竞争的大模型赛道实现突破。

  • 美团发布高效推理模型LongCat-Flash-Thinking:部分性能接近GPT5

    9月23日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时,性能更强大、更专业,在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力,扩展了形式化定理证明能力,成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出,多项基准测试成绩领先开源及闭源顶尖模型,已在HuggingFace、Github全面开源。

  • 每日互动参与发起《人工智能安全行业自律倡议》 守护人工智能产业可持续发展

    9月17日,2025年国家网络安全宣传周人工智能安全治理分论坛在昆明召开,会上正式发布《人工智能安全行业自律倡议》。该倡议由中国网络空间安全协会联合多家科研院所、互联网头部企业、网络安全厂商及人工智能企业共同发起,提出筑牢安全根基、强化技管结合、深化协同共治等七方面共识,旨在推动构建可控、可信、可靠的人工智能产业生态,为全球人工智能治理贡献中国智慧。

  • 市值一日暴增近3000亿港元,阿里迈向超级人工智能之路

    9月24日,阿里巴巴股价创下四年新高,单日涨超9%,市值达到约3.32万亿港元,一日增加近3000亿港元。 引爆股价的,是阿里集团每年一度的云栖大会。在会上,阿里释放多条重磅消息,尤其是在阿里集团CEO、阿里云智能集团董事长兼CEO吴泳铭的演讲结束后,阿里的股价表现就出现了明显的拉升。

  • Qwen3-Max成阿里通义“地表最强”:性能超GPT5 数学推理直接满分

    9月24日,2025云栖大会开幕,阿里通义千问旗舰模型Qwen3-Max重磅亮相,性能超越GPT-5、Claude+Opus 4等,跻身全球前三。该模型包含指令和推理两大版本,预训练数据量达36T tokens,总参数超万亿,具备极强编程和工具调用能力。在SWE-Bench测试中,指令版斩获69.6分全球第一;Tau2-Bench工具调用测试达74.8分,超越同类模型。推理增强版Qwen3-Max-Thinking在数学推理测试中获满分,国内首次突破。通义千问系列已实现全尺寸覆盖,包含三百多个模型。即日起,用户可在QwenChat免费体验Qwen3-Max,或通过阿里云百炼平台调用API服务。

  • 百度文心大模型X1.1正式发布:超越DeepSeek R1、打平GPT-5

    今天,在WAVE SUMMIT深度学习开发者大会2025上,百度文心大模型X1.1正式发布,在事实性、指令遵循、智能体等能力上均提升显著。 百度王海峰介绍,文心大模型X1是基于文心大模型4.5训练而来的深度思考模型,升级后的X1.1主要采用了迭代式混合强化学习训练框架。 一方面通过混合强化学习,同时提升通用任务和智能体任务的效果;另一方面通过自蒸馏数据的迭代式生产及训练

  • 十方融海:以开源生态为基,绘就“人工智能 +”产业融合新蓝图

    国务院印发《关于深入实施“人工智能+”行动的意见》,推动AI技术与产业深度融合。深圳企业十方融海凭借AI大模型研发、产品创新及开源生态构建等领域的卓越实践,成为行业先锋。其开源模型如OpenBuddy、小智AI等突破传统技术局限,实现多模态交互与跨领域知识融合,覆盖教育、办公、养老、文体等多元场景。通过开放共享模式,十方融海有效降低AI应用门槛,激发行业创新活力,助力我国人工智能产业迈向新征程。

  • 小米15T/15T Pro发布:小米最强天玑旗舰 5400元起

    9月25日,小米在海外正式发布15T和15T Pro两款旗舰手机。15T起售价650欧元(约5400元),15T Pro起售价800欧元(约6700元),均为12GB+256GB起步。两款机型设计基本一致,主要差异在核心配置:15T Pro搭载天玑9400+处理器、144Hz刷新率屏幕、90W有线+50W无线充电,后置三摄支持8K视频录制;15T采用天玑8400-Ultra、120Hz屏幕、67W有线快充。两者均配备6.83英寸OLED屏、5500mAh电池及相似影像系统。

今日大家都在搜的词: