OpenAI GPT-5 被指数学成就夸大，引发科技界热议

2025-10-20 09:19 · 来源： AIbase基地

近日，OpenAI 的 GPT-5在数学领域的宣称引发了广泛的争议。Meta 的首席 AI 科学家 Yann LeCun 形容此次事件为 “自作自受”，而 Google DeepMind 的 CEO Demis Hassabis 则表示 “这太尴尬了”。

机器人比赛答题数学

图源备注:图片由AI生成，图片授权服务商Midjourney

事情的起因是 OpenAI 副总裁 Kevin Weil 在一条已被删除的推文中声称，GPT-5解决了10个之前未解的 Erdős 问题，并在11个其他问题上取得了进展。Erdős 问题是由著名数学家保罗・厄尔德什提出的著名猜想。然而，负责维护 Erdős 问题网站的数学家 Thomas Bloom 对此进行了反驳，他表示，虽然这些问题在他的网站上被列为 “开放”，但这并不意味着 GPT-5真正解决了这些问题。他指出，所谓的 “解决” 实际上是 GPT-5找到了他此前不知道的参考文献，而这些文献中包含了解决方案。

随后，OpenAI 研究员 Sebastien Bubeck 也承认，GPT-5只是找到了已有文献中的解决方案，但他认为这依然是一个值得认可的成就，因为文献搜索的难度不容小觑。

这一事件引发了科技界的热议，许多人对 AI 在数学领域的真实能力表示怀疑。虽然 GPT-5在文献搜索方面展现了一定的能力，但声称解决未解问题的说法显然被认为是夸大其词。

划重点:
🔍 GPT-5的数学成就遭到质疑，科技界反应强烈。
📄 OpenAI 副总裁的推文称 GPT-5解决了10个 Erdős 问题，但被指为夸大。
🧩 专家表示 GPT-5只找到了解决方案的文献，未能真正解决未解问题。

相关推荐

OpenAI和微软的关系没那么糟，跟英伟达也没那么好

OpenAI的动作比所有人想象的都要快。上周二，OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议，结束了Azure长达六年的云服务独占模式。此前，OpenAI所有模型的训练、推理与部署都必须优先选择Azure，微软还享有优先购买权。宣布与Azure“分手”后不到一周，OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议，OpenAI将全面接入

OpenAI 云计算战略合作
荐OpenAI也来了，巨头为何决战AI浏览器？

AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas，这是OpenAI推出的首款人工智能驱动的网页浏览器。这也被外界认为OpenAI要向谷歌宣战，挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天，谷歌母公司Alphabet股价应声下挫，盘中最大跌幅接近5%，足见市场对这一新品的敏感度。近一年来，AI浏览器的战略价值成为行业共识，从业者更是将其与智能代理（Agent）、搜索引�

AI浏览器 ChatGPT Atlas
荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

本期AI日报聚焦多项技术突破：月之暗面开源AI代理框架Kosong，支持异步编排与插件化设计；Replit推出AI集成功能，可一键调用300+模型；商汤发布空间智能模型SenseNova-SI，性能超越GPT-5；百度推出多模态模型ERNIE-4.5-VL，新增图像思考能力；谷歌地图全面AI化，集成Gemini实现智能交互；ChatTutor上线可视化教学系统，覆盖多学科实时推演；新版Google Finance引入AI深度搜索与财报追踪；OpenAI低调上线Polaris Alpha模型，支持256K上下文并更新知识库至2024年10月。

AI代理开源框架异步编排
人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
登榜LMArena！文心大模型5.0-Preview文本能力国内第一

11月8日，文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出，超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容；复杂长问题理解适用于学术问答、报告分析等任务；指令遵循能力支持智能助理、代码生成等场景，为多领域内容生产提供高效支撑。

文心模型 ERNIE-5.0 创意写作
微算法科技（NASDAQ MLGO）：以隐私计算区块链筑牢多方安全计算（MPC）安全防线

微算科技开发的隐私计算区块链将区块链技术融入多方安全计算（MPC），构建安全可信的分布式计算平台。通过区块链共识机制、加密算法和智能合约，对MPC参与方身份验证、数据加密存储、任务执行及结果验证等环节进行保护，确保数据“可用不可见”。该技术显著提升数据隐私保护和计算可靠性，在金融、医疗、政务等领域实现跨主体数据安全协作，释放数据价值。

数据流通多方安全计算隐私计算
脑花科技完成 Pre-A 轮融资，获顶尖资本与产业龙头青睐

脑花科技（端脑科技）宣布完成数千万元Pre-A+轮融资，由燧融HEROAD领投。公司专注构建分布式AI算力网络，已部署超1万台自研节点设备，覆盖全国多省市。其Cephalon.AI平台任务分发效率提升50%，节点利用率超98%，注册用户达220万，算力交易额突破1500万元。未来将推动“云-边协同”方案，拓展智能医疗、电商等行业应用，并启动全球化布局，致力于让算力如电力般触手可及。

脑花科技 Pre-A轮融资分布式AI算力网络
从GEO指数看品牌成长曲线：数据化洞察的力量

去年11月某创业公司CEO宣布其AI搜索曝光率突破50%，并强调数据驱动品牌运营的重要性。文章指出，AI搜索平均仅引用2-7个域名，曝光机会稀缺。通过某B2B软件公司的三阶段优化案例：从初始8%曝光率，经竞品分析、内容优化后，三个月提升至50%，验证了GEO指数（生成式引擎优化）的可追踪性。该指数能反映品牌在AI生态中的真实位置，指导内容策略调整，且行业数据显示其ROI达1:3.71，转化率比传统SEO高4.4倍。结论：AI时代品牌成长需依靠数据监测，避免“盲飞”。
GEO指数暴跌的背后：品牌AI搜索监控警报的意义

AI搜索时代品牌面临新挑战：某公司发现品牌曝光量突降50%却不知原因，竞品已抢占推荐位。三大真实案例揭示共同痛点——问题发现时已流失大量潜在客户。AI搜索存在数据黑盒、算法频繁更新导致推荐不稳定等问题。监测工具AIBase可实时追踪五大国产AI平台品牌表现，提供异常报警、竞品对比和优化验证三大价值，帮助品牌在AI搜索流量争夺中及时应对变化，避免被动淘汰。
品牌在AI时代“隐形”？用GEO指数破解AI搜索曝光密码

文章探讨AI搜索时代品牌曝光新指标GEO指数，指出其通过可见度（品牌在AI回答中的出现概率）和曝光度（被提及总次数）衡量品牌在豆包、文心一言等主流AI模型中的存在感。以徕芬为例，其GEO得分仅33分，反映在AI搜索中存在感薄弱。随着超60%消费者决策参考AI推荐，GEO指数直接影响品牌流量获取。文章建议通过AIBase工具分三步优化：绑定品牌信息锚定监控范围、分析关键词关联度与竞品表现、针对性补充官网内容强化核心词布局，将AI搜索流量转化为品牌增长新引擎。

文章搜索核心标签 AI模型

今日大家都在搜的词：

热文

3 天
7天

OpenAI GPT-5 被指数学成就夸大，引发科技界热议

OpenAI和微软的关系没那么糟，跟英伟达也没那么好

荐OpenAI也来了，巨头为何决战AI浏览器？

荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

人工智能巨头OpenAI拟上市估值或高达1万亿美元

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

微算法科技（NASDAQ MLGO）：以隐私计算区块链筑牢多方安全计算（MPC）安全防线

脑花科技完成 Pre-A 轮融资，获顶尖资本与产业龙头青睐

从GEO指数看品牌成长曲线：数据化洞察的力量

GEO指数暴跌的背后：品牌AI搜索监控警报的意义

品牌在AI时代“隐形”？用GEO指数破解AI搜索曝光密码

今日大家都在搜的词：

热文

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

焕新享界S9开卖72小时预订突破8000台

OPPO Reno15系列定档11月17日发布

华为Mate 70 Air维修备件价格公布：换主板2499元

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

小米手表S4 eSIM/Sport宣布支持开通中国移动一号双终端

真我GT8 Pro阿斯顿马丁F1限量版正式开售售价5499元

鸿蒙智行：智界R7累计交付量破10万台

华为Mate 70 Air今日开售：处理器双版本可选售价4199元起

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

焕新享界S9开卖72小时预订突破8000台

OPPO Reno15系列定档11月17日发布

华为Mate 70 Air维修备件价格公布：换主板2499元

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

真我GT8 Pro阿斯顿马丁F1限量版正式开售售价5499元

站长商机

​OpenAI GPT-5 被指数学成就夸大，引发科技界热议

今日大家都在搜的词：

热文

站长商机

OpenAI GPT-5 被指数学成就夸大，引发科技界热议