首页 > AI头条  > 正文

​OpenAI GPT-5 被指数学成就夸大,引发科技界热议

2025-10-20 09:19 · 来源: AIbase基地

近日,OpenAI 的 GPT-5在数学领域的宣称引发了广泛的争议。Meta 的首席 AI 科学家 Yann LeCun 形容此次事件为 “自作自受”,而 Google DeepMind 的 CEO Demis Hassabis 则表示 “这太尴尬了”。

机器人比赛 答题 数学

图源备注:图片由AI生成,图片授权服务商Midjourney

事情的起因是 OpenAI 副总裁 Kevin Weil 在一条已被删除的推文中声称,GPT-5解决了10个之前未解的 Erdős 问题,并在11个其他问题上取得了进展。Erdős 问题是由著名数学家保罗・厄尔德什提出的著名猜想。然而,负责维护 Erdős 问题网站的数学家 Thomas Bloom 对此进行了反驳,他表示,虽然这些问题在他的网站上被列为 “开放”,但这并不意味着 GPT-5真正解决了这些问题。他指出,所谓的 “解决” 实际上是 GPT-5找到了他此前不知道的参考文献,而这些文献中包含了解决方案。

随后,OpenAI 研究员 Sebastien Bubeck 也承认,GPT-5只是找到了已有文献中的解决方案,但他认为这依然是一个值得认可的成就,因为文献搜索的难度不容小觑。

这一事件引发了科技界的热议,许多人对 AI 在数学领域的真实能力表示怀疑。虽然 GPT-5在文献搜索方面展现了一定的能力,但声称解决未解问题的说法显然被认为是夸大其词。

划重点:

🔍 GPT-5的数学成就遭到质疑,科技界反应强烈。

📄 OpenAI 副总裁的推文称 GPT-5解决了10个 Erdős 问题,但被指为夸大。

🧩 专家表示 GPT-5只找到了解决方案的文献,未能真正解决未解问题。

  • 相关推荐
  • OpenAI和微软的关系没那么糟,跟英伟达也没那么好

    OpenAI的动作比所有人想象的都要快。 上周二,OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议,结束了Azure长达六年的云服务独占模式。此前,OpenAI所有模型的训练、推理与部署都必须优先选择Azure,微软还享有优先购买权。 宣布与Azure“分手”后不到一周,OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议,OpenAI将全面接入

  • OpenAI也来了,巨头为何决战AI浏览器?

    AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas,这是OpenAI推出的首款人工智能驱动的网页浏览器。 这也被外界认为OpenAI要向谷歌宣战,挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天,谷歌母公司Alphabet股价应声下挫,盘中最大跌幅接近5%,足见市场对这一新品的敏感度。 近一年来,AI浏览器的战略价值成为行业共识,从业者更是将其与智能代理(Agent)、搜索引�

  • AI日报:月之暗面开源AI新框架Kosong;百度发布新模型ERNIE-4.5-VL;GPT-5.1“隐身”登场

    本期AI日报聚焦多项技术突破:月之暗面开源AI代理框架Kosong,支持异步编排与插件化设计;Replit推出AI集成功能,可一键调用300+模型;商汤发布空间智能模型SenseNova-SI,性能超越GPT-5;百度推出多模态模型ERNIE-4.5-VL,新增图像思考能力;谷歌地图全面AI化,集成Gemini实现智能交互;ChatTutor上线可视化教学系统,覆盖多学科实时推演;新版Google Finance引入AI深度搜索与财报追踪;OpenAI低调上线Polaris Alpha模型,支持256K上下文并更新知识库至2024年10月。

  • 人工智能巨头OpenAI拟上市 估值或高达1万亿美元

    OpenAI正积极推进上市计划,据知情人士透露,该公司可能最早于2026年下半年向证券监管机构提交上市申请,目标在2027年正式上市。 此次IPO的估值有望达到约1万亿美元,或将跻身全球规模最大的IPO之列。 在初步讨论中,OpenAI曾考虑通过上市筹集至少600亿美元资金,实际融资规模可能进一步扩大。

  • 登榜LMArena!文心大模型5.0-Preview文本能力国内第一

    11月8日,文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出,超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容;复杂长问题理解适用于学术问答、报告分析等任务;指令遵循能力支持智能助理、代码生成等场景,为多领域内容生产提供高效支撑。

  • 微算法科技(NASDAQ MLGO):以隐私计算区块链筑牢多方安全计算(MPC)安全防线

    微算科技开发的隐私计算区块链将区块链技术融入多方安全计算(MPC),构建安全可信的分布式计算平台。通过区块链共识机制、加密算法和智能合约,对MPC参与方身份验证、数据加密存储、任务执行及结果验证等环节进行保护,确保数据“可用不可见”。该技术显著提升数据隐私保护和计算可靠性,在金融、医疗、政务等领域实现跨主体数据安全协作,释放数据价值。

  • 脑花科技完成 Pre-A 轮融资,获顶尖资本与产业龙头青睐

    脑花科技(端脑科技)宣布完成数千万元Pre-A+轮融资,由燧融HEROAD领投。公司专注构建分布式AI算力网络,已部署超1万台自研节点设备,覆盖全国多省市。其Cephalon.AI平台任务分发效率提升50%,节点利用率超98%,注册用户达220万,算力交易额突破1500万元。未来将推动“云-边协同”方案,拓展智能医疗、电商等行业应用,并启动全球化布局,致力于让算力如电力般触手可及。

  • 从GEO指数看品牌成长曲线:数据化洞察的力量

    去年11月某创业公司CEO宣布其AI搜索曝光率突破50%,并强调数据驱动品牌运营的重要性。文章指出,AI搜索平均仅引用2-7个域名,曝光机会稀缺。通过某B2B软件公司的三阶段优化案例:从初始8%曝光率,经竞品分析、内容优化后,三个月提升至50%,验证了GEO指数(生成式引擎优化)的可追踪性。该指数能反映品牌在AI生态中的真实位置,指导内容策略调整,且行业数据显示其ROI达1:3.71,转化率比传统SEO高4.4倍。结论:AI时代品牌成长需依靠数据监测,避免“盲飞”。

  • GEO指数暴跌的背后:品牌AI搜索监控警报的意义

    AI搜索时代品牌面临新挑战:某公司发现品牌曝光量突降50%却不知原因,竞品已抢占推荐位。三大真实案例揭示共同痛点——问题发现时已流失大量潜在客户。AI搜索存在数据黑盒、算法频繁更新导致推荐不稳定等问题。监测工具AIBase可实时追踪五大国产AI平台品牌表现,提供异常报警、竞品对比和优化验证三大价值,帮助品牌在AI搜索流量争夺中及时应对变化,避免被动淘汰。

  • 品牌在AI时代“隐形”?用GEO指数破解AI搜索曝光密码

    文章探讨AI搜索时代品牌曝光新指标GEO指数,指出其通过可见度(品牌在AI回答中的出现概率)和曝光度(被提及总次数)衡量品牌在豆包、文心一言等主流AI模型中的存在感。以徕芬为例,其GEO得分仅33分,反映在AI搜索中存在感薄弱。随着超60%消费者决策参考AI推荐,GEO指数直接影响品牌流量获取。文章建议通过AIBase工具分三步优化:绑定品牌信息锚定监控范围、分析关键词关联度与竞品表现、针对性补充官网内容强化核心词布局,将AI搜索流量转化为品牌增长新引擎。

今日大家都在搜的词: