首页 > 业界 > 关键词  > FrontierMath最新资讯  > 正文

o3被曝成绩「造假」,60多位数学泰斗集体被耍,OpenAI暗中操控,考卷提前看光

2025-01-20 13:56 · 稿源: 新智元公众号

又爆大瓜!FrontierMath的o3惊人表现,竟是因OpenAI资助了Epoch AI而提前获得大部分试题访问权。OpenAI模型的性能究竟几分是真,几分炒作,愈来愈变得扑朔迷离。不久前,OpenAI在「圣诞12连更」中发布的最强推理模型「o3」,毫无疑问地惊艳了所有人。尤其是对于新近发布的数学基准F

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI日报:腾讯发布设计智能体Ardot;千问5月20日将发布重大模型;OpenAI推出ChatGPT个人理财工具

    本期AI日报聚焦八大热点:腾讯发布AI设计平台Ardot,一句话生成可编辑设计稿并一键转代码;通义千问“重量级”大模型将于5月20日阿里云峰会亮相,实现全面升级;AI大模型在基层警务中落地,豆包助力破获柴油盗窃案;Google I/O大会将推出Gemini 4.0等创新产品;索尼澄清Xperia 1XIII的AI相机助手仅提供拍摄建议;OpenAI推出ChatGPT个人理财工具,结合GPT-5.5支持连接银行账户;中国大模型周调用量连续三周超越美国,腾讯Hy3 preview以2.66万亿Token领先;红果短剧回应取消AI仿真人剧本保底传闻,称部分剧本仍保留保底政策。

  • AI新王诞生!Anthropic估值冲爆1.2万亿 首次反超OpenAI

    长期笼罩在OpenAI阴影下的二号选手”Anthropic,近期在链上Pre-IPO市场的隐含估值骤然飙升至1.2万亿美元(约合人民币8.7万亿元)。 若Anthropic以这一估值顺利完成首次公开募股,它将直接跃升为全球第11大上市公司,缔造商业史上的新神话。 最新链上Pre-IPO交易数据显示,短短七天内,Anthropic估值暴涨20%,单周涨幅已相当于一家头部上市公司的体量。而自2025年10月以来,其估值曲

  • OpenAI成立OpenAI部署公司:帮助企业构建人工智能系统

    OpenAI正式成立OpenAI 部署公司”,在帮助企业构建人工智能系统。 同时,OpenAI已同意收购Tomoro一家专注于将AI转化为运营优势的应用 AI 咨询与工程公司。 新成立的部署公司由OpenAI控股,无论客户是与OpenAI、OpenAI部署公司,还是与两者同时合作,都将获得统一的服务体验。

  • 人声接近真人!OpenAI一口气更新三款超强语音AI

    OpenAI正式宣布对其实时API接口进行重大升级,一次性推出三款全新高阶语音智能模型,全面强化AI在实时听觉、口语交互、翻译与转录方面的能力,并大幅降低企业开发智能语音应用的技术门槛。 本次更新的核心产品包括:GPT-Realtime-2、实时翻译模型以及实时转写模型。其中,GPT-Realtime-2搭载了GPT-5级别的推理能力,人声仿真度进一步提升。 相比前代产品,它能够更精准地理�

  • 致敬十年,明日之师——2026 CHINA P&E 索尼展台全览

    第27届中国国际照相机械影像器材与技术博览会(2026 CHINA P&E)在北京举行,索尼携旗舰产品阵容亮相,以“致敬十年 明日之师”为主题,庆祝G大师镜头诞生十周年。展会重点展示了新发布的Alpha7R VI(搭载6680万像素传感器)和FE100-400mm F4.5 GM OSS超远摄变焦镜头,提供多场景互动体验区,包括动态人像、高画质人像、弱光人像和生态拍摄。现场还设有14场摄影师讲座、Creators Cloud

  • AI日报:OpenAI发布三款实时语音模型;苹果首款AI硬件曝光;美团入局AI社交赛道

    今日AI热点:OpenAI发布三款实时语音模型,覆盖推理对话、翻译和转录场景;苹果首款AI硬件AirPods进入DVT阶段,内置摄像头;宇树科技UniStore平台开放,开启人形机器人应用商店时代;阶跃星辰完成25亿美元融资,冲刺香港IPO;美团推出首个数字生命共生社区“鲸游”公测;OpenAI推出GPT-5.5-Cyber预览版,专攻网络安全;Mozilla借助AI发现Firefox 271个安全漏洞;OpenAI发布Codex Chrome扩展,优化浏览器工作流。

  • 索尼旗舰阵容集结北京,共赴2026 CHINA P&E光影盛宴

    第27届中国国际照相机械影像器材与技术博览会(2026 CHINA P&E)将于2026年5月15日至18日在北京举办。索尼将携Alpha1 II、Alpha9 III、Alpha7R V及Alpha7V等多款旗舰微单,以及超三元系列G大师镜头等重磅产品亮相。展会以“致敬十年 明日之师”为主题,庆祝G大师镜头十周年,设置动态人像、生态拍摄等多个沉浸式体验区,并举办14场摄影师讲座。现场还提供相机清洁保养服务,观众可通

  • AI日报:豆包披露付费订阅方案;OpenAI发布GPT-5.5Instant;苹果手机支持第三方AI模型

    今日AI领域动态:豆包推出月费68-500元三档付费订阅,推进商业化;OpenAI发布GPT-5.5 Instant,取代5.3成为ChatGPT默认模型;苹果iOS 27或支持第三方AI模型,打破封闭生态;淘宝“答题免单”上线,首次加入AI试穿玩法;魔形智能完成数亿元Pre-A轮融资,布局Token基础设施;谷歌神秘项目“Remy”曝光,打造24小时AI助教;谷歌推出Gemini Ultra Lite新订阅服务,填补中高端市场空白;ChatGPT上线广告主平台,AI商业化迎来分水岭。

  • OpenAI憋不住了要造手机!背后原因曝光:不想再给苹果谷歌白打工

    估值超8000亿元的AI大模型巨头OpenAI计划自研AI手机,预计2028年量产,由立讯精密制造,正与联发科、高通合作研发处理器。 消息一出,立讯精密股价大涨超9%,创历史新高。 OpenAI CEO奥尔特曼也表示,当前需重新思考操作系统与界面设计,打造适配智能体的互联网协议。 为何大模型企业纷纷下场造机?核心原因直指不想再被苹果、谷歌卡脖子”。 首先,摆脱第三方终端依赖

  • OpenAI智能体手机冲击明年量产 目标两年出货3000万部

    知名科技分析师郭明錤透露,OpenAI正在加速推进其AI智能体手机项目,最新目标是在2027年上半年实现量产。这一进度比外界预期的更早。 郭明錤表示,项目提速的潜在驱动因素包括:为年末可能的 IPO 叙事提供支撑,以及 AI 智能体手机领域的竞争日益激烈。若进展顺利,这款设备在2027至2028年的合计出货量有望接近3000万部。 在硬件配置上,该设备将采用双NPU架构,用于异构A

今日大家都在搜的词: