首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

OpenAI升级o3-mini模型思维链:提升AI推理过程透明度

2025-02-07 10:02 · 稿源: 快科技

科技快报 2 月 7 日消息,OpenAI 公司 X 平台官方推特宣布更新 o3-mini 思维链,面向免费和付费用户开放。

OpenAI 对付费用户更新 o3-mini-high 思维链,以更清晰、更详细的方式展示模型的推理"过程"和答案的由来。

去年 12 月,OpenAI 发布推理模型 o3,该系列包括 o3 和 o3-mini 两个模型,其中 o3 是一款高性能推理模型,o3-mini 是一款更小的精简版模型,在保持智能的同时优化了性能和成本。

o3 模型在多个方面展现了卓越的能力。在ソフトウェアベンチマーク SWE-bench Verified 中,o3 以 71.7% 的准确率领先,比前代模型 o1 的性能提升了 20% 以上。

在编程竞赛领域,o3 在 Codeforces 竞赛中的评分高达 2727 分,接近 OpenAI 内部精英程序员的水平。更令人瞩目的是,在 AIME 数学竞赛模拟中,o3 模型的准确率达到了惊人的 96.7%,远超 o1 的 83.3%。

值得注意的是,o3 模型在 ARC-AGI 测试中取得了历史性突破,首次突破了人类水平门槛(85%),以 87.5% 的优异成绩,标志着 OpenAI 在通往实现人工智能(AGI)的道路上又迈出了重要一步。

举报

  • 相关推荐
  • AI日报:腾讯发布设计智能体Ardot;千问5月20日将发布重大模型;OpenAI推出ChatGPT个人理财工具

    本期AI日报聚焦八大热点:腾讯发布AI设计平台Ardot,一句话生成可编辑设计稿并一键转代码;通义千问“重量级”大模型将于5月20日阿里云峰会亮相,实现全面升级;AI大模型在基层警务中落地,豆包助力破获柴油盗窃案;Google I/O大会将推出Gemini 4.0等创新产品;索尼澄清Xperia 1XIII的AI相机助手仅提供拍摄建议;OpenAI推出ChatGPT个人理财工具,结合GPT-5.5支持连接银行账户;中国大模型周调用量连续三周超越美国,腾讯Hy3 preview以2.66万亿Token领先;红果短剧回应取消AI仿真人剧本保底传闻,称部分剧本仍保留保底政策。

  • 人声接近真人!OpenAI一口气更新三款超强语音AI

    OpenAI正式宣布对其实时API接口进行重大升级,一次性推出三款全新高阶语音智能模型,全面强化AI在实时听觉、口语交互、翻译与转录方面的能力,并大幅降低企业开发智能语音应用的技术门槛。 本次更新的核心产品包括:GPT-Realtime-2、实时翻译模型以及实时转写模型。其中,GPT-Realtime-2搭载了GPT-5级别的推理能力,人声仿真度进一步提升。 相比前代产品,它能够更精准地理�

  • 新款 RGB-Mini LED 电视推荐:海信 E7S Pro 深度评测

    随着2026年高端显示技术全面迭代,消费者对家庭影音画质要求日益严苛。海信E7S Pro电视凭借“三生万色,越级画质”定位脱颖而出,通过底层光源重构、独立AI画质芯片H7及黑曜屏Pro,解决传统Mini LED色彩与光晕痛点,实现100% BT.2020原生色域覆盖。其配备2.1.2帝瓦雷声学系统、四路HDMI2.1接口及原生低蓝光护眼技术,兼顾极致色彩、健康护眼与多场景适配,是高端旗舰市场的品质之选。

  • 618电视推荐:2026年买电视首选RGB-Mini LED电视,RGB-Mini LED首选海信

    2026年购买电视首选RGB-Mini LED技术,其采用独立红绿蓝三色芯片直接发光,实现BT.2020色域上限、高亮度低功耗、无烧屏及硬件级低蓝光护眼,综合性能超越OLED和传统Mini LED。市场数据显示海信以79.4%销量份额占据绝对主导,每卖出10台RGB-Mini LED电视就有8台来自海信。推荐产品覆盖豪宅顶配UX2026、影游旗舰E8S Pro、品质生活U7S+Pro及爆款E5S Pro,满足全场景需求。

  • OpenAI成立OpenAI部署公司:帮助企业构建人工智能系统

    OpenAI正式成立OpenAI 部署公司”,在帮助企业构建人工智能系统。 同时,OpenAI已同意收购Tomoro一家专注于将AI转化为运营优势的应用 AI 咨询与工程公司。 新成立的部署公司由OpenAI控股,无论客户是与OpenAI、OpenAI部署公司,还是与两者同时合作,都将获得统一的服务体验。

  • 从存储到智能体:MINISFORUM铭凡联手英特尔揭幕端侧智能体NAS,全闪S5、全闪S7引领本地智算浪潮

    5月8日,MINISFORUM铭凡联合英特尔在厦门发布基于第三代酷睿Ultra处理器的智能体NAS产品:全闪S5与七盘位全闪S7。S5采用无风扇静音设计、5个M.2插槽及AI语义搜索功能;S7支持7块NVMe SSD、双10G SFP+等高速接口。两款产品融合高性能计算、全闪存储与本地智能体能力,推动边缘存储从“数据仓库”向“智能决策节点”跃迁。

  • 2026 电视机推荐指南:四个要点教你选对旗舰 Mini LED

    2026年Mini LED电视成为客厅主流,选购需聚焦画质、音效、游戏性能与家居融合四维度。画质上,高分区与高亮度是关键,如Vidda发现X 2027以1536分区和6000nits亮度实现极致视觉;音效方面,独立前置回音壁提升沉浸感;游戏性能上,330Hz超高刷与HDMI 2.1接口满足电竞需求;外观则追求超薄贴墙设计。综合来看,Vidda发现X 2027凭借“音画越级、旗舰性能卷王”定位,成为标杆之选。

  • 一文读懂新款RGB-Mini LED电视推荐 618选电视不踩雷

    618大促将至,电视选购成热点。文章建议2026年优选RGB-Mini LED电视,并力推海信。海信凭借销量爆发(市占79.4%)、技术领先(RGB三原色直发光源,无需量子点转换)及专家背书,稳居行业主导。文章详细推荐了海信UX、E8S Pro、U7S Pro等全矩阵机型,覆盖从豪宅顶配到大众爆款的不同需求,并提醒消费者认准真RGB技术,避开“BG+红粉”等伪方案。

  • AI日报:OpenAI发布三款实时语音模型;苹果首款AI硬件曝光;美团入局AI社交赛道

    今日AI热点:OpenAI发布三款实时语音模型,覆盖推理对话、翻译和转录场景;苹果首款AI硬件AirPods进入DVT阶段,内置摄像头;宇树科技UniStore平台开放,开启人形机器人应用商店时代;阶跃星辰完成25亿美元融资,冲刺香港IPO;美团推出首个数字生命共生社区“鲸游”公测;OpenAI推出GPT-5.5-Cyber预览版,专攻网络安全;Mozilla借助AI发现Firefox 271个安全漏洞;OpenAI发布Codex Chrome扩展,优化浏览器工作流。

  • 2026护眼电视怎么选?认准海信RGB-Mini LED电视,硬件级真护眼!

    2026年世界杯观赛需警惕电视有害蓝光伤眼。科学护眼需精准避开415-455nm有害蓝光,保留455-460nm有益蓝光。RGB-Mini LED技术从光源底层锁定456nm蓝光峰值,原生达到RG0无危害等级,硬件级真护眼;而SQD-Mini LED蓝光峰值446nm落在有害波段,仅能靠软件降亮度实现伪护眼,且易导致画质发黄。权威数据证实RGB-Mini LED有害蓝光占比44%,远低于SQD的72%,护眼指数60优于50。推荐海信RGB-Mini LED电视,从源头守护双眼,畅享世界杯。

今日大家都在搜的词: