首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

OpenAI升级o3-mini模型思维链:提升AI推理过程透明度

2025-02-07 10:02 · 稿源: 快科技

科技快报 2 月 7 日消息,OpenAI 公司 X 平台官方推特宣布更新 o3-mini 思维链,面向免费和付费用户开放。

OpenAI 对付费用户更新 o3-mini-high 思维链,以更清晰、更详细的方式展示模型的推理"过程"和答案的由来。

去年 12 月,OpenAI 发布推理模型 o3,该系列包括 o3 和 o3-mini 两个模型,其中 o3 是一款高性能推理模型,o3-mini 是一款更小的精简版模型,在保持智能的同时优化了性能和成本。

o3 模型在多个方面展现了卓越的能力。在ソフトウェアベンチマーク SWE-bench Verified 中,o3 以 71.7% 的准确率领先,比前代模型 o1 的性能提升了 20% 以上。

在编程竞赛领域,o3 在 Codeforces 竞赛中的评分高达 2727 分,接近 OpenAI 内部精英程序员的水平。更令人瞩目的是,在 AIME 数学竞赛模拟中,o3 模型的准确率达到了惊人的 96.7%,远超 o1 的 83.3%。

值得注意的是,o3 模型在 ARC-AGI 测试中取得了历史性突破,首次突破了人类水平门槛(85%),以 87.5% 的优异成绩,标志着 OpenAI 在通往实现人工智能(AGI)的道路上又迈出了重要一步。

举报

  • 相关推荐
  • AI日报:视觉中国与多家大模型公司达成合作;OpenAI紧急暂停Sora生成已故名人;谷歌推出Gemini地图数据集成工具

    视觉中国与多家AI公司合作开发可商用视觉大模型,已获阿里、微软等订单。OpenAI因不当内容暂停Sora生成马丁·路德·金形象视频,引发AI伦理讨论。DeepSeek在加密货币交易实验中表现领先。WhatsApp将禁止第三方通用AI聊天机器人,仅保留Meta AI。宇树科技推出仿人机器人Unitree H2,具备拟人化设计。谷歌为Gemini集成地图数据工具,可访问25亿地点实时信息。Opera推出集成三款AI助手的Neon浏览器,但用户体验存在困惑。Facebook在美加推出AI照片编辑建议功能,可分析手机未分享照片。

  • AI日报:阿里发布紧凑型Qwen3-VL模型;科大讯飞AI翻译耳机全球首发;Gemini代码惊现Veo3.1

    阿里巴巴发布紧凑型Qwen3-VL多模态模型,推动边缘设备AI应用;科大讯飞推出全球首款AI翻译耳机,支持60种语言实时翻译;谷歌NotebookLM集成图像生成功能,可将笔记转为动态视频;ChatGPT将于12月向成人开放限制内容并推出自定义交互功能;谷歌Gemini代码泄露Veo3.1视频模型升级迹象;马斯克宣布X平台将全面转向AI推荐系统;巨人网络与清华联合开源多方言语音合成框架DiaMoE-TTS;vivo公布X200系列影像升级计划;字节跳动开源文本驱动高保真人脸生成模型FaceCLIP。

  • 华为MatePad Mini典藏版今日开售:售价5999元起

    10月27日,华为MatePad Mini典藏版正式开售,起售价5999元。作为华为首款8.8英寸小尺寸平板,该机在性能与功能上实现全面突破,堪称史上最强小平板。配备8.8英寸柔性OLED云晰柔光屏,支持P3广色域、1800nits峰值亮度及120Hz高刷,显示效果出色。通讯方面支持插卡通话、Wi-Fi7及北斗卫星消息,确保户外畅联。搭配M-Pencil Pro手写笔与智能皮套,支持专业绘画及会议语音实时转写功能,办公创作体验全面升级。

  • AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型

    本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。

  • TCL以SQD-Mini LED打破十年色域僵局,开启「地表最强」画质体验

    电视行业十年发展遇瓶颈,TCL以SQD-Mini LED技术突破困局。该技术通过超强控光实现超高对比度,结合100% BT.2020全域高色域,解决传统电视串色、偏色问题。新品X11L拥有20736个万象分区,峰值亮度达10000nits,机身厚度仅2cm,树立行业高端电视新标杆,为消费者带来沉浸式观影体验。

  • REDMI电视X 2026今晚发布!REDMI首款高阶分区Mini LED电视

    小米10月23日宣布,Redmi电视X 2026系列新品今晚发布,这是Redmi首款高端分区Mini LED电视。相比传统液晶,Mini LED控光更精细,画面明暗对比度高,无烧屏风险,色彩还原更真实。85英寸版本官方定价4799元,补贴后3839.2元,配备640分区、1200nits峰值亮度,支持4K/144Hz及VRR可变刷新率。虽属入门级Mini LED,但相比普通液晶提升显著,适合普通消费者,将推动Mini LED普及。今晚还将发布全新投影仪产品。

  • OpenAI也来了,巨头为何决战AI浏览器?

    AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas,这是OpenAI推出的首款人工智能驱动的网页浏览器。 这也被外界认为OpenAI要向谷歌宣战,挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天,谷歌母公司Alphabet股价应声下挫,盘中最大跌幅接近5%,足见市场对这一新品的敏感度。 近一年来,AI浏览器的战略价值成为行业共识,从业者更是将其与智能代理(Agent)、搜索引�

  • REDMI Mini LED电视来了:85英寸到手价不足4000元

    小米10月23日发布Redmi X 2026系列Mini LED电视,这是Redmi首款Mini LED产品。85英寸版本售价4799元,补贴后3839.2元,配备640分区背光、1200nits峰值亮度,支持4K/144Hz显示及288Hz超高频模式。搭载四核A73处理器、4+64GB存储,预装澎湃OS系统,视频启动速度提升42%。对比同尺寸小米电视S Mini LED(7399元),性价比突出。另有65/75英寸版本同步亮相。

  • 告别伪升级 TCL携SQD-Mini LED亮相,「真极致」稳坐画质王座

    过去十年电视画质难以同时实现高对比度和真实色彩。TCL通过SQD-Mini LED技术突破行业十年色域僵局:采用纯蓝光激发量子点,结合光学提纯器实现100% BT.2020全局高色域,解决传统RGB-Mini LED串色问题;配合20000+万象分区精准控光,控光效率远超普通分区。该技术从底层革新显示标准,终结“挤牙膏式”升级,成为高端电视画质新标杆。

  • AI日报:谷歌Gemini 3.0 Pro小范围推送;爱诗科技完成1亿元B+轮融资;百度发布文档解析模型 PaddleOCR-VL

    谷歌Gemini 3.0 Pro开始小范围推送,强化推理与多模态能力;百度发布全球领先文档解析模型PaddleOCR-VL,重塑OCR技术格局;爱诗科技完成亿元B+轮融资,ARR突破4000万美元;Anthropic推出Claude“skills”功能,提升AI工作效率;Pinterest推出AI内容限制工具,用户可自定义减少生成式图像;开源多模态模型LLaVA-OneVision-1.5超越Qwen2.5-VL;OpenAI视频生成模型Sora 2上线微软Azure平台,进入公共预览阶段;旅行搜索引擎Kayak推出“AI模式”,简化旅行规划与预订流程。

今日大家都在搜的词: