首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

OpenAI推理模型o3发布:AGI能力暴涨 接近人类水平

2024-12-21 09:01 · 稿源: 快科技

**OpenAI 推出升级版先进推理模型 o3,迈向通用人工智能**

在连续 12 天的圣诞发布活动中,OpenAI 隆重推出了其迄今最强大的推理模型:o3。o3 在多个基准测试中表现出色,接近通用人工智能 (AGI) 的能力。

o3 有两个版本:完整版 o3 和精简版 o3-mini。与之前的 o1 模型相比,o3 在软件工程测试中准确率提高了 47%,在数学测评中提高了 15%,在生物化学测试中提高了 13%。

值得注意的是,o3 在 AGI 相关测试中的最佳成绩达到了 87.5,超过了人类水平的 85。这表明 o3 在类人智能方面取得了重大突破。

OpenAI 计划于明年初发布 o3 系列模型。首席执行官 Altman 表示,在正式发布之前,他们希望建立一个联邦政府的测试框架,以指导和监控此类模型的潜在风险。

从本周五开始,安全研究人员可以注册访问 o3 和 o3-mini 的预览版。

**OpenAI 12 天技术直播活动要点**

  • 发布满血版推理模型 o1 和 ChatGPT Pro(每月订阅费 200 美元)。
  • 推出强化微调研究项目,支持使用高质量任务定制模型。
  • 正式发布 AI 视频生成模型 Sora Turbo,最高支持 1080p 20 秒视频。
  • 发布升级版 Canvas 创作助手,向全量用户开放。
  • 与苹果合作发布 iOS 18.2,整合 ChatGPT 和其他 AI 功能。
  • 全量上线 4o 视频通话。
  • 推出 Projects In ChatGPT,整合 ChatGPT 功能,简化项目管理。
  • ChatGPT 搜索功能升级,新增地图集成和实时搜索。
  • 开放满血版 o1 模型 API,支持 WebRTC,定价大幅降低。
  • ChatGPT 入驻手机,可通过免费号码拨打,每月免费通话 15 分钟。
  • 支持原生应用程序自动化协作。
  • 推出下一代推理模型 o3,包括完整版和精简版。

举报

  • 相关推荐
  • OpenAI透露明天发布满血版o3

    OpenAI首席全球事务官ChrisLehane在最新专访中透露满血版o3将于本周五正式上线。去年12月20日,在为期12个工作日的线上新品发布活动最后一日,OpenAI宣布了“压轴大作”:o1的下一代模型o3,推出两个版本一个正式的o3,另一个相对较小的精简版o3-mini。不知道此番提前上线满血版o3是否是OpenAI应对DeepSeek热的紧急措施。

  • 刚刚,OpenAI发布o1模型新突破,推理时间增强对抗鲁棒性

    今天凌晨2点,OpenAI发布了一项新技术研究,通过增加推理时间、算力资源来大幅度提升模型的对抗鲁棒性。与传统的对抗训练样本方法不同的是,OpenAI提出的新方法不需要对大模型进行专门的对抗训练,也不需要提前了解攻击的具体形式。同样模型在增加推理时间、算力情况下成功抵御攻击。

  • 刚刚,OpenAI发布o3-mini,可免费使用、3推理模式

    今天凌晨3点,OpenAI正式发布了新模型o3-mini,可在ChatGPT和API中可用。Pro用户可无限使用o3-mini,Plus和Team用户的速率限制将是o1-mini的3倍。o3-mini高推理模式,Plus用户每周只有50条消息?到目前为止我印象不错,本来可以更好,但实际上o3-mini已经很好了。

  • OpenAI升级o3-mini模型思维链:提升AI推理过程透明度

    OpenAI公司今天在X平台发布推文,宣布面向免费和付费用户更新o3-mini的思维链。OpenAI为付费用户更新o3-mini-high的思维链,更透明、更详细地展示模型的推理”步骤以及得出答案的方式。尤为值得一提的是,o3模型在ARC-AGI测试中取得了历史性突破,首次跨越人类水平门槛,以87.5%的优异成绩,标志着OpenAI在通往实现人工通用智能的征途中又迈出了坚实的一步。

  • OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek

    OpenAI把o3-mini的推理思维链公开了。免费用户和付费用户都可以看到模型的思维过程,OpenAI终于Open一回。最近被大量吐槽的o3-mini使用中文思考的问题,也就不存在了。

  • o3被曝成绩「造假」,60多位数学泰斗集体被耍,OpenAI暗中操控,考卷提前看光

    又爆大瓜!FrontierMath的o3惊人表现,竟是因OpenAI资助了EpochAI提前获得大部分试题访问权。OpenAI模型的性能究竟几分是真,几分炒作,愈来愈变得扑朔迷离。到时就知道,o3是不是只在FrontierMath上特别强,在其他地方就不行了。

  • 重大突破!微软发布“自我进化”,帮小模型OpenAI-o1

    微软亚洲研究院发布了一种创新算法——rStar-Math。rStar-Math通过代码增强CoT、蒙特卡洛树搜索等,可以帮助小参数模型在不依赖老师模型蒸馏的情况下,实现多轮自我思维深度进化,极大增强模型的数学推理能力。代码地址:https://github.com/microsoft/rStar论文地址:https://arxiv.org/abs/2501.04519从昨天微软开源的最强小模型Phi-4,以及最新推出创新算法rStar-Math来看,未来小模型的性能和效�

  • OpenAI开启调查:GPT-4o及4o-mini模型性能下降

    据报道,OpenAI发布事故报告指出,当前遭遇GPT-4o和4o-mini模型性能下降问题,目前正在进行调查,并将尽快发布最新消息。科研人员创新性地推出了一项名为LONGPROC的基准测试工具,该工具专为评估模型在处理长上下文中的复杂信息并生成相应回复的能力设计。特别是在需要输出8ktokens的任务中,即便是参数庞大的先进模型也未能幸免于难,这或许预示着未来大型语言模型研究的

  • 返老还童,OpenAI做到了?首个逆龄AI将登场,人类寿命可延长10年

    【新智元导读】逆龄AI真的被OpenAI实现了!新模型GPT-4bmicro通过蛋白质重编程技术,有望将人类寿命延长十年。超级智能要来了?人类「长生不老」有希望了?外媒称,OpenAI开发出了首款用于「长寿」的AI模型——GPT-4bmicro,预计将人类寿命延长10年。至关重要的是,要平衡这些进步的巨大潜力与积极措施来降低风险,为未来做好准备。

  • 官宣!OpenAI加入机器人赛道,要打造实体AGI

    OpenAI联合创始人兼总裁GregBrockman,转发了一条正在招聘硬件工程师的消息,正式官宣OpenAI加入实体机器人赛道。该项目由刚加入的前MetaAR和VR领导者CaitlinKalinowski负责,正在招聘电气工程传感工程师、实体机器人机械设计工程师和TPM经理。起初人们猜测OpenAI也想打造AI眼镜或头显,现在来看是实体机器人。