首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

OpenAI o1预览模型发布:推理能力更强 可达理科博士生水准

2024-09-13 07:15 · 稿源: 快科技

OpenAI推出o1模型,推理能力提升

**OpenAI正式发布了o1预览模型,该模型在复杂推理任务方面取得了突破。** **o1模型的特点是能够在回答问题之前进行更深入的思考和推理,就像人类思考解决问题一样。** OpenAI表示,2023年发布的GPT-4相当于高中生的智能水平,而o1模型则是AI迈向博士生水平的关键一步。 测试表明,o1模型在国际数学奥林匹克资格考试中,可以获得83%的分数,而GPT-4o只能正确解决13%的问题。在编程能力比赛Codeforces中,o1模型达到89%百分位的成绩,而GPT-4o只有11%。 OpenAI表示,在下一个更新版本中,o1模型在物理、化学和生物学的挑战性基准测试中的表现将与博士生水平类似。 与现有的大模型相比,o1模型可以解决更困难的推理问题,并改善以前的模型中存在的机制性缺陷。 在解决编程问题时,o1模型会更加有条理,在编写代码之前,会全面思考整个回答流程。 o1模型会不断试错和打磨答案,从而提高生成结果的准确性和质量。 OpenAI宣布,ChatGPT订阅用户从9月12日起可以访问这两个新模型,o1-preview每周消息数量限制为30条,o1-mini则为50条。

举报

  • 相关推荐
  • OpenAI核心模型采用物理隔离:为防窃密 上网需明确许可

    据媒体报道,OpenAI近期全面升级其安全体系,以应对企业间谍活动风险。此次升级的核心举措之一是推出信息隔离”政策,旨在严格限制员工对敏感算法和新产品的访问权限。 例如,在开发o1模型期间,OpenAI规定只有经过严格审查并获得相应权限的团队成员,才可在公共办公区域讨论相关细节。 同时,公司还采取了多项物理与网络安全强化措施:将核心专有技术存储在隔离�

  • 小米回应小折叠未搭载玄戒O1:立项之初总量比较有限

    今日,针对网友热议的小米MIX Flip2未采用自研玄戒O1芯片一事,小米官方正式作出回应。公司表示,玄戒O1作为小米首款自研SoC,其核心定位是技术验证平台,立项初期即明确规划为小批量试产,因此无法满足小折叠屏产品大规模量产的供应链需求。

  • 自研大模型遥遥无期!苹果Siri考虑用外援:转向OpenAI合作

    据媒体报道,知名爆料人马克古尔曼透露,苹果正重新评估其人工智能发展策略,考虑放弃自研大语言模型(LLM)计划,转而与OpenAI展开合作谈判。 若合作达成,苹果原定于2026年推出的基于自研Apple Foundation Models”的Siri升级计划可能被搁置,这一变动或引发行业广泛关注。 目前,由苹果AI负责人约翰詹南德雷亚(John Giannandrea)主导的LLM Siri”项目仍在进行中,但进展不及预�

  • OpenAI 30亿收购告吹 谷歌24亿截胡Windsurf

    据媒体报道,原本预计由OpenAI斥资30亿美元收购的热门AI编程初创公司Windsurf,周五突然宣布交易取消,转而与谷歌达成合作。 据悉,谷歌DeepMind正积极招募Windsurf首席执行官Varun Mohan、联合创始人Douglas Chen及多位核心研究人员。虽然谷歌不直接持股或获得控制权,但将投入24亿美元获取Windsurf技术授权并招揽其顶尖人才。 根据协议,谷歌将获得Windsurf部分技术的非独家使用许可�

  • SpaceX将向xAI投资20亿美元:加强对抗OpenAI

    SpaceX已承诺向xAI投资20亿美元,作为其50亿美元股权融资的一部分。在马斯克旗下xAI加速追赶竞争对手OpenAI之际,此举进一步强化了其旗下公司的协同效应。 紧随xAI与X的合并完成,这笔投资使合并后公司估值跃升至1130亿美元。目前,Grok聊天机器人已应用于星链(Starlink)客服业务,并计划未来集成至特斯拉(Tesla)的Optimus人形机器人。 不过,Grok近期因其部分回复内容引发争

  • 2025H1家电业两极分化:强者更强

    2025年上半年中国家电市场呈现稳健增长态势,头部企业优势持续扩大。数据显示,海尔、美的等头部品牌线上线下增幅均超行业水平,其中线上增长36%、线下12%。细分领域表现突出:冰箱市场线上增长22%,海尔、美的、容声占据前三;洗衣机线上增长显著,海尔、小天鹅、美的领跑;空调市场受高温天气推动,线上增幅达50%,海尔、美的增速均超60%。厨电市场呈现"高端化与大众化并行"趋势,整体增长强劲。行业马太效应明显,头部企业凭借技术、品牌优势持续领跑,而缺乏核心竞争力的企业面临更大压力。这一分化趋势或将重塑行业格局,推动中国家电产业向创新强国跨越。

  • 模型推理协作正式开启,魔乐社区让模型跑遍“中国芯”

    魔乐社区启动"模型推理适配协作计划",旨在解决国产算力平台与大模型间的适配难题。该计划通过开源协作模式,联合开发者、芯片厂商等生态伙伴,构建从工具链到知识库的全栈支持体系,打造适配成果共享平台。重点支持开源大模型在国产硬件及多样化推理引擎上的高效运行,提供模型转换工具和优化指南,降低开发门槛。目前已有文心大模型4.5等首批适配成果�

  • 剑指谷歌Chrome!OpenAI即将推出AI浏览器

    据媒体报道,OpenAI即将推出的AI浏览器,利用人工智能技术彻底重塑用户的网络浏览体验,直接向占据市场主导地位的谷歌 Chrome 发起挑战。 凭借庞大的每周4亿活跃ChatGPT用户基础,OpenAI的浏览器若被广泛接纳,将对谷歌的广告生态系统、网络数据流和搜索流量构成实质性威胁。谷歌Chrome长期以来是Alphabet广告业务的基石,为其精准广告投放和将流量导向自家搜索引擎提供了关�

  • 没想到玄戒O1做得这么好 雷军:定的量不够

    在小米人车家全生态发布会结束后,小米创办人雷军进行了会后分享。 雷军表示,做玄戒O1的时候,小米完全没有想到O1做的这么好,所以整个O1的芯片总量定的不够,规划了4款产品。 雷军还强调,特别感谢朱丹领军的整个芯片团队为小米做出的巨大贡献,我自己用的也是玄戒手机,体验特别好。 他还表示,我们这几款手机和平板备货都很少,我也看到一些说我们卖不动,�

  • 可灵AI推出可图2.1模型 多维能力跃升、会员限时7天免费

    可灵AI于7月10日上线可图2.1模型,图片生成能力全面升级:1)指令遵循能力显著提升,可精准捕捉复杂提示细节;2)新增180多种风格响应,支持特殊材质、数字艺术等创作需求;3)人像美感大幅优化,肌肤纹理与光影效果更自然;4)增强电影质感生成,能呈现大片级层次氛围;5)文字生成效果提升,支持中英文营销海报等设计。即日起面向会员免费开放7天,实测显示该模型在复杂场景还原和细节表现上达到新高度,累计已生成超3亿张图片。