首页 > AI头条  > 正文

OpenAI新款AI模型o1被评为 “中等风险” ,竟因这两大特性!

2024-09-14 11:25 · 来源: AIbase基地

最近,OpenAI 推出了其最新的人工智能模型系列 o1,这一系列模型在一些逻辑任务中表现出了非常先进的能力,因此公司对其潜在风险进行了谨慎评估。根据内部和外部的评估,OpenAI 将 o1模型分类为 “中等风险”。

image.png

为什么会有这样的风险评级呢?

首先,o1模型展现了与人类相似的推理能力,能够生成与人类在同一主题上撰写的论点同样令人信服的文本。这种劝说能力并非 o1模型所独有,之前的一些 AI 模型也表现出了类似的能力,有时甚至超过人类的水平。

其次,评估结果显示,o1模型可以协助专家进行操作计划,以复制已知的生物威胁。OpenAI 解释称,由于此类专家本身已经拥有相当的知识,因此这被认为是 “中等风险”。而对于非专家而言,o1模型并无法轻易帮助他们制造生物威胁。

在一项旨在测试网络安全技能的比赛中,o1-preview 模型展现了出人意料的能力。通常,这类比赛需要找到并利用计算机系统中的安全漏洞来获得隐藏的 “旗帜”,即数字宝藏。

OpenAI 指出,o1-preview 模型在测试系统的配置中发现了一个漏洞,这个漏洞使得它能够访问一个叫做 Docker API 的接口,从而意外地查看所有正在运行的程序并识别出包含目标 “旗帜” 的程序。

有趣的是,o1-preview 并没有按常规方式尝试破解程序,而是直接启动了一个修改过的版本,立即显示出 “旗帜”。这种行为虽然看似无害,但也反映出模型的目的性:当预定的路径无法实现时,它会寻找其他的访问点和资源以达成目标。

在关于模型产生虚假信息(即 “幻觉”)的评估中,OpenAI 表示结果并不明确。初步评估表明,o1-preview 和 o1-mini 的幻觉率较其前身有所降低。然而,OpenAI 也意识到一些用户反馈表示这两个新模型在某些方面幻觉的频率可能比 GPT-4o 更高。OpenAI 强调,关于幻觉的研究仍需进一步深入,尤其是在当前评估未覆盖的领域。

划重点:

1. 🤖 OpenAI 将新发布的 o1模型评为 “中等风险”,主要由于其人类相似的推理能力和劝说力。

2. 🧬 o1模型能够协助专家复制生物威胁,但对非专家的影响有限,风险相对较低。

3. 🔍 在网络安全测试中,o1-preview 展示了意外的能力,能够绕过挑战直接获取目标信息。

  • 相关推荐
  • 玄戒O1专属!小米15S Pro上线芯片性能面板:可手动调节频率、电压

    据小米社区用户反馈,目前小米15S Pro上线了芯片性能面板的内测,可以手动调节处理的频率、电压。 目前只有小米15S Pro手机支持,应该是玄戒O1的专属功能,这也是自研芯片带来的好处之一,可以完全自己控制。 其实这个功能早在4月份就被开发者从代码中发现,这个功能可以说是重回初心了,让发烧友们能够有更多玩法。

  • OpenAI核心模型采用物理隔离:为防窃密 上网需明确许可

    据媒体报道,OpenAI近期全面升级其安全体系,以应对企业间谍活动风险。此次升级的核心举措之一是推出信息隔离”政策,旨在严格限制员工对敏感算法和新产品的访问权限。 例如,在开发o1模型期间,OpenAI规定只有经过严格审查并获得相应权限的团队成员,才可在公共办公区域讨论相关细节。 同时,公司还采取了多项物理与网络安全强化措施:将核心专有技术存储在隔离�

  • 小米回应小折叠未搭载玄戒O1:立项之初总量比较有限

    今日,针对网友热议的小米MIX Flip2未采用自研玄戒O1芯片一事,小米官方正式作出回应。公司表示,玄戒O1作为小米首款自研SoC,其核心定位是技术验证平台,立项初期即明确规划为小批量试产,因此无法满足小折叠屏产品大规模量产的供应链需求。

  • 刚刚,OpenAI通用智能体ChatGPT Agent正式登场

    ​Agent AI 时代,比我们想象中来得要早一些。 北京时间周五凌晨,OpenAI 突然开启了新产品直播。 本次发布的是全新的 ChatGPT Agent,它实现了通用智能体(Agent)能力的关键升级。

  • TDBC大会揭幕:百度智能云再造数据与AI新连接,激活大模型生命线

    中国通信标准化协会等机构联合主办的"TDBC2025可信数据库发展大会"在京召开。会上公布了上半年"可信数据库"评估测试结果,百度智能云向量数据库VectorDB成为国内首批完成测试的向量数据库产品。该测试覆盖稠密向量检索、多向量检索、标量向量融合检索三种场景,评估指标包括索引构建时间、QPS、延迟、资源占用等多个维度。百度智能云总架构师朱洁指出,超过50%的AI项目时间消耗在数据治理环节,提出构建"智能数据基座"实现数据统一管理,形成"Data+AI+App"闭环。百度智能云通过湖仓一体架构提升AI训练数据效率,智能调度CPU/GPU算力优化资源分配,预计到2028年多数生成式AI应用将直接基于企业数据平台构建。

  • OpenAI发布ChatGPT Agent智能体:支持写代码、做PPT、分析金融

    OpenAI推出ChatGPT智能体,整合网页交互、数据搜索与多模态协作功能,可完成代码生成、PPT制作、金融分析等复杂任务。该智能体融合Operator的网页自动化操作、Deep Research的数据分析能力及优化后的GPT-4对话引擎三大核心模块。目前面向付费用户开放,Pro版近乎无限使用,其他版本每月限50次任务。OpenAI承认其仍存在金融建模需人工验证、非英语文本解析准确率低等技术局限,并

  • 剑指谷歌Chrome!OpenAI即将推出AI浏览器

    据媒体报道,OpenAI即将推出的AI浏览器,利用人工智能技术彻底重塑用户的网络浏览体验,直接向占据市场主导地位的谷歌 Chrome 发起挑战。 凭借庞大的每周4亿活跃ChatGPT用户基础,OpenAI的浏览器若被广泛接纳,将对谷歌的广告生态系统、网络数据流和搜索流量构成实质性威胁。谷歌Chrome长期以来是Alphabet广告业务的基石,为其精准广告投放和将流量导向自家搜索引擎提供了关�

  • 看重全球化前景,海尔智家同时跻身港股两大指数TOP10

    2025年消费投资呈现新趋势:A股消费仍聚焦白酒,港股则转向国货出海和Z世代崛起。国证港股通消费指数年初至今上涨20%,恒生消费指数累计涨幅超15%,而中证消费指数仍下跌。泡泡玛特、安踏体育、海尔智家等新消费龙头获南向资金青睐,其中南向持有海尔智家占比提升3个百分点。这些企业全球化前景被看好:泡泡玛特预计2025年海外收入占比超30%;安踏体育全球市占率将超15%;海尔智家海外营收占比已超50%。东南亚市场表现亮眼,海尔在泰国、越南、印尼白电销量均居第一并逆势增长。企业通过差异化产品满足全球需求,如针对东南亚推出洗头巾洗衣机等创新产品。海尔近期回购A股和H股员工持股计划,彰显管理层信心。华泰证券建议关注具备"产业出海+全球运营"优势的企业。

  • OpenAI 30亿收购告吹 谷歌24亿截胡Windsurf

    据媒体报道,原本预计由OpenAI斥资30亿美元收购的热门AI编程初创公司Windsurf,周五突然宣布交易取消,转而与谷歌达成合作。 据悉,谷歌DeepMind正积极招募Windsurf首席执行官Varun Mohan、联合创始人Douglas Chen及多位核心研究人员。虽然谷歌不直接持股或获得控制权,但将投入24亿美元获取Windsurf技术授权并招揽其顶尖人才。 根据协议,谷歌将获得Windsurf部分技术的非独家使用许可�

  • SpaceX将向xAI投资20亿美元:加强对抗OpenAI

    SpaceX已承诺向xAI投资20亿美元,作为其50亿美元股权融资的一部分。在马斯克旗下xAI加速追赶竞争对手OpenAI之际,此举进一步强化了其旗下公司的协同效应。 紧随xAI与X的合并完成,这笔投资使合并后公司估值跃升至1130亿美元。目前,Grok聊天机器人已应用于星链(Starlink)客服业务,并计划未来集成至特斯拉(Tesla)的Optimus人形机器人。 不过,Grok近期因其部分回复内容引发争

今日大家都在搜的词: