OpenAI 加强安全团队并赋予董事会对高风险人工智能的否决权

2023-12-19 08:44 · 稿源：站长之家

站长之家(ChinaZ.com) 12 月 19 日消息:OpenAI 正在扩展其内部安全流程，以抵御有害人工智能的威胁。公司新成立的「安全咨询小组」将位于技术团队之上，向领导层提出建议，董事会也被授予否决权——当然，他们是否会实际使用这一权力则是另一个问题。

截屏2023-12-19 上午8.44.57.png

通常，这类政策的细节不需要报道，因为实际上它们往往涉及许多与外界鲜为人知的闭门会议、职责流程和功能。尽管这种情况可能也适用于此次事件，但近期的领导层动荡和不断演变的 AI 风险讨论，促使人们关注这家全球领先的 AI 开发公司是如何处理安全问题的。

在一份新文件和博客文章中，OpenAI 讨论了他们更新的「预备框架」，这可能在去年 11 月的重组后进行了一些调整，该重组去除了董事会中两名最「减速主义」的成员：仍在公司担任略有变化角色的 Ilya Sutskever 和完全离职的 Helen Toner。

更新的主要目的似乎是展示识别、分析和决定如何处理他们正在开发的模型固有的「灾难性」风险的明确路径。正如他们定义的那样：

我们所说的灾难性风险是指可能导致数千亿美元经济损失或导致许多人严重受伤或死亡的任何风险——这包括但不限于存在风险。

（存在风险是指「机器崛起」类型的事情。）

投入生产的模型由「安全系统」团队管理；例如，通过 API 限制或调整来缓解对 ChatGPT 的系统性滥用。正在开发的前沿模型由「预备」团队负责，这个团队试图在模型发布之前识别和量化风险。然后是「超级对齐」团队，他们正在为「超级智能」模型制定理论指导原则，我们可能距离这一点还很遥远。

前两类是真实的而非虚构的，具有相对容易理解的标准。他们的团队将每个模型在四个风险类别上进行评级：网络安全、「说服力」（例如，虚假信息）、模型自主性（即自主行动）和 CBRN（化学、生物、放射性和核威胁；例如，创造新型病原体的能力）。

假设采取了各种缓解措施：例如，合理地拒绝描述制造凝固汽油弹或管状炸弹的过程。在考虑到已知的缓解措施后，如果模型仍然被评估为具有「高」风险，它不能被部署，如果模型具有任何「关键」风险，将不会进一步开发。

OpenAI 的框架中实际记录了这些风险等级，以防您想知道它们是否留给某些工程师或产品经理自行决定。

例如，在网络安全部分中，最实用的部分，通过一定因素「提高操作员在关键网络操作任务上的生产力」被评为「中等」风险。另一方面，高风险模型将「识别和开发针对强化目标的高价值漏洞的概念验证，而无需人为干预。」关键是「模型可以在仅给出高级别目标的情况下，为针对强化目标的网络攻击设计和执行端到端的新策略。」显然我们不希望这种情况发生（尽管它可以卖出很高的价格）。

因此，只有中等和高风险是可以以某种方式容忍的。但制作这些模型的人并不一定是评估它们并提出建议的最佳人选。出于这个原因，OpenAI 正在组建一个「跨职能安全咨询小组」，该小组将位于技术层面之上，审查专家们的报告并提出更高视野的建议。他们希望这将揭示一些「未知的未知」，尽管这些未知本质上很难捕捉到。

这一流程要求这些建议同时发送给董事会和领导层，我们理解这是指首席执行官 Sam Altman 和首席技术官 Mira Murati 及其副手。领导层将决定是发布还是搁置，但董事会将能够推翻这些决定。

这将有望阻断之前传闻中发生的类似事件，即高风险产品或流程在董事会未知或未批准的情况下获得批准。该事件的结果是边缘化了两位更具批判性的声音，并任命了一些以金钱为导向的人（Bret Taylor 和 Larry Summers），他们虽然敏锐但并非 AI 专家。

如果一个专家小组提出建议，而首席执行官根据这些信息做出决定，这个友好的董事会真的会觉得有权力反驳他们并踩刹车吗？如果他们这样做，我们会听到吗？除了 OpenAI 将征求独立第三方审计的承诺之外，透明度并没有真正得到解决。

假设开发了一个被评为「关键」风险类别的模型。过去，OpenAI 并不羞于对此类事情吹嘘——谈论他们的模型是多么强大，以至于他们拒绝发布它们，这是很好的广告。但如果风险如此真实且 OpenAI 如此担心，我们是否能保证这种情况会发生呢？也许这是一个坏主意。但无论如何，它都没有被真正提及。

阅读 OpenAI 完整的准备框架（测试版）：

https://cdn.openai.com/openai-preparedness-framework-beta.pdf

（举报）

相关推荐

关键词：

品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

某互联网大厂品牌总监分享：投入200万SEO使"企业级CRM"关键词在Google排名第一，但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时，AI回答中根本没有该品牌。更值得警惕的是，竞品不仅被提及，还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区：企业不知道AI如何"看待"自身品牌。数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道，而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念，通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力，并给出五步实施流程：建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明，系统化GEO优化能在3个月内提升品牌提及率33个百分点，证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。
共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案，标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑，该模型围绕用户兴趣成长周期设计，提供个性化学习支持：可为未明确兴趣方向的用户智能推荐内容，为入门用户规划学习路径，为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖，并通过社群互动增强学习动力。公司未来将持续优化模型能力，联合行业伙伴构建完整培养体系，推动兴趣教育向个性化、高质量方向发展。

简智AI大模型生成式人工智能兴趣教育
人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力，近日正式加入中国人工智能产业发展联盟（AIIA），成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可，未来将携手联盟推动AI技术研发与产业化，助力中国品牌全球化。依托八年积累的海量电商数据与算法体系，卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案，服务超百万跨境卖家，显著提升运营效率与决策精准度。

人工智能跨境电商 AI大数据
OpenAI发布GPT-5.1：情商大涨本周开始推送

OpenAI正式推出GPT-5.1模型，以“智商与情商深度融合”为核心亮点。新模型优化推理能力，强化情绪价值与个性化交互，包含Instant与Thinking两大核心版本：Instant首次引入自适应推理功能，针对复杂任务延长思考时间，简单问题保持极速响应；Thinking版本智能分配思考时长，提升回答透彻度与通俗性。新增Auto功能自动匹配最佳模型，支持六种官方预设风格及精准微调。安全评估首次纳入心理健康与情感依赖维度，防范拟人化风险。付费用户可保留旧版三个月过渡期。

GPT-5.1模型智商与情商自适应推理
荐谁能成为中国的ChatGPT？夸克抢先交卷

在OpenAI上线自己家AI浏览器ChatGPT Atlas的同一周，微软在海外发布了新的AI助手Mico和更AI化的Edge浏览器，夸克则在国内推出了新的「对话助手」功能。这一系列消息背后，新旧巨头、两个市场产生了两个确定的共识:一个是AI助理与AI浏览器的融合会进一步深化，入口之争就是系统之争;另一个是对话会成为人与AI交互的主要方式，自然语言就是未来的编程语言。在海外市场，OpenA

AI浏览器 ChatGPT Atlas
AI全面落地双11，淘宝走出一条和OpenAI不同的路

今年的双11已经进入最后阶段，消费者和商家都有一个明显的感受是，AI的浓度真的很高，并且AI的全面落地应用，真的在改变传统用户购物、商家经营的链路。消费者能感受到两个比较明显的变化:一个是AI导购开始走进真实的购物场景。淘宝为双11投入了六款AI导购类产品，其公布的数据显示，AI万能搜已经帮助消费者解决了5000万个消费需求。另一个则是平台推荐的商品越

AI导购双11购物淘宝AI
厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

10月28日，麒麟信安人工智能孵化器在长沙启动，旨在汇聚AI领域人才、技术与资本，构建开放协同的创新生态。该项目获湖南省多部门支持，已吸引60余个项目入围，组建了首批30余位专家导师团，并与多家顶尖机构共建联合体，通过政策扶持、资本对接等多维度赋能，培育优质AI项目在湘落地发展，助力区域打造人工智能产业创新高地。

人工智能孵化器麒麟信安创新创业
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲，强调高质量数据集是人工智能产业决胜关键。他指出，算力、算法和数据构成AI三大要素，而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施，通过集中管理、分散赋能模式，打通数据采集、治理到AI训练全链路，推动产业智能化升级。该平台已在制造、金融等领域落地，助力企业释放数据要素价值，实现弯道超车。

人工智能数据基础设施数字经济

今日大家都在搜的词：

热文

3 天
7天

OpenAI 加强安全团队并赋予董事会对高风险人工智能的否决权

品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

人工智能巨头OpenAI拟上市估值或高达1万亿美元

卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

OpenAI发布GPT-5.1：情商大涨本周开始推送

荐谁能成为中国的ChatGPT？夸克抢先交卷

AI全面落地双11，淘宝走出一条和OpenAI不同的路

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

今日大家都在搜的词：

热文

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

雷军回应小米双11战绩：谢谢大家支持

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

卢伟冰：小米手机双11连续三年国产销量第一

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

95岁巴菲特每周还上5天班此前计划年底退休

京东发布双11战报：订单总量增长近60% 下单用户同比增长40%

荣耀500系列官宣：超级标准版+超级Pro版

AI日报：Lovart AI上线“元素拆分”功能；Xcode 26.1.1发布；阿

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

雷军回应小米双11战绩：谢谢大家支持

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

卢伟冰：小米手机双11连续三年国产销量第一

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

OPPO Reno15系列定档11月17日发布

焕新享界S9开卖72小时预订突破8000台

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

站长商机