OpenAI 表示其最新的 GPT-4o 模型风险评级为“中等”

2024-08-09 09:16 · 来源： AIbase基地

最近，OpenAI 发布了他们最新的 GPT-4o 系统卡，这是一份详细的研究文件，介绍了该公司在推出新模型之前所做的安全措施和风险评估。

GPT-4o 模型是在今年五月正式上线的。在发布之前，OpenAI 聘请了外部的安全专家团队进行风险评估，这种 “红队” 测试是相当常见的做法。他们主要关注模型可能带来的风险，比如生成未经授权的声音克隆、淫秽和暴力内容，或者重复的受版权保护的音频片段。

GPT-4o ChatGPT

根据 OpenAI 自己的框架，研究人员将 GPT-4o 的整体风险评估为 “中等”。这个风险等级是根据四个主要类别中的最高风险评定得出的:网络安全、生物威胁、说服力和模型自主性。除了说服力外，其他类别都被认为是低风险。研究人员发现，GPT-4o 生成的一些文本在影响读者意见方面比人类写的文本更具说服力，尽管整体上并没有更具说服力。

OpenAI 的发言人 Lindsay McCallum Rémy 表示，系统卡包括由内部团队和外部测试人员共同创建的准备评估，外部团队包括 OpenAI 网站上列出的模型评估与威胁研究（METR）和阿波罗研究(Apollo Research)，他们专注于人工智能系统的评估。这并不是 OpenAI 首次发布系统卡，之前的 GPT-4、GPT-4视觉版和 DALL-E3也经历了类似的测试，并发布了相关研究结果。

但这次发布的系统卡恰逢一个关键时刻，OpenAI 近期面临来自内部员工和州参议员的不断批评，质疑其安全标准。在 GPT-4o 系统卡发布的几分钟前，麻省参议员伊丽莎白・沃伦（Elizabeth Warren）和众议员洛丽・特拉汉(Lori Trahan)共同签署的一封公开信，呼吁 OpenAI 就如何处理举报者和安全审查提供答案。信中提到的许多安全问题，包括首席执行官山姆・阿尔特曼(Sam Altman)在2023年因董事会的担忧而短暂被解雇，以及一名安全高管的离职，该高管声称 “安全文化和流程被美丽的产品所压制”。

此外，OpenAI 正好在美国总统选举前发布一款功能强大的多模态模型，这显然存在误传信息或被恶意行为者利用的潜在风险。尽管 OpenAI 希望通过实际场景的测试来防止滥用，但公众对其透明度的呼声越来越高。尤其是在加州，州参议员斯科特・维纳（Scott Wiener）正在推动一项法案，规范大型语言模型的使用，包括要求公司在其 AI 被用作有害用途时承担法律责任。如果法案通过，OpenAI 的前沿模型必须遵循州法规定的风险评估才能向公众发布。

划重点:
🌟 OpenAI 的 GPT-4o 模型被评估为 “中等” 风险，主要关注网络安全和说服力等方面。
🔍 系统卡的发布正值 OpenAI 面临外界安全标准质疑的关键时刻，呼声日益高涨。
🗳️ 发布时机敏感，正值美国总统选举前，存在误传信息和被恶意利用的风险。

相关推荐

荐AI日报：海螺AI首尾帧功能上线；元石科技发布问小白5；OpenAI发布全新语音模型GPT-Realtime

AI日报栏目每日提供人工智能领域热点内容，聚焦开发者，帮助洞悉技术趋势、了解创新AI产品应用。最新动态包括：MiniMax海螺AI首尾帧功能上线；元石科技发布问小白5挑战GPT-5；OpenAI推出语音模型GPT-Realtime；谷歌Gemini AI优化表格处理；腾讯黑科技实现AI配音；百度计划培养千万AI人才；MathGPT.ai反作弊功能推广；苹果Xcode集成Claude Sonnet4；微软发布自研AI模型MAI系列；xAI推出高效编码模型Grok Code Fast1；SuperCLUE多模态评测Gemini-2.5-Pro居首；9月1日起AI内容标识新规实施，违规将承担法律风险。

AI 人工智能技术趋势
OpenAI CEO：GPT-6将具备个性化记忆记住用户偏好习惯

OpenAI的首席执行官萨姆奥尔特曼（Sam Altman）在近日的一次专访中，透露了下一代大模GPT-6的最新进展。他表示，GPT-6 的开发正在积极推进中，其发布节奏将比从GPT-4到GPT-5的周期更快。奥尔特曼特别强调，GPT-6将不再局限于单纯回答问题，而是朝着与用户深度适配”的方向演进。他举例描述

GPT-6 OpenAI 萨姆奥尔特曼
GPT5上线大翻车！用户强烈呼吁使用旧版 OpenAI重新上线GPT4o

OpenAI发布最强AI模型GPT-5，但引发用户强烈不满。新模型上线后反应速度变慢、回答质量下降，且官方突然下架GPT-4o等8个旧模型，导致付费用户抗议。部分用户对旧版产生情感依赖，认为GPT-4o更具人性化温暖。第三方测试显示GPT-5在复杂任务上虽有提升，但交互体验明显退步。CEO承认低估用户对旧版的喜爱，承诺将恢复部分旧模型并提供更多定制服务。专家指出大模型边际效益递减，面临数据质量和算力成本限制。总体而言，GPT-5在技术指标进步的同时，牺牲了情感交互体验。

GPT-5发布 OpenAI AI模型淘汰
OpenAI的开源模型现已在IBM watsonx.ai上提供

OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B，允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台，采用专家混合架构，支持本地或云端部署，不受商业用途限制。模型具备高透明度，输出完整推理链，在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态，IBM强调其开放战略，为企业提供灵活、安全的AI开发选择。

OpenAI模型 IBM watsonx.ai
博士水平的GPT-5依然翻车 OpenAI奥特曼：AGI已失去意义

上周末OpenAI公司发布了传闻已久的GPT-5大模型，号称迄今为止最先进的人工智能模型，具备博士级别的智能水平。 GPT-5发布之后在多个榜单上确实刷榜了，包括编程、数学等，总计拿到了25个榜单的第一，评分表现很震撼。然而上线之后，GPT-5的实际表现引发质疑，跑分第一不代表实际体验第一，甚至被不少用户认为表现倒退了，反应也变慢，这可能是OpenAI翻车最快的旗舰大�

GPT-5发布人工智能模型 OpenAI整改
2025年大模型选型核心指南：Beyond GPT-4，如何理性评估Qwen、DeepSeek等强者？

大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架，强调需超越单一指标崇拜，基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析，展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程，采用专业工具进行多维度评估，通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型，而非盲目追求流行模型。
奥尔特曼称自己不适合担任CEO OpenAI上市后或卸任

OpenAI首席执行官Sam Altman近日接受采访时透露，虽然公司正推进数万亿美元级的计算基础设施投资计划，但他对上市后继续担任CEO持保留态度。 Altman坦言，尽管主导着OpenAI多项战略级项目，但自认缺乏上市公司CEO所需的核心管理素质与市场敏感度。他特别强调，上市企业领导者需具备应对复杂投资者关系与监管环境的综合能力，而自己可能并非最优人选。

OpenAI Sam Altman
豆包1.5 Vision Lite 对比 GPT-5-min，谁更适合你？实测AI模型选型利器｜AIBase

文章探讨了企业选择AI大模型时面临的实际决策难题，指出单纯比较学术参数无法满足业务需求。AIBase模型对比平台（https://model.aibase.cn/compare）通过三大核心价值解决痛点：1）聚焦业务场景而非参数堆砌，突出价格、语言支持、上下文长度等实用维度；2）透明化成本计算，标注长文本溢价规则和多模态附加费；3）一键生成对比报告。平台特别强调中文场景的特殊性（如豆包1.5在中文处理成本的优势），并揭示厂商宣传中容易忽略的隐藏成本（如GPT-5-min超5000字符的30%溢价）。典型电商客服案例显示，需综合中文理解、多模态、性价比等维度决策，最终选择取决于具体业务需求而非绝对性能排名。

智能客服系统中文场景预算有限
健合旗下Swisse PLUS携手TEDx举办抗衰沙龙，发布NAD+新生瓶系列

《全球抗衰老市场研究报告》显示，2024年全球抗衰老产品市场规模达2662亿美元。高端消费群体需求从粗放式营养补充转向精准干预，推动行业向细胞级解决方案升级。Swisse PLUS与TEDx合作举办主题沙龙，发布NAD+新生瓶系列，汇聚专家学者探讨细胞抗衰科学路径，倡导建立个人健康管理系统，实现精准抗衰与主动健康管理。

抗衰老市场细胞级营养 NAD+新生瓶
中国冰箱业TOP5型号4款是海尔

2025年7月冰箱行业零售额、零售量增速放缓，环比下降34.5%和29.1%。行业承压加剧，多数品牌负增长，仅海尔冰箱逆势增长9.1%。海尔凭借爆款产品带动增长，TOP5型号中占4款，均为主打高端十字门冰箱。其磁控全空间保鲜技术获国家科技奖，显著延长食材保鲜期。通过全流程数字化升级，海尔实现运营效率提升，以科技驱动和用户体验赢得市场，为行业提供增长启示。

冰箱行业零售额零售量

今日大家都在搜的词：

热文

3 天
7天

OpenAI 表示其最新的 GPT-4o 模型风险评级为“中等”

荐AI日报：海螺AI首尾帧功能上线；元石科技发布问小白5；OpenAI发布全新语音模型GPT-Realtime

OpenAI CEO：GPT-6将具备个性化记忆记住用户偏好习惯

GPT5上线大翻车！用户强烈呼吁使用旧版 OpenAI重新上线GPT4o

OpenAI的开源模型现已在IBM watsonx.ai上提供

博士水平的GPT-5依然翻车 OpenAI奥特曼：AGI已失去意义

2025年大模型选型核心指南：Beyond GPT-4，如何理性评估Qwen、DeepSeek等强者？

奥尔特曼称自己不适合担任CEO OpenAI上市后或卸任

豆包1.5 Vision Lite 对比 GPT-5-min，谁更适合你？实测AI模型选型利器｜AIBase

健合旗下Swisse PLUS携手TEDx举办抗衰沙龙，发布NAD+新生瓶系列

中国冰箱业TOP5型号4款是海尔

今日大家都在搜的词：

热文

华为MatePad Mini官宣9月4日发布

2025民营企业500强揭晓：京东第一

今日七夕节微信 520 元大额红包限时上线

AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯

realme真我15000mAh电池容量手机亮相

华为三折叠屏手机Mate XTs非凡大师上架开启预约

小米澎湃OS 3发布：帧率更稳功耗更低

史上最大Mate！华为智慧屏MateTV将于9月4日发布

小米澎湃OS 3今日发布首批29日启动Beta测试推送

腾讯客服回应微信消息撤回时间：文件3小时消息2分钟

华为MatePad Mini官宣9月4日发布

2025民营企业500强揭晓：京东第一

SpaceX第10次试飞成功马斯克：星舰这次没有空中爆炸

AI日报：钉钉十周年发布8.0版本；微信悄悄上线AI播客；阿里开源

小米澎湃OS3发布会官宣首批Beta版招募机型公布

iPhone17Pro爆料汇总：橙色版本成最大亮点或迎12项升级

今日七夕节微信 520 元大额红包限时上线

20周年版iPhone或成苹果首款曲面机：一体环绕玻璃+曲面机身

AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”

罗永浩播客节目爆火：24小时播放量超2000万晒成绩单求合作

站长商机