首页 > AI头条  > 正文

OpenAI 表示其最新的 GPT-4o 模型风险评级为“中等”

2024-08-09 09:16 · 来源: AIbase基地

最近,OpenAI 发布了他们最新的 GPT-4o 系统卡,这是一份详细的研究文件,介绍了该公司在推出新模型之前所做的安全措施和风险评估。

GPT-4o 模型是在今年五月正式上线的。在发布之前,OpenAI 聘请了外部的安全专家团队进行风险评估,这种 “红队” 测试是相当常见的做法。他们主要关注模型可能带来的风险,比如生成未经授权的声音克隆、淫秽和暴力内容,或者重复的受版权保护的音频片段。

GPT-4o ChatGPT

根据 OpenAI 自己的框架,研究人员将 GPT-4o 的整体风险评估为 “中等”。这个风险等级是根据四个主要类别中的最高风险评定得出的:网络安全、生物威胁、说服力和模型自主性。除了说服力外,其他类别都被认为是低风险。研究人员发现,GPT-4o 生成的一些文本在影响读者意见方面比人类写的文本更具说服力,尽管整体上并没有更具说服力。

OpenAI 的发言人 Lindsay McCallum Rémy 表示,系统卡包括由内部团队和外部测试人员共同创建的准备评估,外部团队包括 OpenAI 网站上列出的模型评估与威胁研究(METR)和阿波罗研究(Apollo Research),他们专注于人工智能系统的评估。这并不是 OpenAI 首次发布系统卡,之前的 GPT-4、GPT-4视觉版和 DALL-E3也经历了类似的测试,并发布了相关研究结果。

但这次发布的系统卡恰逢一个关键时刻,OpenAI 近期面临来自内部员工和州参议员的不断批评,质疑其安全标准。在 GPT-4o 系统卡发布的几分钟前,麻省参议员伊丽莎白・沃伦(Elizabeth Warren)和众议员洛丽・特拉汉(Lori Trahan)共同签署的一封公开信,呼吁 OpenAI 就如何处理举报者和安全审查提供答案。信中提到的许多安全问题,包括首席执行官山姆・阿尔特曼(Sam Altman)在2023年因董事会的担忧而短暂被解雇,以及一名安全高管的离职,该高管声称 “安全文化和流程被美丽的产品所压制”。

此外,OpenAI 正好在美国总统选举前发布一款功能强大的多模态模型,这显然存在误传信息或被恶意行为者利用的潜在风险。尽管 OpenAI 希望通过实际场景的测试来防止滥用,但公众对其透明度的呼声越来越高。尤其是在加州,州参议员斯科特・维纳(Scott Wiener)正在推动一项法案,规范大型语言模型的使用,包括要求公司在其 AI 被用作有害用途时承担法律责任。如果法案通过,OpenAI 的前沿模型必须遵循州法规定的风险评估才能向公众发布。

划重点:

🌟 OpenAI 的 GPT-4o 模型被评估为 “中等” 风险,主要关注网络安全和说服力等方面。  

🔍 系统卡的发布正值 OpenAI 面临外界安全标准质疑的关键时刻,呼声日益高涨。  

🗳️ 发布时机敏感,正值美国总统选举前,存在误传信息和被恶意利用的风险。  

  • 相关推荐
  • AI日报:海螺AI首尾帧功能上线;元石科技发布问小白5;OpenAI发布全新语音模型GPT-Realtime

    AI日报栏目每日提供人工智能领域热点内容,聚焦开发者,帮助洞悉技术趋势、了解创新AI产品应用。最新动态包括:MiniMax海螺AI首尾帧功能上线;元石科技发布问小白5挑战GPT-5;OpenAI推出语音模型GPT-Realtime;谷歌Gemini AI优化表格处理;腾讯黑科技实现AI配音;百度计划培养千万AI人才;MathGPT.ai反作弊功能推广;苹果Xcode集成Claude Sonnet4;微软发布自研AI模型MAI系列;xAI推出高效编码模型Grok Code Fast1;SuperCLUE多模态评测Gemini-2.5-Pro居首;9月1日起AI内容标识新规实施,违规将承担法律风险。

  • OpenAI CEO:GPT-6将具备个性化记忆 记住用户偏好习惯

    OpenAI的首席执行官萨姆奥尔特曼(Sam Altman)在近日的一次专访中,透露了下一代大模GPT-6的最新进展。他表示,GPT-6 的开发正在积极推进中,其发布节奏将比从GPT-4到GPT-5的周期更快。 奥尔特曼特别强调,GPT-6将不再局限于单纯回答问题,而是朝着与用户深度适配”的方向演进。他举例描述

  • GPT5上线大翻车!用户强烈呼吁使用旧版 OpenAI重新上线GPT4o

    OpenAI发布最强AI模型GPT-5,但引发用户强烈不满。新模型上线后反应速度变慢、回答质量下降,且官方突然下架GPT-4o等8个旧模型,导致付费用户抗议。部分用户对旧版产生情感依赖,认为GPT-4o更具人性化温暖。第三方测试显示GPT-5在复杂任务上虽有提升,但交互体验明显退步。CEO承认低估用户对旧版的喜爱,承诺将恢复部分旧模型并提供更多定制服务。专家指出大模型边际效益递减,面临数据质量和算力成本限制。总体而言,GPT-5在技术指标进步的同时,牺牲了情感交互体验。

  • OpenAI的开源模型现已在IBM watsonx.ai上提供

    OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B,允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台,采用专家混合架构,支持本地或云端部署,不受商业用途限制。模型具备高透明度,输出完整推理链,在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态,IBM强调其开放战略,为企业提供灵活、安全的AI开发选择。

  • 博士水平的GPT-5依然翻车 OpenAI奥特曼:AGI已失去意义

    上周末OpenAI公司发布了传闻已久的GPT-5大模型,号称迄今为止最先进的人工智能模型,具备博士级别的智能水平。 GPT-5发布之后在多个榜单上确实刷榜了,包括编程、数学等,总计拿到了25个榜单的第一,评分表现很震撼。 然而上线之后,GPT-5的实际表现引发质疑,跑分第一不代表实际体验第一,甚至被不少用户认为表现倒退了,反应也变慢,这可能是OpenAI翻车最快的旗舰大�

  • 2025年大模型选型核心指南:Beyond GPT-4,如何理性评估Qwen、DeepSeek等强者?

    大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架,强调需超越单一指标崇拜,基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析,展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程,采用专业工具进行多维度评估,通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型,而非盲目追求流行模型。

  • 奥尔特曼称自己不适合担任CEO OpenAI上市后或卸任

    OpenAI首席执行官Sam Altman近日接受采访时透露,虽然公司正推进数万亿美元级的计算基础设施投资计划,但他对上市后继续担任CEO持保留态度。 Altman坦言,尽管主导着OpenAI多项战略级项目,但自认缺乏上市公司CEO所需的核心管理素质与市场敏感度。 他特别强调,上市企业领导者需具备应对复杂投资者关系与监管环境的综合能力,而自己可能并非最优人选。

  • 豆包1.5 Vision Lite 对比 GPT-5-min,谁更适合你?实测AI模型选型利器|AIBase

    文章探讨了企业选择AI大模型时面临的实际决策难题,指出单纯比较学术参数无法满足业务需求。AIBase模型对比平台(https://model.aibase.cn/compare)通过三大核心价值解决痛点:1)聚焦业务场景而非参数堆砌,突出价格、语言支持、上下文长度等实用维度;2)透明化成本计算,标注长文本溢价规则和多模态附加费;3)一键生成对比报告。平台特别强调中文场景的特殊性(如豆包1.5在中文处理成本的优势),并揭示厂商宣传中容易忽略的隐藏成本(如GPT-5-min超5000字符的30%溢价)。典型电商客服案例显示,需综合中文理解、多模态、性价比等维度决策,最终选择取决于具体业务需求而非绝对性能排名。

  • 健合旗下Swisse PLUS携手TEDx举办抗衰沙龙,发布NAD+新生瓶系列

    《全球抗衰老市场研究报告》显示,2024年全球抗衰老产品市场规模达2662亿美元。高端消费群体需求从粗放式营养补充转向精准干预,推动行业向细胞级解决方案升级。Swisse PLUS与TEDx合作举办主题沙龙,发布NAD+新生瓶系列,汇聚专家学者探讨细胞抗衰科学路径,倡导建立个人健康管理系统,实现精准抗衰与主动健康管理。

  • 中国冰箱业TOP5型号4款是海尔

    2025年7月冰箱行业零售额、零售量增速放缓,环比下降34.5%和29.1%。行业承压加剧,多数品牌负增长,仅海尔冰箱逆势增长9.1%。海尔凭借爆款产品带动增长,TOP5型号中占4款,均为主打高端十字门冰箱。其磁控全空间保鲜技术获国家科技奖,显著延长食材保鲜期。通过全流程数字化升级,海尔实现运营效率提升,以科技驱动和用户体验赢得市场,为行业提供增长启示。

今日大家都在搜的词: