首页 > 业界 > 关键词  > 正文

OpenAI公布安全系统 确保AI大模型安全可靠

2023-12-06 08:38 · 稿源:站长之家

站长之家(ChinaZ.com)12月6日 消息:今日,OpenAI公布了公司在安全方面的举措。OpenAI表示,其安全系统团队处于确保当今现实世界中人工智能模型安全性和可靠性的最前沿。

安全系统团队致力于确保人工智能模型及其在现实世界中的部署的安全性、稳健性和可靠性。他们通过实践和研究来解决安全问题,并开发基本解决方案,以确保人工智能的安全和值得信赖。

微信截图_20231206083904.png

安全团队包括安全工程、模型安全研究、安全推理研究和人机交互等多个小组:

安全工程:该团队将系统级的部分措施落实到产品上,构建一个安全的、隐私意识的、集中式的安全服务基础设施,并创建面向机器学习的工具,以便进行大规模的调查和执行。

模型安全研究:模型行为聚焦是我们工作的核心关注点,目标是创建更安全、符合我们价值观、可靠和可控的模型。团队应不断提升我们在模型中的准确实施健全安全行为的能力。

安全推理研究:检测和理解风险,无论是已知的还是未知的,用于指导默认安全模型行为和缓解措施的设计关键。该团队通过将更好的安全和推理伦理技能融入基础模型,并利用这些技能增强我们的模型,努力实现这一目标。

人机交互:政策是模型行为与期望的人类价值的接口,我们与模型一起政策设计,为模型设计政策,因此政策可以直接插入我们的安全系统中。人类专家还提供反馈,以便在各个阶段与人类期望的接触。

OpenAI表示,他们致力于解决人工智能安全问题,例如如何避免模型给出不安全或不适当的答案、如何检测有害答案或操作、如何在保证安全的同时维护用户隐私等。他们还强调了以模型行为一致性为核心的研究,并通过与人机协作和人类专家合作,确保模型的行为与人类价值观一致。

举报

  • 相关推荐
  • 机器人“全能导航大脑”来了!银河通用发布NavFoM大模型

    银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM,实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用,通过统一“视频流+文本指令→动作轨迹”范式,融合800万条跨任务导航数据,在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施,为规模化商业落地奠定关键基础。

  • 登榜LMArena!文心大模型5.0-Preview文本能力国内第一

    11月8日,文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出,超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容;复杂长问题理解适用于学术问答、报告分析等任务;指令遵循能力支持智能助理、代码生成等场景,为多领域内容生产提供高效支撑。

  • OpenAI也来了,巨头为何决战AI浏览器?

    AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas,这是OpenAI推出的首款人工智能驱动的网页浏览器。 这也被外界认为OpenAI要向谷歌宣战,挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天,谷歌母公司Alphabet股价应声下挫,盘中最大跌幅接近5%,足见市场对这一新品的敏感度。 近一年来,AI浏览器的战略价值成为行业共识,从业者更是将其与智能代理(Agent)、搜索引�

  • OpenAI和微软的关系没那么糟,跟英伟达也没那么好

    OpenAI的动作比所有人想象的都要快。 上周二,OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议,结束了Azure长达六年的云服务独占模式。此前,OpenAI所有模型的训练、推理与部署都必须优先选择Azure,微软还享有优先购买权。 宣布与Azure“分手”后不到一周,OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议,OpenAI将全面接入

  • 【AI 智惠季】全模态大模型齐发优惠,GPU新客包月2.8折起

    阿里云启动双十一“AI智慧季”大型优惠活动,聚焦企业多元AI场景落地需求,推出7000万tokens大模型免费体验、GPU新客特惠等政策,助力企业降低开发成本。同时提供标准化AI产品与解决方案,覆盖内容创作、智能客服等高频应用场景,并举办系列技术分享活动,携手企业拥抱AI新时代。

  • 京东11.11直播技术全面升级,立影3D技术、JoyAI大模型重构沉浸式购物体验

    京东在双11期间升级直播技术,推出“立体3D技术”和“JoyAI大模型”等创新。立体3D技术实现裸眼360度商品展示,用户无需额外设备即可旋转查看产品细节;JoyAI生成虚拟偶像Aura,与真人明星跨次元互动,提升趣味性。AI工具还简化直播运营,支持智能脚本和选品。这些技术打破传统直播边界,增强沉浸感和互动效率,引领电商直播创新方向。

  • 一级能效全场景验证:易能时代如何确保可靠性领先

    易能时代通过底层技术创新,研发出全球首创EN5一级拓扑电路技术,实现单级高效变换,模块峰值效率突破98%+,解决了传统多级转换电路高损耗、热积累问题。该技术已量产并在全国极端环境下完成严苛测试,运行噪音低于55dB,适配城市快充站、高速服务区等多场景。模块率先通过新国标一级能效认证,帮助桩企在政策合规、项目投标中建立优势,单桩年节电超万元,为运营商提供长期收益保障。

  • “全网最像夫妻”回应被建议测DNA:做过婚检

    近日抖音账号为广东土夫妇”的一对夫妻走红网络。 视频中的这对夫妻戴着同款假发,穿着同款衣服,被网友称为全网最像夫妻”。有网友表示比双胞胎还像”,还有网友建议去验个DNA”。 对此,当事人回应称两人在领证时做过婚检,应该会检查到这一块。 研究显示,夫妻相处越久,面部特征就会

  • iPhone 18全系标配2400万前摄:苹果史上最强

    摩根大通最新研究报告显示,iPhone 18系列所有旗舰机型将搭载2400万像素前置摄像头,较iPhone 17系列的1800万像素有所升级。 此前曾有多个消息源爆料,iPhone 17全系列会配备2400万像素前置摄像头,但这一传闻最终并未兑现。不过iPhone 17系列搭载的1800万像素前置摄像头本身已是一次大幅更新。

  • 寒武纪:构建大模型开发到部署的全流程开放服务能力

    华鑫证券研报显示,寒武纪2025年上半年业绩亮眼,营收28.81亿元,同比增长4347.82%;归母净利润10.38亿元,增长295.82%。公司募资39.85亿元,重点投向大模型芯片及软件平台建设,以增强AI算力芯片综合实力。凭借云边端一体、软硬协同等技术优势,其产品已获多领域客户认可,覆盖金融、互联网等行业。未来随着技术迭代与生态完善,业绩有望持续提升。

今日大家都在搜的词: