首页 > 业界 > 关键词  > Meta最新资讯  > 正文

Meta 宣布 Purple Llama 倡议,以促进负责任和安全的生成式人工智能开发

2023-12-08 08:59 · 稿源:站长之家

站长之家(ChinaZ.com) 12 月 8 日消息:Meta 今天宣布了一项名为「Purple Llama」的新倡议,旨在促进人工智能(AI)系统的负责任开发。

Llama2,Meta,人工智能,大语言模型,AI

Meta 表示,该项目将逐步提供 AI 开发社区构建开放生成 AI 模型所需的所有工具和评估,以确保安全和负责任的方式进行

在一篇博客文章中,Meta 的 AI 研究团队解释说,生成式 AI 正在推动一波创新浪潮,包括对话式聊天机器人、图像生成器、文档摘要工具等现在在全球范围内被广泛使用。许多这些新的生成式 AI 应用由 Meta 的开源 Llama 大型语言模型驱动。

因此,Meta 感到有责任采取行动,并鼓励在 AI 安全领域的合作,称这对于建立对这些新创新的信任至关重要。「构建 AI 系统的人无法在真空中解决 AI 的挑战,这就是为什么我们希望平衡竞争环境,为开放的信任和安全创造一个中心,」该公司解释道。

为了开始这一切,Meta 首先推出了一个名为 CyberSec Eval 的免费开放的大型语言模型(LLM)网络安全评估基准。Meta 还宣布推出 Llama Guard,这是一个用于输入/输出过滤的安全分类器,已经过优化,便于部署。

Meta 在博客文章中表示,网络安全和 LLM 提示安全是生成式 AI 安全中两个最重要的领域,这在其 Llama 2 负责任使用指南中得到了强调。

据介绍,CyberSec Eval 是业界首个针对 LLM 的网络安全安全评估集。这些基准基于行业标准和指南,并与安全主题专家合作开发。它们为开发者提供量化 LLM 安全风险的指标,并旨在解决不安全代码建议频率等问题。它们还使开发者能够评估 LLM,使应用程序更难生成可能用于协助网络攻击的恶意代码。

Meta 表示,新工具将有助于防止黑客和其他恶意行为者利用 LLM 进行网络攻击。其早期研究发现,生成式 AI 被用来生成不安全代码和满足恶意请求存在「重大风险」。

至于 Llama Guard,它是一个预先训练的模型,旨在防止生成式 AI 模型生成潜在风险的输出。它是基于公开可用的数据集混合训练的,使其能够检测许多不同用例中可能相关的常见风险或违规内容。因此,它可以检测来自生成式 AI 模型的风险提示和输出,并防止它们被处理。最终,Meta 表示,这将帮助开发者定制他们的生成式 AI 模型,以支持相关用例,同时将引起争议、不安或冒犯的风险降到最低

紫色团队行动

Meta 表示,「Purple Llama」是其新 AI 安全倡议的合适名称,因为缓解生成式 AI 的风险需要开发者结合攻击(即「红色团队行动」)和防御(即所谓的「蓝色团队行动」)。在传统网络安全中,红色团队由专家组成,他们执行各种攻击,试图克服公司的网络安全防御,而蓝色团队则专注于保护和应对这些攻击。

因此,Meta 将其对生成式 AI 安全的方法标记为「紫色团队行动」,旨在促进评估和缓解技术潜在风险的协作方法。

作为 Purple Llama 倡议的一部分,Meta 打算进行大量的探索性研究,但不会单独进行。相反,它正在创建一个开放的生态系统,合作伙伴包括新成立的 AI 联盟、AMD、亚马逊AWS、贝恩公司、CloudFlare Inc.、Databricks Inc.、Dell Technologies Inc.、Dropbox Inc.、谷歌云、Hugging Face Inc.、IBM 公司、英特尔公司、微软公司、MLCmmons、英伟达公司、甲骨文公司、Scale AI Inc.、Together Computing Inc. 等众多公司。

Meta 今天宣布这一倡议的时机紧随其加入 IBM 公司 AI 联盟之后,似乎是为了实现后者组织的目标而迈出的第一步,Constellation Research Inc. 副总裁兼首席分析师 Andy Thurai 表示。「在委员会工作成果发布之前,甚至在团队确定之前,Meta 已经提前发布了一套工具和框架,」分析师指出。

Thurai 补充说,值得一提的是,Meta 正在与一些尚未加入 AI 联盟的公司合作,包括 AWS、谷歌、微软和英伟达,这些是行业最大的参与者之一。

「Meta 计划将它们用于商业和研究领域的许可,这是 LLaMa 模型许可选项限制最大的不满,」Thurai 补充说。「所提出的工具集旨在帮助 LLM 生产者评估 LLM 安全风险、不安全代码输出评估,和/或可能限制输出,防止恶意行为者利用这些开源 LLM 进行网络攻击。这是一个良好的第一步,我希望看到更多。」

Purple Llama 项目的组成部分,包括 CyberSec Eval 和 Llama Guard,将基于宽松的许可进行许可,允许研究和商业使用。Meta 表示,它将在 12 月 10 日开始的 NeurIPs 2023 活动上展示这些组件的第一批,并为希望实施它们的开发者提供技术深入解析。

举报

  • 相关推荐
  • 迎“人工智能+”政策东风!2025中国智能产业大会&吴文俊人工智能创新大会即将落地常州

    在全球AI竞争加剧背景下,国务院印发《关于深入实施“人工智能+”行动的意见》,推动AI与经济社会深度融合。中国人工智能学会主办的“2025第十四届中国智能产业大会暨吴文俊人工智能创新大会”将于8月30-31日在常州举行,聚焦破解AI产业“卡脖子”难题。大会设置15场专题会议和3场特色活动,覆盖基础技术突破、核心应用落地、交叉学科融合等领域,为产学研各界搭建高

  • 北电数智亮相世界人工智能大会,“四链融合”推动AI产业落地

    2025世界人工智能大会“人工智能+”战略领军人才与创新发展论坛圆满落幕。论坛聚焦“人才领航智启未来”主题,汇聚中科院、社科院专家及中国联通、腾讯云等机构代表,围绕“人工智能+”行动分享经验,为AI高质量发展筑牢人才根基、激发创新动能。北电数智CMO杨震出席并发表演讲,分享AI行业落地实践,强调紧跟国家战略,推进产业、创新、人才、资本四链融合,打造面向不同场景的AI解决方案,全方位助力AI产业发展。

  • Lamett乐迈石晶快装秘籍!让武汉20年老宅“一键焕新”

    武汉黄先生一家140平米老宅经《梦想改造家》节目改造后焕然一新。设计师采用零甲醛添加的Lamett乐迈石晶地板,解决潮湿问题,提升防滑耐磨性能。空间重构实现客卧对调、主卧休闲办公一体化,厨房岛台增进家人互动。全屋原木色调营造温馨氛围,兼顾健康与美学,为五口之家打造安全舒适的生活环境。

  • 微算法科技(NASDAQ:MLGO)基于人工智能优化构建混合ARIMA模型,提高比特币价格预测准确性

    随着数字资产市场兴起,比特币等加密货币价格预测成为焦点。传统模型难以准确捕捉其非线性波动,微算法科技引入AI技术优化ARIMA模型,结合LSTM网络构建混合模型,提升预测准确性。通过AI算法自动处理数据缺失、异常值检测及参数优化,实现更可靠的比特币价格预测,为投资者提供决策支持。

  • 下一个爆款在哪儿?2025英特尔人工智能创新应用大赛获奖名单揭晓

    8月16日,2025英特尔人工智能创新应用大赛总决赛在深圳落幕。40支优秀团队从2817支队伍中脱颖而出,围绕工业、教育、心理健康、游戏等领域展开对决。大赛展示了AI从云端走向边缘的趋势,依托酷睿Ultra处理器和低代码开发工具,推动AI应用本地化落地。获奖作品包括动力电池机器人协作拆卸系统和AI生成PPT服务,体现AI与产业需求的深度融合。英特尔与联想、惠普等合作伙伴共同为开发者提供全栈支持,加速AI技术普及和商业化进程。

  • 海尔冰箱唯一获批“制冷家电人工智能技术山东省工程研究中心”

    海尔冰箱在人工智能领域取得新突破,主导建设的"制冷家电人工智能技术山东省工程研究中心"成为2025年山东省工程研究中心认定名单中唯一入选的冰箱品牌。该中心聚焦人工智能、物联网、大数据等技术方向,开发了全空间智慧保鲜舱冰箱等140多项行业首创产品,近三年获授权发明专利803件。海尔冰箱还推出行业首款接入DeepSeek的AI全空间保鲜冰箱,具备方言识别、降噪技术等功能,显著提升用户体验。市场数据显示,2023年1-7月海尔冰箱以47%市场份额稳居行业第一。通过AI技术赋能,海尔冰箱正引领行业向精准、智能保鲜时代跨越。

  • ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

    ISC.AI2025人工智能安全论坛在北京召开,聚焦AI安全治理与创新实践。论坛汇集顶尖专家,探讨大模型安全评估与防护、智能体安全、AI治理等前沿议题。360集团张向征指出,随着Agent技术爆发式应用,AI安全已成为产业核心焦点。专家们强调需构建AI安全防护体系,应对大模型直接访问核心系统带来的全新挑战。中国电子院彭健提出企业合规建设需关注九大要素,清华大学苏航揭示智能体安全风险远超传统AI。华为云范建军倡导端到端大模型安全防护,中国信通院杨哲超呼吁构建协同治理框架。论坛为构建安全、普惠、负责任的人工智能未来贡献智慧。

  • 15天快装开业,Lamett乐迈石晶地墙品类投资模式解析

    贝壳研究院数据显示,2025年中国存量房装修市场规模将达3.34万亿元,消费者对健康环保、便捷高效的家装需求持续攀升。乐迈石晶作为全球石晶品类开创者,推出"100㎡开店、10余万投资、15天极速开业"轻资产模式,携手经销商掘金"新房整装+旧房改造"市场。其首创的石晶地板和石晶柜板技术,实现从地面材料向墙面、柜体等全屋空间应用的跨越,构建"地墙柜一体化"健康整装系统。凭借"零醛添加、防水防潮"等核心性能优势,石晶材料正加速替代传统建材。目前乐迈石晶在全球拥有10余家工厂及销售机构,业务遍及80多个国家和地区,为高端住宅及商业空间提供整体解决方案。

  • 知名互联网meme原型狗 柴犬PON去世 表情包你用过吗

    日前,网络热门表情包不可以色色”的原型柴犬Pon”被其主人在Instagram上宣布离世,享年17岁。 其主人在ins上用Pon的口吻表示:大家好!非常感谢你们给我的爱,明天11点我将穿过彩虹桥,虽然有点难过,但我的心里充满了幸福,我会带着大家笑容的记忆,踏上全新的旅程你们的邻里偶像PON。” 据了解,PON是一只出生于2008年1月6日的日本埼玉北部柴犬。

  • AI日报:海螺AI首尾帧功能上线;元石科技发布问小白5;OpenAI发布全新语音模型GPT-Realtime

    AI日报栏目每日提供人工智能领域热点内容,聚焦开发者,帮助洞悉技术趋势、了解创新AI产品应用。最新动态包括:MiniMax海螺AI首尾帧功能上线;元石科技发布问小白5挑战GPT-5;OpenAI推出语音模型GPT-Realtime;谷歌Gemini AI优化表格处理;腾讯黑科技实现AI配音;百度计划培养千万AI人才;MathGPT.ai反作弊功能推广;苹果Xcode集成Claude Sonnet4;微软发布自研AI模型MAI系列;xAI推出高效编码模型Grok Code Fast1;SuperCLUE多模态评测Gemini-2.5-Pro居首;9月1日起AI内容标识新规实施,违规将承担法律风险。

今日大家都在搜的词: