中国科大等发布SciGuard大模型建立首个科学风险基准

2023-12-18 14:04 · 稿源：站长之家

要点:
中国科大等机构联合团队发布了SciGuard和SciMT-Safety，用于保护AI for Science模型，防止在生物、化学、药物等领域滥用，并建立了首个专注于化学科学领域安全的基准测试。
研究团队发现开源AI模型存在潜在风险，可被用于制造有害物质并规避法规。他们开发了SciGuard，通过智能体控制AI在科学领域的滥用风险，并提供了科学领域安全的红队基准。
SciGuard是一个大型语言模型驱动的agent，对用户意图进行判断，考虑安全原则和指导方针，利用科学数据库构建记忆库，评估风险并提供安全建议，旨在有效控制科学AI模型的风险，提高科学研究的效率和安全性。

站长之家（ChinaZ.com）12月18日消息:在中国科大等机构的最新研究中，科学家们发布了一项重要的成果，即SciGuard和SciMT-Safety。这一创新性方法的目标是保护AI for Science模型，以防止其在生物、化学、药物等领域被不当使用。为此，研究团队还建立了首个专注于化学科学领域安全的基准测试SciMT-Safety。

论文地址:https://arxiv.org/pdf/2312.06632.pdf

研究团队揭示了现有开源AI模型的潜在风险，这些模型可能被用于制造有害物质，并且能够规避法规。为了应对这一问题，他们开发了SciGuard，这是一个智能体，旨在控制AI在科学领域的滥用风险。此外，他们提出了首个专注于科学领域安全的红队基准，用于评估不同AI系统的安全性。

实验证明，SciGuard在测试中表现出最小的有害影响，同时保持了良好的性能。研究人员发现，开源AI模型甚至可以找到绕过监管的新方法，例如合成氰化氢和VX神经毒气等有害物质。这引发了对AI科学家监管的关切，特别是对于那些快速发展的科学大模型。

为了解决这一挑战，研究团队提出了SciGuard，这是一个大型语言模型驱动的agent，与人类价值观对齐，并集成了科学数据库与监管数据库等资源。SciGuard通过深入的风险评估，对用户的查询提供安全建议或警告，甚至可以停止响应。此外，SciGuard还使用多种科学模型，如化学合成路线规划模型和化合物属性预测模型，以提供额外的上下文信息。

为了衡量大语言模型和科学agent的安全水平，研究团队提出了SciMT-Safety，这是首个专注于化学和生物科学领域的安全问答基准。在测试中，SciGuard表现出最好的防御效果。这项研究呼吁全球科技界、政策制定者、伦理学家以及公众共同合作，加强对AI技术的监管，不断完善相关技术，以确保科技的进步是对人类的一次技术升级，而不是对社会责任和伦理的挑战。

（举报）

相关推荐

关键词：

BOE（京东方）携手UNESCO联合主办WCBR“科学十年”分会彰显中国科技企业可持续发展实力

9月22日，第五届世界生物圈保护区大会在杭州开幕，这是该会议首次在中国及亚太地区举办。BOE（京东方）作为首个支持联合国“科学十年”倡议的中国科技企业，携手联合国教科文组织联合主办“科学十年”分会，展示其以技术创新赋能非洲等欠发达地区科学发展的实践成果。会议期间，BOE通过“Windows to STEM”倡议推动非洲STEM教育能力建设，并发布可持续发展品牌“ONE”，彰显其全球化布局与可持续发展理念。未来，BOE将持续携手全球伙伴践行可持续发展，为全球科学普及与绿色低碳贡献力量。

世界生物圈保护区大会联合国教科文组织京东方
为生命科学全球化赋能：法大大 Nota Sign 发布业内首个 GxP 合规电子签方案

法大大Nota Sign发布业内首个符合GxP标准的电子签方案，满足FDA 21CFR Part11等国际法规，为生命科学企业提供安全可靠的电子签署服务。该方案覆盖研发、临床、生产等全流程，解决传统纸质签署效率低、易出错的问题，助力企业提升合规性与运营效率，加速全球化进程。

全球化医药合规电子签方案
荐AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-Animate开源；字节推豆包翻译大模型

AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking；阿里开源Wan-Animate模型革新AI视频生成；字节跳动发布豆包翻译模型，支持28种语言互译；华为与浙大联合推出安全大模型DeepSeek-R1-Safe；阿里云即将发布跨模态模型Qwen3-Omni；xAI推出计算成本降低98%的Grok4Fast模型；YouTube发布多项AI创作辅助功能；IBM推出轻量级文档处理模型Granite-Docling-258M；中科院发布类脑大模型SpikingBrain实现百倍速度突破；OpenAI将推出仅限Pro用户的计算密集型新功能。

AI日报美团大模型 LongCat-Flash-Thinking
小米开源首个原生端到端语音大模型支持音频重建任务和音频转文本任务

小米发布首款开源端到端语音大模型Xiaomi-MiMo-Audio，拥有12亿参数，在智能性、情感表达和交互适配方面接近人类水平。该模型最大技术突破在于少样本学习能力，通过创新预训练架构和超一亿小时训练数据，成功突破传统语音模型依赖大规模标注数据的技术瓶颈。基于Transformer架构，支持音频重建和音频转文本等多任务处理。小米已在Huggingface平台发布预训练和指令微调版本，并在Github开源Tokenizer模型，为研究者和开发者提供完整工具链。

AI语音开源模型少样本学习
智惠家AIGC——打造中国AI 服务第一入口

文章探讨了从“互联网+”到“人工智能+”的信息技术革命深化进程，重点介绍了我国积极推动人工智能在各领域赋能与应用落地的举措。国务院印发《关于深入实施“人工智能+”行动的意见》，明确2027年新一代智能体应用普及率超70%的目标。智慧家AIGC响应政策，以社区家庭AI+教育场景为切入点，推出智能PAD等产品，通过免费使用策略获取用户流量，打造一站式服务平台，整合电商、本地生活及供应链资源，提供智能化、便捷化、个性化的新型生活服务。

人工智能+ 技术赋能应用落地
小度发布多模态智能摄像机，AI大模型重塑家庭看护体验

小度科技推出首款多模态智能摄像机C800，搭载800万像素4K超清摄像头，支持AI大模型技术。该产品不仅能实现高清监控，还具备智能行为识别、语音交互等功能，可自定义看护提醒。结合视觉与语音交互，支持复杂语义查询和家庭设备联动，扩展智能家居应用场景。目前产品已全网发售，年底还将推出三摄版本，持续探索AI硬件创新。

AI大模型智能硬件小度科技
直击企业AI安全痛点，百度智能云发布《千帆大模型平台安全白皮书》为大模型落地护航

百度智能云千帆大模型平台4.0发布《千帆大模型平台安全白皮书》，系统阐述企业级AI安全框架。白皮书聚焦平台安全、模型安全、数据安全、内容合规等六大维度，提出覆盖全生命周期的防护方案，包括混合云部署、数据加密传输、模型防窃取及内容过滤机制，助力企业安全使用大模型技术，推动AI在合规可信环境下赋能业务创新。

大模型平台企业级安全数据安全
推荐国内优势智驾：Momenta凭借飞轮大模型，带来极致流畅的驾驶体验

Momenta作为国内智能驾驶领域的领先者，凭借其创新的飞轮大模型技术，实现了端到端的自动驾驶解决方案。该技术将感知与规划整合，有效解决长尾问题，提升系统可靠性和稳定性。其R6飞轮大模型采用强化学习，具备持续进化能力，适应复杂路况。Momenta与宝马、奥迪等全球主流车企深度合作，方案已成功应用于广汽丰田、东风日产等车型，并在欧洲、澳大利亚等市场落地，展现出强大的全球适应性和技术优势。选择Momenta，即选择了经过验证的可靠技术和持续升级的智能驾驶体验。

智能驾驶系统技术实力 Momenta
荐AI日报：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去油”；抖音上线AI求真功能

AI日报今日聚焦多项技术突破：可灵AI推出图片转视频功能，腾讯混元SRPO技术提升图像真实感，IBM开源文档处理模型Granite-Docling-258M。Meta发布带屏AI眼镜Ray-Ban，DeepSeek论文登《Nature》封面。OpenAI新增GPT-5思考时长调节功能，抖音上线“AI求真”辟谣工具，通用DeepResearch开源模型性能超越国际知名模型。

AI日报数字人视频生成
荐AI日报：小米开源首个原生端到端语音大模型；通义万相Wan2.2-Animate正式开源；Suno v5即将上线

AI日报今日聚焦多项技术突破：小米开源首个端到端语音大模型Xiaomi-MiMo-Audio；通义万相推出全新动作生成模型Wan2.2-Animate；Suno即将发布革命性音乐模型v5；生数科技获数亿融资，视频生成技术商业化加速。同时关注OpenAI修复ChatGPT安全漏洞，谷歌将Gemini集成至Chrome浏览器，Luma AI发布支持16位色的Ray3视频生成模型，法国Mistral推出开源推理模型Magistral Small 1.2，Notion发布AI智能体，腾讯混元3D Studio提升3D创作效率。

AI 语音大模型小米开源

今日大家都在搜的词：

热文

3 天
7天

中国科大等发布SciGuard大模型建立首个科学风险基准

BOE（京东方）携手UNESCO联合主办WCBR“科学十年”分会彰显中国科技企业可持续发展实力

为生命科学全球化赋能：法大大 Nota Sign 发布业内首个 GxP 合规电子签方案

荐AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-Animate开源；字节推豆包翻译大模型

小米开源首个原生端到端语音大模型支持音频重建任务和音频转文本任务

智惠家AIGC——打造中国AI 服务第一入口

小度发布多模态智能摄像机，AI大模型重塑家庭看护体验

直击企业AI安全痛点，百度智能云发布《千帆大模型平台安全白皮书》为大模型落地护航

推荐国内优势智驾：Momenta凭借飞轮大模型，带来极致流畅的驾驶体验

荐AI日报：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去油”；抖音上线AI求真功能

荐AI日报：小米开源首个原生端到端语音大模型；通义万相Wan2.2-Animate正式开源；Suno v5即将上线

今日大家都在搜的词：

热文

雷军公布小米17标准版外观：1.18mm窄边框、6.3英寸直屏

全新问界M7小订破22万：将于明晚上市公布价格

AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-

折叠屏iPhone细节曝光采用超薄钛合金：预计售价2000美元起

小米平板8系列搭载11.2英寸3.2K旗舰屏

iPhone17遭首批用户吐槽客服回应：建议新机带壳

雷军演讲主题《改变》官宣：聊玄戒芯片和小米汽车背后的故事

鸿蒙智行尚界H5小订破15万台：明晚上市

realme真我GT8系列官宣10月发布

AI日报：阿里推多模态模型Qwen3-Omni；谷歌推出AP2协议；百度推

AI日报：小米开源首个原生端到端语音大模型；通义万相Wan2.2-A

小米召回116887辆SU7电动汽车：将OTA升级消除安全隐患

雷军回应小米召回11.7万辆SU7：将为用户带来更多期待功能

雷军公布小米17标准版外观：1.18mm窄边框、6.3英寸直屏

鸿蒙智行秋季发布会定档9月23日：尚界H5、新问界M7来了

全新问界M7小订破22万：将于明晚上市公布价格

苹果 iPhone 17/Pro 系列今日发售多维度升级

京东：iPhone 17开卖4小时全国超3万人签收

AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-

折叠屏iPhone细节曝光采用超薄钛合金：预计售价2000美元起

站长商机

中国科大等发布SciGuard大模型 建立首个科学风险基准

今日大家都在搜的词：

热文

站长商机

中国科大等发布SciGuard大模型建立首个科学风险基准