中国科大等发布SciGuard大模型建立科学风险基准

2023-12-18 14:04 · 稿源：站长之家

要点:
中国科大等机构联合团队发布了SciGuard和SciMT-Safety，用于保护AI for Science模型，防止在生物、化学、药物等领域滥用，并建立了首个专注于化学科学领域安全的基准测试。
研究团队发现开源AI模型存在潜在风险，可被用于制造有害物质并规避法规。他们开发了SciGuard，通过智能体控制AI在科学领域的滥用风险，并提供了科学领域安全的红队基准。
SciGuard是一个大型语言模型驱动的agent，对用户意图进行判断，考虑安全原则和指导方针，利用科学数据库构建记忆库，评估风险并提供安全建议，旨在有效控制科学AI模型的风险，提高科学研究的效率和安全性。

站长之家（ChinaZ.com）12月18日消息:在中国科大等机构的最新研究中，科学家们发布了一项重要的成果，即SciGuard和SciMT-Safety。这一创新性方法的目标是保护AI for Science模型，以防止其在生物、化学、药物等领域被不当使用。为此，研究团队还建立了首个专注于化学科学领域安全的基准测试SciMT-Safety。

论文地址:https://arxiv.org/pdf/2312.06632.pdf

研究团队揭示了现有开源AI模型的潜在风险，这些模型可能被用于制造有害物质，并且能够规避法规。为了应对这一问题，他们开发了SciGuard，这是一个智能体，旨在控制AI在科学领域的滥用风险。此外，他们提出了首个专注于科学领域安全的红队基准，用于评估不同AI系统的安全性。

实验证明，SciGuard在测试中表现出最小的有害影响，同时保持了良好的性能。研究人员发现，开源AI模型甚至可以找到绕过监管的新方法，例如合成氰化氢和VX神经毒气等有害物质。这引发了对AI科学家监管的关切，特别是对于那些快速发展的科学大模型。

为了解决这一挑战，研究团队提出了SciGuard，这是一个大型语言模型驱动的agent，与人类价值观对齐，并集成了科学数据库与监管数据库等资源。SciGuard通过深入的风险评估，对用户的查询提供安全建议或警告，甚至可以停止响应。此外，SciGuard还使用多种科学模型，如化学合成路线规划模型和化合物属性预测模型，以提供额外的上下文信息。

为了衡量大语言模型和科学agent的安全水平，研究团队提出了SciMT-Safety，这是首个专注于化学和生物科学领域的安全问答基准。在测试中，SciGuard表现出最好的防御效果。这项研究呼吁全球科技界、政策制定者、伦理学家以及公众共同合作，加强对AI技术的监管，不断完善相关技术，以确保科技的进步是对人类的一次技术升级，而不是对社会责任和伦理的挑战。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
中国首个音乐SOTA模型「天工音乐大模型」今日公测

2024年4月17日，在「天工」大模型一周年之际，昆仑万维重磅宣布，「天工3.0」基座大模型与「天工SkyMusic」音乐大模型正式开启公测!一年前的今天，第一版天工大模型正式对外发布上线，一年来我们不断迭代模型，迭代应用产品，模型和应用都越做越好，以此回报广大用户的支持。「天工」系列大模型已集成了AI音乐、AI搜索、AI写作、AI长文本阅读、AI画图、AI语音合成、AI漫画创作、AI图片识别、AI代码写作、AI表格生成等多项能力，并将在未来加入AI视频功能，对标“超级应用”，成为人工智能时代的“超级大模型”。在“实现通用人工智能，让每个人更好地塑造和表达自我”的公司使命驱动下，昆仑万维将始终致力于AI技术与产品的创新开拓，不断提高AI产品的用户体验，与用户、研究人员、开发者们携手，共创国产大模型的未来。

天工3.0 大模型公测
荐借势大模型，科大讯飞走出低谷了吗？

文|郝鑫编|王一粟AI1.0公司想靠大模型打个漂亮的“翻身仗”，似乎还差一口气。4月23日，科大讯飞发布2023年年度及2024年Q1业绩报告。在大模型浪潮来临后，带来进一步效率的提升，让AI公司们看到了靠C端产品付费的可能性，也让toB业务得到了更多轻量化部署的可能。

大模型科大讯飞 AI
蚂蚁集团、OpenAI、科大讯飞等联合编制大模型安全国际标准发布

第27届联合国科技大会在瑞士日内瓦召开。世界数字技术院发布了一系列突破性成果，包括《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。蚂蚁集团在公司内成立了科技伦理委员会和专门团队来评估和管理生成式AI的风险，公司所有AI产品均需通过科技伦理评测机制，确保AI安全可信。
万字梳理中国AIGC产业峰会激辩，大模型应用最全行业参考在此

在中国AIGC产业峰会的现场，20位大咖展开激辩。从软件应用、智能终端乃至具身智能等，AIGC正在全面席卷，「你好，新应用!」成为本届AIGC峰会主题。徐栋也认为，“百模大战”并非完全铺张浪费，它培养了人才队伍，积累了模型和数据方面的经验，我们也欢迎非同质化的模型的竞争，这些培养的人才、积累的经验也会帮助大模型落地到千行百业，对未来AIGC的商业化大有裨益�
荐国产大模型问鼎AIGC第一股！连续2年盈利，营收10个亿

【新智元导读】AIGC第一股真的要来了!创业十二年，从语音助手，到智能硬件、大模型AIGC时代，直至IPO，这家国产AI公司成功穿越了周期。大模型赛道的第一家上市公司，要来了?今日，AIGC第一股「出门问问」宣布开启招股，至19日结束，并计划将于4月24日正式以「2438」为股票代码，在港交所主板挂牌上市。离24日正式上市的日子，也不过几天。

大模型 AIGC
破局美半导体出口管制：国内首个千亿级MoE架构大模型开源

在人工智能领域，一场由APUS与新旦智能联手掀起的开源革命正在上演。4月2日，APUS与战略合作伙伴新旦智能联合训练、研发的千亿MoE架构大模型，在GitHub上正式开源。面对人工智能产业的发展与挑战，APUS将通过持续的技术研发与社区共建，积极探索解决方案，不断提升开源大模型的稳定性和泛化能力，确保其在各类复杂应用场景中始终保持领先优势，进一步赋能千行万业。

人工智能开源革命 MoE架构
腾讯云推出AIGC云存储解决方案专为AI大模型存储需求设计

腾讯云推出了全新的AIGC云存储解决方案，这一方案专为AI大模型在数据采集清洗、训练、推理以及数据治理等全过程中的存储需求设计，为AI领域的各类应用提供了坚实可靠的存储保障。AIGC，作为利用人工智能技术生成内容的工具，其应用范围已经拓展到文本、音频、图像、视频等多个领域，甚至实现了跨模态生成，展现出强大的内容创造力。值得一提的是，这一解决方案还充分借鉴并复用了腾讯企业网盘的一些卓越功能，如精细的权限划分、实时的在线编辑以及高效的协同办公等，使AI生成的内容能够得到更为便捷和高效的管理，从进一步提升工作效率。

人工智能云存储 AIGC
首届“AIGC创新赛”正式开幕，vivo携手青年开发者共同推动大模型前沿技术快速发展

3月30日，首届“中国高校计算机大赛—AIGC创新赛”启动会及大赛研讨会在天津南开大学举行。中国新一代人工智能战略研究院执行院长、原南开大学校长龚克，南开大学党委常务副书记杨克欣，中国高校计算机大赛组委会秘书长时阳以及vivo副总裁、OS产品副总裁、vivoAI全球研究院院长周围等多位国内AI顶级专家、高校领导、企业高管受邀出席活动。首届“中国高校计算机大赛—AIGC创新赛”启动会现场合影中国高校计算机大赛—AIGC创新赛是一次展示AIGC技术产品与创新思维的盛宴，不仅能为学子们提供宝贵的学习机会能为中国AIGC技术的发展和产业应用积累更多实践经验，从推动AI大模型技术的不断进步，打造大学生创新创业领域的新标杆。

中国高校计算机大赛 AIGC创新赛人工智能
百度智能云发布千帆大模型一体机：预置十余个主流开源大模型

在百度智能云GENERATE全球生态大会上，百度智能云发布千帆大模型一体机，从算力资源角度分为通用版、昇腾版、昆仑芯版三个版本，为企业私有化部署大模型提供解决方案。千帆大模型一体机预置了百度自研的文心大模型，以及Llama、Baichuan、ChatGLM等十余个主流开源大模型。过去6个月，百度智能云生态伙伴的数量增长了5倍，伙伴们开发的300多款应用通过千帆应用商店”进入市场。

百度智能云 GENERATE全球生态大会千帆大模型一体机
商汤科技将发布「日日新 SenseNova 5.0」大模型

商汤科技宣布，将于明日推出全新版本的「日日新5.0」，继续带来技术的创新和突破。日日新是商汤科技推出的大模型体系，包括自然语言处理模型“商量”、文生图模型“秒画”和数字人视频生成平台“如影”等。用户可以通过自然语言输入，利用大模型的意图识别、逻辑理解与代码解释器的能力，实现自动数据转化为有意义的分析和可视化结果。

今日大家都在搜的词：

热文

3 天
7天

中国科大等发布SciGuard大模型 建立科学风险基准

今日大家都在搜的词：

热文

站长商机

中国科大等发布SciGuard大模型建立科学风险基准