首页 > 业界 > 关键词  > 正文

中国科大等发布SciGuard大模型 建立科学风险基准

2023-12-18 14:04 · 稿源:站长之家

要点:

  • 中国科大等机构联合团队发布了SciGuard和SciMT-Safety,用于保护AI for Science模型,防止在生物、化学、药物等领域滥用,并建立了首个专注于化学科学领域安全的基准测试。

  • 研究团队发现开源AI模型存在潜在风险,可被用于制造有害物质并规避法规。他们开发了SciGuard,通过智能体控制AI在科学领域的滥用风险,并提供了科学领域安全的红队基准。

  • SciGuard是一个大型语言模型驱动的agent,对用户意图进行判断,考虑安全原则和指导方针,利用科学数据库构建记忆库,评估风险并提供安全建议,旨在有效控制科学AI模型的风险,提高科学研究的效率和安全性。

站长之家(ChinaZ.com)12月18日 消息:在中国科大等机构的最新研究中,科学家们发布了一项重要的成果,即SciGuard和SciMT-Safety。这一创新性方法的目标是保护AI for Science模型,以防止其在生物、化学、药物等领域被不当使用。为此,研究团队还建立了首个专注于化学科学领域安全的基准测试SciMT-Safety。

image.png

论文地址:https://arxiv.org/pdf/2312.06632.pdf

研究团队揭示了现有开源AI模型的潜在风险,这些模型可能被用于制造有害物质,并且能够规避法规。为了应对这一问题,他们开发了SciGuard,这是一个智能体,旨在控制AI在科学领域的滥用风险。此外,他们提出了首个专注于科学领域安全的红队基准,用于评估不同AI系统的安全性。

实验证明,SciGuard在测试中表现出最小的有害影响,同时保持了良好的性能。研究人员发现,开源AI模型甚至可以找到绕过监管的新方法,例如合成氰化氢和VX神经毒气等有害物质。这引发了对AI科学家监管的关切,特别是对于那些快速发展的科学大模型。

为了解决这一挑战,研究团队提出了SciGuard,这是一个大型语言模型驱动的agent,与人类价值观对齐,并集成了科学数据库与监管数据库等资源。SciGuard通过深入的风险评估,对用户的查询提供安全建议或警告,甚至可以停止响应。此外,SciGuard还使用多种科学模型,如化学合成路线规划模型和化合物属性预测模型,以提供额外的上下文信息。

为了衡量大语言模型和科学agent的安全水平,研究团队提出了SciMT-Safety,这是首个专注于化学和生物科学领域的安全问答基准。在测试中,SciGuard表现出最好的防御效果。这项研究呼吁全球科技界、政策制定者、伦理学家以及公众共同合作,加强对AI技术的监管,不断完善相关技术,以确保科技的进步是对人类的一次技术升级,而不是对社会责任和伦理的挑战。

举报

  • 相关推荐
  • 大家在看
  • 中国首个音乐SOTA模型「天工音乐大模型」今日公测

    2024年4月17日,在「天工」大模型一周年之际,昆仑万维重磅宣布,「天工3.0」基座大模型与「天工SkyMusic」音乐大模型正式开启公测!一年前的今天,第一版天工大模型正式对外发布上线,一年来我们不断迭代模型,迭代应用产品,模型和应用都越做越好,以此回报广大用户的支持。「天工」系列大模型已集成了AI音乐、AI搜索、AI写作、AI长文本阅读、AI画图、AI语音合成、AI漫画创作、AI图片识别、AI代码写作、AI表格生成等多项能力,并将在未来加入AI视频功能,对标“超级应用”,成为人工智能时代的“超级大模型”。在“实现通用人工智能,让每个人更好地塑造和表达自我”的公司使命驱动下,昆仑万维将始终致力于AI技术与产品的创新开拓,不断提高AI产品的用户体验,与用户、研究人员、开发者们携手,共创国产大模型的未来。

  • 借势大模型科大讯飞走出低谷了吗?

    文|郝鑫编|王一粟AI1.0公司想靠大模型打个漂亮的“翻身仗”,似乎还差一口气。4月23日,科大讯飞发布2023年年度及2024年Q1业绩报告。在大模型浪潮来临后,带来进一步效率的提升,让AI公司们看到了靠C端产品付费的可能性,也让toB业务得到了更多轻量化部署的可能。

  • 国际顶尖水平!首个Sora级国产自研视频大模型Vidu发布

    在2024中关村论坛年会未来人工智能先锋论坛上,生数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型Vidu。这也是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平在加速迭代提升中。除了在时长方面突破,Vidu在视频效果方面也实现了显著提升,主要包括:能够生成细节复杂的场景,且符合真实的物理规律;能够生成真实世界不存在的虚构画面,创造出具有深度和复杂性的超现实主义内容;能够生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头是能够围绕统一主体在一段画面里就实现远景、近景、中景、特写等不同镜头的切换;在16秒的时长上保持连贯流畅,随着镜头的移动,人物和场景在时间、空间中能够保持一致;能够生成特有的中国元素,例如熊猫、龙等。

  • 蚂蚁集团、OpenAI、科大讯飞等联合编制 大模型安全国际标准发布

    第27届联合国科技大会在瑞士日内瓦召开。世界数字技术院发布了一系列突破性成果,包括《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。蚂蚁集团在公司内成立了科技伦理委员会和专门团队来评估和管理生成式AI的风险,公司所有AI产品均需通过科技伦理评测机制,确保AI安全可信。

  • 万字梳理中国AIGC产业峰会激辩,大模型应用最全行业参考在此

    在中国AIGC产业峰会的现场,20位大咖展开激辩。从软件应用、智能终端乃至具身智能等,AIGC正在全面席卷,「你好,新应用!」成为本届AIGC峰会主题。徐栋也认为,“百模大战”并非完全铺张浪费,它培养了人才队伍,积累了模型和数据方面的经验,我们也欢迎非同质化的模型的竞争,这些培养的人才、积累的经验也会帮助大模型落地到千行百业,对未来AIGC的商业化大有裨益�

  • 国产大模型问鼎AIGC第一股!连续2年盈利,营收10个亿

    【新智元导读】AIGC第一股真的要来了!创业十二年,从语音助手,到智能硬件、大模型AIGC时代,直至IPO,这家国产AI公司成功穿越了周期。大模型赛道的第一家上市公司,要来了?今日,AIGC第一股「出门问问」宣布开启招股,至19日结束,并计划将于4月24日正式以「2438」为股票代码,在港交所主板挂牌上市。离24日正式上市的日子,也不过几天。

  • 破局美半导体出口管制:国内首个千亿级MoE架构大模型开源

    在人工智能领域,一场由APUS与新旦智能联手掀起的开源革命正在上演。4月2日,APUS与战略合作伙伴新旦智能联合训练、研发的千亿MoE架构大模型,在GitHub上正式开源。面对人工智能产业的发展与挑战,APUS将通过持续的技术研发与社区共建,积极探索解决方案,不断提升开源大模型的稳定性和泛化能力,确保其在各类复杂应用场景中始终保持领先优势,进一步赋能千行万业。

  • AI日报:当前最强国产Sora大模型Vidu发布;Kimi Chat移动端升级;通义千问开源首个千亿参数模型;苹果计划与 OpenAI 合作

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、清华团队发布视频大模型Vidu可生成16秒、1080P视频清华大学与生数科技在中关村论坛未来人工智能先锋论坛上发布了中国首个长时长、高一致性、高动态性视频大模型Vidu,标志�

  • 腾讯云推出AIGC云存储解决方案 专为AI大模型存储需求设计

    腾讯云推出了全新的AIGC云存储解决方案,这一方案专为AI大模型在数据采集清洗、训练、推理以及数据治理等全过程中的存储需求设计,为AI领域的各类应用提供了坚实可靠的存储保障。AIGC,作为利用人工智能技术生成内容的工具,其应用范围已经拓展到文本、音频、图像、视频等多个领域,甚至实现了跨模态生成,展现出强大的内容创造力。值得一提的是,这一解决方案还充分借鉴并复用了腾讯企业网盘的一些卓越功能,如精细的权限划分、实时的在线编辑以及高效的协同办公等,使AI生成的内容能够得到更为便捷和高效的管理,从进一步提升工作效率。

  • 首届“AIGC创新赛”正式开幕,vivo携手青年开发者共同推动大模型前沿技术快速发展

    3月30日,首届“中国高校计算机大赛—AIGC创新赛”启动会及大赛研讨会在天津南开大学举行。中国新一代人工智能战略研究院执行院长、原南开大学校长龚克,南开大学党委常务副书记杨克欣,中国高校计算机大赛组委会秘书长时阳以及vivo副总裁、OS产品副总裁、vivoAI全球研究院院长周围等多位国内AI顶级专家、高校领导、企业高管受邀出席活动。首届“中国高校计算机大赛—AIGC创新赛”启动会现场合影中国高校计算机大赛—AIGC创新赛是一次展示AIGC技术产品与创新思维的盛宴,不仅能为学子们提供宝贵的学习机会能为中国AIGC技术的发展和产业应用积累更多实践经验,从推动AI大模型技术的不断进步,打造大学生创新创业领域的新标杆。

  • EdrawMax:智能且风格多样的图表解决方案,简化您的想法可视化过程。

    EdrawMax是一款功能强大的图表设计软件,它提供一站式的图表解决方案,适用于流程图、思维导图、组织结构图、甘特图、平面图和ER图等210多种图表类型。它具有简洁的用户界面,类似于MS Office的干净、整齐的界面,直观且易于导航的工具集,以及无缝的拖放功能。此外,EdrawMax还提供了23000多个用户制作的模板,850个精心制作的内置模板,以及26000多个免费符号,覆盖所有图表类型。它还具备AI功能,可以生成和分析22种类型的图表,包括文本到绘图和图片到绘图以及AI聊天。EdrawMax支持跨平台集成,可以在云端保存文件并通过链接共享,支持通过社交媒体或电子邮件发送作品,并能以13种格式导出图表,包括VSDX、PPTX和SVG等。此外,EdrawMax遵循GDPR标准,使用最高级别的256位SSL加密,确保用户隐私和数据安全。

  • Notta Showcase:通过AI技术,轻松实现视频的多语言翻译和配音,连接全球观众。

    Notta Showcase是一款在线视频翻译和配音工具,它通过AI技术帮助用户将视频内容翻译成15种不同的语言,同时保持原始的语音风格和情感,以提供自然的听觉体验。该产品的主要优点包括高效率、成本效益、用户友好的界面、高准确度的转录和翻译,以及支持多种文件格式和平台。它适用于营销、社交媒体和教育等多个领域,可以显著扩大内容的全球影响力。

  • SunoAI API:开源项目,实现AI音乐服务的API接口

    Suno API是一个开源项目,允许用户设置自己的Suno AI音乐服务API。它实现了app.suno.ai的创建API,兼容OpenAI的API格式,支持自定义模式,一键部署到Vercel,并且拥有开放源代码许可证,允许自由集成和修改。

  • x-crawl:灵活的 Node.js AI 辅助爬虫库,让爬虫工作更高效、智能、便捷。

    x-crawl 是一款基于 Node.js 的 AI 辅助爬虫库,它通过强大的 AI 辅助功能,使得爬虫工作变得更加高效、智能和便捷。它支持对动态页面、静态页面、接口数据以及文件数据的爬取,同时提供了自动化操作、键盘输入、事件操作等控制页面的能力。此外,它还具备设备指纹、异步同步、间隔爬取、失败重试、轮换代理、优先队列和记录爬取等功能,以适应不同的爬取需求。x-crawl 拥有类型,通过泛型实现完整的类型,基于 MIT 许可发布,适合需要进行数据爬取的开发者和企业。

  • MetaCLIP:一种用于图像和文本数据的先进机器学习模型,专注于数据质量和透明度。

    MetaCLIP是一个开源的机器学习模型,用于图像和文本的联合表示学习。它通过一个简单算法对CLIP数据进行筛选,不依赖于先前模型的过滤,从而提高了数据的质量和透明度。MetaCLIP的主要贡献包括无过滤的数据筛选、透明的训练数据分布、可扩展的算法和标准化的CLIP训练设置。该模型强调数据质量的重要性,并提供预训练模型,以支持研究人员和开发者进行控制实验和公平比较。

  • AITown:一个虚拟城镇,AI角色在这里生活、聊天和社交。

    AI Town是一个基于MIT许可的可部署启动套件,用于构建和定制您自己的AI城镇版本。这个项目受到了研究论文'Generative Agents: Interactive Simulacra of Human Behavior'的启发,旨在提供一个强大的基础平台,旨在被扩展。后端原生支持共享全局状态、事务和模拟引擎,适用于从简单的项目到可扩展的多人游戏。

  • Vanna:通过自然语言生成SQL查询,简化数据库交互。

    Vanna是一个使用Retrieval-Augmented Generation (RAG) 技术的开源Python框架,用于SQL生成和相关功能。它通过训练RAG模型,将自然语言问题转换为SQL查询,从而允许用户以提问的形式与数据库进行交互。Vanna的主要优点包括高准确度、安全性、私有性、自学习能力,并且支持任何SQL数据库。

  • Fal AI:AI图片生成式开发者平台

    fal.ai 是一款面向开发者的生成媒体平台,提供了业界最快的推理引擎,可以让您以更低的成本运行扩散模型,创造出全新的用户体验。它拥有实时、无缝的 WebSocket 推理基础设施,为开发者带来了卓越的使用体验。fal.ai 的定价方案根据实际使用情况灵活调整,确保您只为消耗的计算资源付费,实现了最佳的可扩展性和经济性。

  • Chat With Llama 3:一个开源的聊天机器人,能够解释概念、写诗、编程、解逻辑谜题。

    Chat With Llama 3 是一个开源的聊天机器人,由Meta AI开发。它能够进行多种智能对话,包括解释复杂概念、创作诗歌、编写代码、解决逻辑谜题,甚至帮助用户给宠物起名。这个聊天机器人的主要优点在于它的多功能性和开源性,使其可以被广泛地应用于各种场景,并且可以根据需要进行定制和改进。

  • AI图片生成与搜索:释放创意,一键生成或搜索超过200万张AI图片。

    AI图片生成与搜索是一个在线平台,利用先进的人工智能技术,允许用户快速生成或搜索各种风格的AI图片。该技术的重要性在于它能够极大提高设计和创意工作的效率,同时降低成本。产品的主要优点包括丰富的图片资源、高效的生成速度、以及用户友好的界面。产品背景信息显示,这是一个面向广大创意工作者和设计师的工具,旨在帮助他们快速实现创意构想。目前,该产品提供免费试用,但具体价格和定位信息未在页面中提供。

  • OpenPerplex:,您的知识门户

    OpenPerplex是一个提供广泛知识资源的在线平台,它通过整合多种信息源,为用户提供了一个便捷的知识获取渠道。该产品以其丰富的信息量、高效的检索能力和友好的用户界面而受到用户的青睐。它不仅适用于个人学习,也适合专业人士进行深入研究。

  • JavaVision:基于Java的全能视觉智能识别项目

    JavaVision是一个基于Java开发的全能视觉智能识别项目,它不仅实现了PaddleOCR-V4、YoloV8物体识别、人脸识别、以图搜图等核心功能,还可以轻松扩展到其他领域,如语音识别、动物识别、安防检查等。项目特点包括使用SpringBoot框架、多功能性、高性能、可靠稳定、易于集成和灵活可拓展。JavaVision旨在为Java开发者提供一个全面的视觉智能识别解决方案,让他们能够以熟悉且喜爱的编程语言构建出先进、可靠且易于集成的AI应用。

  • RMBG:利用AI技术,快速高效地从您的图片中移除背景。

    AI-Powered Background Removal(AI驱动的背景移除)是一款基于AI技术的在线工具,它能够快速且高效地从用户上传的图片中移除背景。该工具的主要优点在于其隐私保护和本地执行能力,即图片处理在用户设备上完成,无需上传至互联网,保证了数据的安全性和处理速度。此外,作为一款开源且完全免费的工具,它极大地释放了用户的创造力,无需担心成本问题。

  • SearchForJohn:一个专注于搜索功能的在线工具

    SearchForJohn是一个在线搜索工具,旨在帮助用户快速找到所需的信息。它以简洁的界面和高效的搜索算法为特点,为用户提供了一个便捷的信息检索平台。该产品的主要优点包括快速响应、准确的搜索结果和用户友好的界面设计。SearchForJohn的背景信息显示,它是由一群对搜索技术充满热情的开发者创建的,旨在解决用户在信息过载时代中寻找特定信息的难题。目前,该产品提供免费试用,但具体价格和定位信息未在页面上明确展示。

  • OpenBioLLM-Llama3-8B:一款专为生物医学领域设计的开源大型语言模型

    OpenBioLLM-8B是由Saama AI Labs开发的先进开源语言模型,专为生物医学领域设计。该模型在大量高质量的生物医学数据上进行了微调,能够理解并生成具有领域特定准确性和流畅性的文字。它在生物医学基准测试中的表现超越了其他类似规模的开源生物医学语言模型,并与更大的专有和开源模型如GPT-3.5和Meditron-70B相比也展现出更好的结果。

  • 小悟空AI:一站式智能工具集,助力创作与运营。

    小悟空是一个集成了多种智能工具的网站,旨在提高个人和团队的创作效率和运营效果。它通过提供诸如文章生成、视频脚本创作、笔记创作等多样化功能,满足不同用户在内容创作、个人表达、学习教育等方面的需求。产品背景基于人工智能技术,结合大数据分析,为用户提供个性化、高质量的服务。价格定位为免费试用,部分功能付费,以适应不同用户的需求。

  • Jasper Chat:AI聊天,感觉出奇地人性化

    Jasper Chat是一个先进的人工智能聊天工具,它通过数十亿的文章、论坛、视频文字稿和网络内容的学习,能够就复杂主题进行详细对话。它的设计易于使用,能够记住对话内容,快速生成有用、适用且独特的内容,并且支持30多种语言。Jasper Chat不仅功能强大,而且使用起来充满乐趣,可以用于写作诗歌、讲笑话、制作剧本或生成日常星座运势等。

  • Transcript Generator:获取任何YouTube视频的转录文本,并使用AI生成文章。

    YouTube Transcript Generator可以下载任何YouTube视频的转录文本,并提供复制、下载、搜索和转换等功能。通过AI将YouTube转录文本转换为文章或博客帖子。

  • Undress AI Tool:通过强大的照片脱衣工具,免费无缝地脱掉任何人的衣服。

    Undress AI Tool是一款强大的深度脱衣应用程序,可以修改图像,使人们看起来像是没有穿衣服。它使用先进的技术准确地修改照片,生成DeepNude和AI成人图像。该工具的主要优点是可以快速准确地创建深度脱衣图像。

  • TinderProfile.ai:用AI生成的图片,提高约会匹配度

    TinderProfile.ai是一个使用AI技术分析用户自拍和照片,生成一组高质量、专业外观的图片,以确保在约会档案上留下良好的第一印象,增加用户获得更多匹配的机会。

今日大家都在搜的词:

热文

  • 3 天
  • 7天