11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
研究人员在美国马里兰大学成功开发了一种高效的方法,可以在一分钟内诱导大型语言模型产生有害反应,他们将这一技术命名为BEAST。BEAST技术利用NvidiaRTXA6000GPU、48GB内存和即将发布的开源代码,仅需一分钟的GPU处理时间,就能让LLM飞越其防护栏。”此研究强调了确保未来更强大AI模型的安全部署需要制定可证明的安全保证。
据darkreading报道,谷歌研究人员已经发现了针对现实世界人工智能系统的六种特定攻击,发现这些常见的攻击向量表现出一种独特的复杂性,他们指出,这将需要结合对抗性模拟和人工智能专家的帮助来构建一个坚实的防御。该公司在本周发布的一份报告中透露,其专门的人工智能红队已经发现了这项快速发展的技术面临的各种威胁,主要基于攻击者如何操纵驱动生成式人工智
今日,国内最权威的信息安全会议之一,第19届XCon安全焦点信息安全技术峰会于北京举行,腾讯朱雀实验室首度亮相公众视野。这个颇有神秘色彩的安全实验室由腾讯安全平台部孵化,专注于实战攻击技术研究和AI安全技术研究,以攻促防,守护腾讯业务及用户安全。会上,腾讯朱雀实验室高级安全研究员nEINEI分享了一项AI安全创新研究:模拟实战中的黑客攻击路径,摆脱传统利用“样本投毒”的AI攻击方式?