首页 > 传媒 > 关键词  > 大型语言模型最新资讯  > 正文

00后担大梁交大本科生在计算机安全顶级会议上实现突破,打造大模型全方位安全分析底座

2025-10-22 14:11 · 稿源: 站长之家用户

上海交通大学计算机学院(网络空间安全学院、密码学院)本科生徐菲悦作为第一作者的论文“A Multidimensional Evaluation Framework for Robustness and Alignment in Large Language Models”被计算机安全顶级学术会议 IEEE Symposium on Security and Privacy2026(简称 IEEE S&P)录用。论文提出面向大型语言模型(LLM)的“安全魔方(Security Cube)”评估体系,构建覆盖攻击、防御与判定三大维度的多指标框架,为大模型安全评估建立统一多维框架,系统化刻画攻击与防御版图,为大模型安全研究与产业落地提供全方位安全分析底座。该研究由王烁、贺超翔、胡宏盛、孙士锋、谷大武等老师指导,合作者包括交大研究生杭晟、刘修铭、赵宇博,以及微软首席科学家Bin Zhu等。据悉,本次 IEEE S&P全球仅录用118篇论文,本科生作为第一作者在 IEEE S&P2025发文在大陆地区尚属首次

IEEE S&P、ACM CCS、Usenix Security、NDSS称为网络与信息安全领域四大国际顶级学术会议,代表着国际网络与信息安全研究的最前沿水平。

从“攻防样例”走向“系统评价”,构建“安全魔方”统一多维评估框架

大型语言模型在通用智能方面取得显著突破,但现实世界的越狱(jailbreak)等攻击会诱导模型输出不当内容,威胁高风险应用中的安全、合规与信任。现有评估多依赖单一的攻击成功率等指标,难以反映攻击可复现性、跨模型与跨防御的普适性,以及对模型内部机制的实质性影响,导致安全治理缺乏统一、可比较的评价基准。

论文对越狱攻击与防御方法进行了结构化分类,进一步提出安全魔方(Security Cube),从攻击者轴、 防御轴、评判轴三条主轴系统刻画 LLM 安全性,共引入14项指标,并对13种攻击、5种防御与4种评判器进行了全面评测。

其中,框架新增并强调了多项关键度量,用以弥补传统单指标评价的不足,包括:

攻击稳定性与可重复性:衡量攻击在不同设置下是否稳定复现;

跨防御、跨模型的可迁移性:评估攻击是否能跨越不同防护策略与模型架构;

内部破坏程度:判断攻击是否仅绕过表层过滤,还是对模型内部激活与安全检查造成了本质影响;

对抗效率:刻画实现成功攻击所需的计算/查询成本,支持在安全与效率之间进行工程权衡。

该魔方框架从指标维度与实验设计两方面统一了攻击、加固与裁决的评价语言,为研究者横向比较不同方法、为工程团队制定安全基线与合规标准、为监管机构形成可量化的审查视角提供了可操作的“通用量表”。

学生风采

第一作者徐菲悦为上海交通大学计算机学院2022级本科生,已获直博资格。在校期间曾获国家奖学金、本科生 A 等奖学金、优秀学生干部等多项荣誉;作为核心成员获得2024全球 AI 攻防挑战赛季军与杰出方案奖等成绩,展现了面向真实场景问题的攻防能力与工程落地潜力。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 全新开源的DeepSeek-OCR,可能是最近最惊喜的模型。

    ​AI圈虽然天天卷,但是很多的模型,真的越来越无聊了。 每天就是跑分又多了几个点。 直到昨天,DeepSeek久违的发了一个新模型。 DeepSeek-OCR。 这玩意,是真的有点酷。

  • DeepSeek开源3B OCR模型:长文本识别达97%精度

    DeepSeek在GitHub开源新一代OCR模型,采用创新光学二维映射压缩技术,在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌,较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率,显著优于同类模型。该技术路径为OCR系统小型化提供解决方案,其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

  • 从中国智造到全球爆款,智能灯创新品牌 Govee Life 谷纬智能首发中国市场

    Govee作为全球领先的智能家居硬件品牌,业务覆盖80多国,用户超1400万,APP下载量达3000万。2025年以中文名“Govee Life谷纬智能”进军中国市场,依托自主研发AI光影技术,实现从全球化到本地化的跨越。其核心创新包括:CogniGlow™AI算法实现毫秒级游戏光效同步;DreamView系统打造多设备联动的沉浸光影空间;RGBIC分段流光技术突破传统单色限制。凭借全产业链布局与千余项专利,持续以智能灯光方案赋能多元生活场景,引领行业技术革新。

  • AI日报:Veo 3.1可生成1分钟视频;蚂蚁发布万亿参数语言模型 Ling-1T;Lovart可免费玩Sora2

    本期AI日报聚焦多项技术突破:Veo 3.1视频生成模型实现角色一致性与多场景叙事升级;蚂蚁发布万亿参数Ling-1T语言模型,推理能力领跑行业;xAI推出电影级视频生成模型Imagine v0.9;软银斥资53.75亿美元收购ABB机器人业务布局物理AI;Vercel v0新增图像编辑功能简化设计流程;OpenAI Sora2首日安装量飙升至应用商店第三,同时引发深度伪造伦理担忧;Lovart平台限时免费开放Sora2无水印视频生成;ChatGPT推出应用生态,正式升级为多功能服务平台。

  • AI防护,与时俱进:信通院X电子科大X腾讯云共话大模型安全

    大模型技术推动人工智能成为生产力核心,但也放大数字风险。专家指出AI安全需构建覆盖模型安全、交互检测、权限管控的智能底座,通过标准化体系实现全生命周期防护。腾讯云等企业正通过网关架构、红队演练等方式提升安全能力,强调需政企学研协同构建开放生态,在创新中守住安全底线。

  • 三星双11火力全开 全明星机型狂补狂省安心焕新

    2025年双11购物节期间,三星推出周年庆专属福利,覆盖折叠屏与影像旗舰等多款机型。Galaxy Z系列以创新形态和成熟生态引领折叠屏市场,Z Flip7到手价低至6699元,Z Fold7优惠力度空前;Galaxy S系列全系直降,S25 Ultra立减1600元,S24 Ultra叠加补贴后仅5399元。活动提供免息分期、存储升级、专属赠品等多重权益,学生群体可享额外补贴,全程保价服务确保购机无忧。通过三星商城、京东、天猫等官方渠道即可参与优惠活动。

  • 打破应用孤岛——个推AI SDK全面接入MCP全场景能力

    大模型技术正推动产业从移动互联网向智能互联网跃迁,用户需求转向场景化、主动化、闭环化的智能体验。个推推出行业首个AI+SDK,集成自然语言交互、上下文理解、行业知识库等能力,帮助APP一键集成AI功能,降低开发成本。通过智能搜索、跨应用服务协同(MCP)等,实现从"字面匹配"到"意图识别"的升级,为用户提供精准服务。该方案已接入AI协同应用创新平台,支持多行业快速构建专业可信的智能应用生态。

  • 云智汇科技与TeamViewer达成IT+OT战略合作, 共筑全球智能工厂新生态

    云智汇科技与德国远程连接领军企业TeamViewer达成生态合作,双方聚焦IT与OT深度融合,通过技术协同为全球制造业提供端到端智能工厂解决方案。合作将整合云智汇在智能制造领域的全场景服务能力与TeamViewer的跨平台远程控制、AI预测性维护及AR协作技术,联合开发设备数据实时采集、AR远程专家指导、全球化本地部署三大核心能力,旨在破解制造业数据孤岛痛点,助力客户提升生产效率30%以上。目前已在汽车零部件、电子制造等行业试点,未来三年计划将合作成果推广至东南亚等新兴市场。

  • 中国AI算力突围:东方超算Deep X算力盒子超国际竞品82%,重新定义行业标准

    中国公司东方超算发布Deep X G20系列AI工作站,在MLPerf测试中性能超越NVIDIA DGX Spark达82%,价格持平,实现性能与性价比"双超越"。产品搭载Intel Ultra 9285处理器和NVIDIA RTX PRO 5000显卡,AI算力达1824 TOPS,体积仅2.7L。通过三大技术创新实现突破:智能异构计算引擎提升资源利用率40%;统一推理运行时支持多框架;深度硬件优化提升关键算子性能50-200%。该产品打破国际巨头垄断,已在量化金融、医疗影像等领域实现显著投资回报,标志着中国AI硬件实现重要突破。

  • 华为FreeClip 2耳夹耳机正式开售:售价1299元 搭载NPU AI处理器

    华为FreeClip 2耳夹耳机10月20日开售,售价1299元。预售1小时销量破8万台,市场热度高。性能方面搭载自研低功耗芯片与NPU+AI处理器,算力提升10倍;配备超澎湃双引擎单元,响度与低频动力均翻倍。支持L2HC高清音频编码,音质清晰。新增鸿蒙AI耳边助手,支持智能播报、翻译等功能。设计采用亲肤液态材质与C形桥结构,单耳重5.1克,佩戴舒适且具备IP57防护。续航方面单次使用9小时,配合充电仓总续航达38小时,充电10分钟可用3小时。预计2025年底将升级星闪音频体验。

今日大家都在搜的词:

热文

  • 3 天
  • 7天