首页 > 传媒 > 关键词  > 软件漏洞最新资讯  > 正文

山石网科谈突破模糊测试极限:大模型驱动的软件漏洞深度挖掘

2025-03-20 16:12 · 稿源: 站长之家用户

软件漏洞的发现向来是一场与时间的赛跑,而大模型的引入为模糊测试注入了全新的智慧动力。跳脱传统随机变异的局限,大模型准确的语言和逻辑推理能力正重新定义模糊测试的效率与深度,助力安全团队快速定位潜在威胁,为软件安全提供更强的护盾。

传统的模糊测试技术在揭示软件漏洞方面虽有效,但其固有的局限性可能会影响测试的效率和效果。一个显著缺点是传统模糊测试器主要以随机或半随机的方式运行,这导致测试过程可能耗时且效果不佳,因为它们无法探索所有可能的执行路径。此外,用于变异的种子通常由人类手工构造,耗时较长。尽管多年来已对此类问题进行了研究,并提出了许多缓解方法,但大模型的出现为模糊测试领域带来了全新的思维方式。

大模型模糊测试相较于传统方法的优势有哪些?

Ying Z等人评估了ChatGPT在直接生成测试用例(无微调)方面的表现,并将其与两种传统测试工具(SIEGE和TRANSFER)进行了比较。他们的实验表明,当提供了漏洞的详细描述、可能的攻击方式以及代码上下文时,大模型的表现优于传统方法。以下是大模型相较传统工具的优势描述。一个重要因素在于大模型的出现使得模糊测试从随机变异转向引导式变异。Jie H等人向传统灰盒模糊测试添加了一个基于GPT的种子变异器,从种子池中选择种子并请求ChatGPT生成的变体以生成更高质量的输入。

另一个优势是大模型具备良好的跨编程语言理解能力,因此能够在多个编程语言中执行测试任务。Chunqiu S X等人充分利用了大模型对不同编程语言的理解。大多数传统方法只能模糊测试特定的编程语言,而基于大模型的模糊测试可以涵盖不同的语言。他们使用名为Fuzz-Loop的方法测试了 6 种编程语言(C、C++、Go、SMT2、Java和Python)的代码,该方法能自动变异测试用例。大多数传统模糊测试方法难以覆盖所有代码,而掌握了代码逻辑的大模型可以针对低覆盖率代码生成更具针对性的测试用例。例如,Caroline L等人在SBST(基于搜索的软件测试,一种传统的模糊测试方法)达到覆盖率瓶颈时,使用Codex生成针对低覆盖率函数的测试用例。具体来说,Codex生成的原始字符序列被反序列化为SBST的内部测试用例表示,以利用SBST的变异操作和适应性函数。

根据测试对象的不同,在使用大模型时策略可能需要适当调整。

对于一般API的测试,Cen Z等人分析方法进行了比较,发现大模型可以在较少的人工干预下自动生成大量有效的模糊测试驱动程序。该研究引入了查询策略、迭代改进和使用示例来提升大模型的表现。尽管这主要涉及API测试,但对于深度学习库的测试策略则需要进行调整。调用深度学习库的程序通常对张量维度有严格要求,否则模糊测试器会执行大量无意义的测试。

Yinlin D等人提出了TitanFuzz,一种用于深度学习库的测试用例生成工具。他们的训练语料库包含大量调用深度学习库API的代码片段,因此可以隐式学习语言的语法/语义和复杂的深度学习API约束,以有效生成深度学习程序。另一项研究FuzzGPT(同样由Yinlin D等人进行)也关注深度学习库的模糊测试,与前一项研究不同,FuzzGPT侧重于利用历史触发错误的代码片段来指导大模型生成测试用例。

除了上述研究外,我们还收集了一些针对其他测试对象的文献。针对协议的测试,Ruijie M等人讨论了如何在缺少机器可读的协议规范情况下查找协议实现中的安全漏洞。他们通过大量人类可读的协议文档对大模型进行训练,并要求大模型对协议交互消息进行变异,以实现协议模糊测试(如HTTP)。针对BusyBox的测试,Asmita等人专门针对在基于Linux的设备上广泛使用的BusyBox,提出了两种方法:利用大模型生成目标特定的初始种子以进行模糊测试,这显著提高了识别崩溃和潜在漏洞的效率;以及“崩溃重用”,利用之前获得的崩溃数据来优化新目标的测试流程。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大模型六小龙告别青春期

    ​不到一个月的时间,大模型六小龙中的五家都集中进行了新一轮的战略表态。 月之暗面今天发布了新模型Kimi2.5,其创始人杨植麟在2025年12月31日发布了一封全员信,公开公司完成新一轮5亿美元融资,并表示会让Kimi成为一个「与众不同」和「不被定义」的大语言模型。1月26日,阶跃星辰公布了超50亿B+轮融资,并宣布前旷视科技创始人印奇出任公司董事长,明确押注AI与智能�

  • 字节跳动旗下火山引擎发布视频生成大模型Seedance2.0

    字节跳动旗下火山引擎近日发布的视频生成大模型Seedance2.0,凭借“导演级”创作能力引发全球AI圈震动。这款在1.5Pro版本基础上迭代升级的模型,不仅攻克了人物一致性、视听同步等长期困扰行业的难题,更通过自动生成专业镜头切换功能,被业内人士评价为“可能抢走专业导演饭碗”的突破性产品。

  • AI日报:可灵3.0发布;阿里大模型品牌正式更名为千问;Mistral AI 发布 Voxtral Transcribe 2 语音模型

    本期AI日报聚焦多领域进展:可灵AI 3.0发布,开启15秒视频AI导演时代;阿里AI品牌统一为“千问”,战略升级;Mistral AI推出低延迟语音转文字模型;上海AI实验室发布全球最大开源科学多模态模型“书生Intern-S1-Pro”;谷歌Gemini月活用户突破7.5亿,并推出低价订阅方案;华为Mate 80系列新增AI消除屏幕摩尔纹功能;米兰冬奥会将启用阿里“千问”大模型;我国生成式AI用户规模破6亿,普及率超四成,算力水平全球领先。

  • 如何平衡SSD测试质量与效率,深度解密忆联自研M.2 SLT系统

    忆联推出面向PCIe 5.0的自研M.2 SLT测试系统,实现全链路自主化。该系统深度融合自动化与智能化,覆盖从用例生成到故障诊断的全流程;构建全栈一体化平台,显著降低跨团队协作成本;具备自主系统级测试能力,支持大规模场景仿真与高可靠验证。硬件上采用高性能服务器主板、自研多通道交换板卡及M.2测试夹具,单台设备支持200+端口并行运行。软件深度集成自研智能制造平台,实现统一调度与智能分析。系统全面支持PCIe 5.0协议及PLP断电保护等关键特性验证,采用模块化架构并为PCIe 6.0预留空间。通过深度自动化,测试覆盖率提升至90%以上,平均执行时间缩短10%,早期缺陷检出率提升超20%,构建了安全可靠、自主可控的端到端闭环体系。

  • AI日报:宇树开源UnifoLM-VLA-0大模型;腾讯“元宝派”内测截图泄露;Clawd更名为OpenClaw

    本期AI日报聚焦具身智能与AI应用新动态。蚂蚁集团发布LingBot-VLA模型,实现双手机器人通用操控;宇树开源UnifoLM-VLA-0模型,为机器人注入物理常识。开源AI助手OpenClaw更名后受关注,强调隐私安全。商汤开源SenseNova-MARS模型,在多个榜单超越GPT-5.2。腾讯“元宝派”社交功能内测截图泄露,整合微信与QQ好友,支持同步观影听歌。马斯克计划明年推出高度个性化AI生成游戏与影音内容。Anthropic因涉嫌大规模盗版遭音乐出版商起诉,索赔30亿美元。字节与阿里在春节前后发布新一代大模型,争夺云端主导权。

  • 游戏科学CEO冯骥测试Seedance2.0:庆幸这项技术来自中国

    《黑神话:悟空》制作人、游戏科学CEO冯骥发表长文,高度评价Seedance2.0模型,认为其在多模态信息理解与整合上实现飞跃,呼吁有条件者亲自体验。他指出,此类技术将颠覆传统影视行业逻辑,使视频制作成本趋近算力边际成本,引发内容领域前所未有的变革,彻底重构传统组织与流程。同时,冯骥也警示公众注意潜在风险,未来缺乏官方背书的视频内容,尤其是包含个人形象与声音的,都可能是伪造的,务必多渠道交叉确认信息真实性,以防受骗。针对假视频泛滥可能引发的信任危机,他表达了庆幸之情:“我很庆幸,至少今天的Seedance2.0,来自中国。”

  • 风行在线携手阿里云通义大模型,AI漫剧创作平台“橙星梦工厂”,引领数字内容生产新范式!

    2026年1月15日,阿里云主办的AI创新应用火花大会在上海召开,聚焦大模型技术赋能产业创新。风行在线技术有限公司AI平台总经理刘敬发表主题演讲,系统性展示与阿里云通义大模型深度合作的一站式AI内容创作平台“橙星梦工厂”。该平台通过八大智能体协同、端到端闭环生产及多模态大模型融合,实现从剧本生成到分发的全链路智能化,单集漫画创作成本降低90%,影视级内容生产周期从数周压缩至分钟级。平台内置万部独家版权小说剧本,并推出四大扶持计划激励创作者,助力在200亿规模的漫画赛道中占据领先地位。未来,平台将推出“AI导演实验室”,开放用户自定义智能体训练功能,并探索VR/AR跨模态内容生成,旨在让技术隐形、创意显性,使每个人都能用AI创作属于自己的“奥斯卡短片”。

  • 花3000元让AI改口,大模型的尽头是广告?

    大模型界的翘楚OpenAI,面对每年数十亿美元的研发成本,正迎来一个艰难的决定:其员工正在琢磨如何让 ChatGPT 在用户提出相关问题时,优先显示赞助内容。 也就是说,当用户让大模型推荐一家眼镜店、一款工业传感器、一家民宿时,很可能大模型给出的是企业的软广。但大模型本身可能并不知道答案被“精心设计”过,它依然兢兢业业,会根据各个指标筛选出你想要的产品�

  • 一键关闭浏览器所有AI功能!Firefox测试版本已上线

    Mozilla在前几天宣布将为Firefox浏览器用户带来AI控制中心功能,允许用户一键关闭浏览器中所有的AI相关功能,如今这一功能已在Firefox 148 Beta 11版本上线。 与某些强制集成或完全排斥AI的浏览器不同,Firefox采取了一种更为平衡且尊重用户隐私的方案,既提供翻译、标签页智能分组、链接要点提炼、侧边栏聊天机器人等AI体验,又赋予用户完全的控制权。 在最新的测试版中,用�

  • AI日报:支付宝首次上线AI眼镜扫福;昆仑万维发布天工Skywork桌面版;OpenClaw被曝严重漏洞

    本期AI日报聚焦多领域动态:支付宝上线AI眼镜扫福功能,提升集福体验;昆仑万维发布本地化AI桌面应用“天工Skywork桌面版”,强化隐私与文件处理;Anthropic计划回购超3500亿美元员工股权,展现发展信心;蚂蚁阿福升级“长辈模式”,优化老年用户体验;OpenAI旗舰模型GPT-5.2系列推理速度提升40%,价格不变;苹果联手OpenAI推出Xcode智能体,支持GPT-5级别模型编程;爆火AI智能体OpenClaw被曝严重漏洞,macOS用户面临风险;微信因腾讯元宝“诱导分享”营销活动进行处罚治理。

今日大家都在搜的词: