山石网科谈突破模糊测试极限：大模型驱动的软件漏洞深度挖掘

2025-03-20 16:12 · 稿源：站长之家用户

软件漏洞的发现向来是一场与时间的赛跑，而大模型的引入为模糊测试注入了全新的智慧动力。跳脱传统随机变异的局限，大模型准确的语言和逻辑推理能力正重新定义模糊测试的效率与深度，助力安全团队快速定位潜在威胁，为软件安全提供更强的护盾。

传统的模糊测试技术在揭示软件漏洞方面虽有效，但其固有的局限性可能会影响测试的效率和效果。一个显著缺点是传统模糊测试器主要以随机或半随机的方式运行，这导致测试过程可能耗时且效果不佳，因为它们无法探索所有可能的执行路径。此外，用于变异的种子通常由人类手工构造，耗时较长。尽管多年来已对此类问题进行了研究，并提出了许多缓解方法，但大模型的出现为模糊测试领域带来了全新的思维方式。

大模型模糊测试相较于传统方法的优势有哪些？

Ying Z等人评估了ChatGPT在直接生成测试用例（无微调）方面的表现，并将其与两种传统测试工具（SIEGE和TRANSFER）进行了比较。他们的实验表明，当提供了漏洞的详细描述、可能的攻击方式以及代码上下文时，大模型的表现优于传统方法。以下是大模型相较传统工具的优势描述。一个重要因素在于大模型的出现使得模糊测试从随机变异转向引导式变异。Jie H等人向传统灰盒模糊测试添加了一个基于GPT的种子变异器，从种子池中选择种子并请求ChatGPT生成的变体以生成更高质量的输入。

另一个优势是大模型具备良好的跨编程语言理解能力，因此能够在多个编程语言中执行测试任务。Chunqiu S X等人充分利用了大模型对不同编程语言的理解。大多数传统方法只能模糊测试特定的编程语言，而基于大模型的模糊测试可以涵盖不同的语言。他们使用名为Fuzz-Loop的方法测试了 6 种编程语言（C、C++、Go、SMT2、Java和Python）的代码，该方法能自动变异测试用例。大多数传统模糊测试方法难以覆盖所有代码，而掌握了代码逻辑的大模型可以针对低覆盖率代码生成更具针对性的测试用例。例如，Caroline L等人在SBST（基于搜索的软件测试，一种传统的模糊测试方法）达到覆盖率瓶颈时，使用Codex生成针对低覆盖率函数的测试用例。具体来说，Codex生成的原始字符序列被反序列化为SBST的内部测试用例表示，以利用SBST的变异操作和适应性函数。

根据测试对象的不同，在使用大模型时策略可能需要适当调整。

对于一般API的测试，Cen Z等人分析方法进行了比较，发现大模型可以在较少的人工干预下自动生成大量有效的模糊测试驱动程序。该研究引入了查询策略、迭代改进和使用示例来提升大模型的表现。尽管这主要涉及API测试，但对于深度学习库的测试策略则需要进行调整。调用深度学习库的程序通常对张量维度有严格要求，否则模糊测试器会执行大量无意义的测试。

Yinlin D等人提出了TitanFuzz，一种用于深度学习库的测试用例生成工具。他们的训练语料库包含大量调用深度学习库API的代码片段，因此可以隐式学习语言的语法/语义和复杂的深度学习API约束，以有效生成深度学习程序。另一项研究FuzzGPT（同样由Yinlin D等人进行）也关注深度学习库的模糊测试，与前一项研究不同，FuzzGPT侧重于利用历史触发错误的代码片段来指导大模型生成测试用例。

除了上述研究外，我们还收集了一些针对其他测试对象的文献。针对协议的测试，Ruijie M等人讨论了如何在缺少机器可读的协议规范情况下查找协议实现中的安全漏洞。他们通过大量人类可读的协议文档对大模型进行训练，并要求大模型对协议交互消息进行变异，以实现协议模糊测试（如HTTP）。针对BusyBox的测试，Asmita等人专门针对在基于Linux的设备上广泛使用的BusyBox，提出了两种方法：利用大模型生成目标特定的初始种子以进行模糊测试，这显著提高了识别崩溃和潜在漏洞的效率；以及“崩溃重用”，利用之前获得的崩溃数据来优化新目标的测试流程。

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐

关键词：

ChatGPT安全漏洞被曝光：无需点击即可盗用户数据！

据媒体报道，近日，OpenAI旗下连接器（Connectors）被曝存在安全漏洞。据悉，用户无需点击，攻击者就能从ChatGPT连接的第三方应用窃取敏感数据，甚至窃取API密钥。

OpenAI安全漏洞 ChatGPT数据泄露零点击攻击
昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

中国科学技术大学张燕咏团队在昇腾算力支持下，成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略，有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题，显著提升推理性能。实验显示，该方案在多项指标上较主流方案提升超30%，为昇腾技术优化MoE模型推理提供了宝贵借鉴，将加速其在各领域的落地应用。

人工智能大模型 MoE稀疏大模型
如何精准计算AI大模型调用成本？复杂参数太多，预算总超支怎么办？

文章探讨了AI模型调用成本管理的痛点，包括GPT-4等模型复杂的计费规则（如Token分级、上下文溢价、多模态叠加收费）导致实际成本常超预算40%。提出AIbase计算器三步解决方案：自动匹配场景参数、实时联动报价、明细成本拆解。通过跨境电商客服和高校实验室案例验证工具有效性，强调数据溯源、用量预警和预算缓冲功能，帮助开发者实现精准成本控制，告别手动制表与定�

AI模型成本 GPT-4定价 Claude3降价
寒武纪智能芯片赋能多模态大模型应用

大模型快速发展推动人工智能技术迈向新阶段，从解决特定任务的弱人工智能向处理通用复杂任务的强人工智能演进。IDC报告显示，2024年中国大模型开发平台市场规模达16.9亿元，人工智能算力市场约190亿美元，预计2025年将达259亿美元。寒武纪等企业专注AI芯片研发，推出多款处理器及加速卡产品，支持大模型训练推理及多模态任务，并与产业链合作共同推进人工智能产业发展。

大模型人工智能强人工智能
将AI大模型费用计算器作为战略工具：企业如何规避AI项目的成本陷阱

AI项目规模化应用面临不可预测的运营成本挑战，尤其是大模型API调用费用难以精准预测，导致项目ROI计算失效。成本失控源于计费维度复杂、价格变动频繁及用户行为影响。领先企业通过成本管控前移，在项目可行性分析阶段引入AIbase等成本计算工具，实现成本可视化，支持技术选型和预算建模，从被动应对转向主动管理，提升AI应用的经济性和可持续竞争力。

数字化转型人工智能运营成本
索尼电视如何投屏？下载什么软件？首选当贝投屏，新老电视全面覆盖

文章介绍了索尼电视无线投屏的实用方法，推荐使用第三方投屏软件如当贝投屏，支持多设备连接、无广告、免费使用。详细说明了新老电视的安装步骤，包括通过应用市场或U盘安装，以及如何实现手机、平板、电脑与电视的多屏互动。适合对广告敏感的用户，提升大屏使用体验。

索尼电视投屏无线投屏软件第三方投屏
销售易“安全检测”能力上新：一招堵住安全漏洞，筑牢CRM安全底线

某国际企业因云数据库未设置密码或安全认证，导致7.69亿条包含API密钥、银行账号等敏感信息的记录泄露，造成重大损失。这一事件促使企业更重视数字化系统的安全建设，尤其是CRM系统的数据安全能力。企业面临三大安全管理挑战：系统部署前缺乏安全检查、运行中管理松散、审计机制不完善。销售易推出的安全检测能力，可帮助企业构建三道防线：部署前安全检查预防漏洞、运行中定期体检消除风险、事后完整审计溯源。通过可视化、系统化的安全管理，护航企业数字化办公安全。

数据安全 CRM系统安全检测
荐AI日报：即梦上线智能多帧功能；可灵2.1首尾帧升级；钉钉推语音识别大模型Fun-ASR

AI日报栏目汇总近期AI领域重要进展：腾讯元宝接入DeepSeek V3.1提升智能助手能力；即梦AI推出多帧功能简化视频制作；可灵AI首尾帧功能升级效果提升235%；钉钉与通义实验室联合发布Fun-ASR语音识别大模型；腾讯CodeBuddy IDE国内版公测；Vercel发布AI Gateway简化模型调用；Anthropic整合Claude Code强化企业开发；阿里发布Mobile-Agent-v3突破GUI自动化；Qoder平台革新编程模式；清华团队GUAVA框架实现0.1秒3D化身生成；谷歌搜索新增AI Agent功能；VAST推出Tripo 3.0推动3D内容创作。

AI 腾讯元宝 DeepSeek
AI应用太烧钱？我们用一款精准的AI大模型费用计算器做出了清晰预算

初创团队“智询未来”在开发AI问答应用时面临核心模型选择困境：GPT-4-turbo能力强但价高，Claude-3长文本处理优，Llama-3成本低但性能稍弱。通过AIbase成本计算器精准测算，发现Claude-3-Sonnet性价比最优，每月可省近4000元，还能通过优化提示词进一步降本15%。数据驱动的决策让团队将节省预算投入数据安全和提示词优化，凸显成本测算对初创企业技术选型的重要性。
如何用3分钟精准计算AI大模型成本？避免生成一篇万字文章就超支？

AI大模型成本控制指南：实测三步预算法+企业级避坑方案。文章揭露行业痛点：1）价格迷雾：各厂商计费规则差异大，长文本/多模态存在隐藏溢价；2）团队实测GPT-4生成20篇行业分析（50万字）实际账单超预算4倍。解决方案：通过AIbase计算器实现精准预测：①场景化选择自动加载计费规则；②输入需求实时生成动态成本矩阵；③智能规避四大隐性成本（长文本衰减补偿/区域差价预警等）。跨境电商案例显示，使用工具后成本降低60%。核心观点：在AI时代，成本控制能力已成为企业核心竞争力。

AI预算计算模型成本控制 GPT-4计费

今日大家都在搜的词：

热文

3 天
7天

山石网科谈突破模糊测试极限：大模型驱动的软件漏洞深度挖掘

ChatGPT安全漏洞被曝光：无需点击即可盗用户数据！

昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

如何精准计算AI大模型调用成本？复杂参数太多，预算总超支怎么办？

寒武纪智能芯片赋能多模态大模型应用

将AI大模型费用计算器作为战略工具：企业如何规避AI项目的成本陷阱

索尼电视如何投屏？下载什么软件？首选当贝投屏，新老电视全面覆盖

销售易“安全检测”能力上新：一招堵住安全漏洞，筑牢CRM安全底线

荐AI日报：即梦上线智能多帧功能；可灵2.1首尾帧升级；钉钉推语音识别大模型Fun-ASR

AI应用太烧钱？我们用一款精准的AI大模型费用计算器做出了清晰预算

如何用3分钟精准计算AI大模型成本？避免生成一篇万字文章就超支？

今日大家都在搜的词：

热文

罗永浩泡面1小时销售额超280万 2小时售罄：一桶近10元

AI日报：即梦上线智能多帧功能；可灵2.1首尾帧升级；钉钉推语音

李国庆婚礼收到11万余元善款受助学生寄来祝福

REDMI Note 15标准版发布：售价999元起

魅族22延期上热搜：将于9月中上旬发布

小米MIX Flip 2钻石限定版发布：售价6999元

荣耀Magic V Flip2发布：售价5499元起

华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

60岁李国庆谈再婚：妻子是“白月光” 年轻时2次爱而不得

罗永浩官宣明日将公布TBT项目号称九年磨一面

《黑神话:钟馗》先导预告公布游戏科学宣布《黑神话:钟馗》官网

AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；

REDMI Note 15 Pro+首搭自研澎湃T1S芯片

AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测

黑神话官号更名系列游戏将开启宏大篇章

罗永浩泡面1小时销售额超280万 2小时售罄：一桶近10元

AI日报：智谱AI发布AutoGLM 2.0；腾讯元宝接入腾讯视频；字节发

站长商机