DeepSparse：利用稀疏性加速神经网络推理

2023-10-26 11:46 · 稿源：站长之家

站长之家（ChinaZ.com）10月26日消息:DeepSparse是一种突破性的CPU推理运行时，采用了复杂的稀疏性技术，从而实现了神经网络推理的加速。稀疏性是指神经网络中存在许多连接权重为零的情况。

DeepSparse充分利用了这些零权重的连接，以跳过不必要的计算，从而有效地提高了推理速度。作为一个开源项目，DeepSparse的代码库可以在GitHub上找到。

项目地址:https://github.com/neuralmagic/deepsparse

目前，DeepSparse已经成功集成到了TensorFlow中，并成为了TensorFlow不可或缺的一个组件。

最新的DeepSparse LLM支持以稀疏内核进行加速，实现从非结构化稀疏权重中的速度提升和内存节省，同时支持8位权重和激活量化以及高效使用缓存的注意力键和值，从而减少内存移动。不仅如此，DeepSparse还支持多种计算机视觉和自然语言处理模型，包括BERT、ViT、ResNet、YOLOv5/8等等。

核心功能:

稀疏性加速: DeepSparse使用稀疏性来加速神经网络推理，从而提高性能。

LLM支持: 支持性能卓越的LLM推理，包括稀疏内核、8位权重和激活量化，以及缓存注意力键和值的高效使用。

模型优化: 与SparseML合作，DeepSparse可以进行模型修剪和量化，以优化神经网络模型。

多种模型支持: 支持多种计算机视觉和自然语言处理模型，适用于各种任务。

多层次API: 提供引擎、管道和服务器等多层次的API，以满足不同应用场景的需求。

（举报）

相关推荐

关键词：

DeepSparse

前DeepSeek研究员罗福莉已加入小米：全力奔赴AGI

11月12日，“95后AI天才少女”罗福莉宣布加入小米MiMo大模型团队。她曾因“雷军千万年薪挖角”话题引发热议，拥有丰富AI研发经历，先后在幻方量化和DeepSeek参与大模型研发。罗福莉表示，将与团队致力于推动AI从语言迈向物理世界，全力构建通用人工智能。她的加入将为小米AI研究注入新活力。

AI天才少女小米大模型罗福莉
你的品牌在豆包、DeepSeek里搜不到?这份GEO品牌监控攻略，3步把曝光拉满

GEO指数是AI搜索时代的品牌可见度衡量指标，量化品牌被AI引用、推荐和对比的频率与深度。与传统SEO比拼搜索排名不同，GEO衡量的是品牌在AI回答中的提及率和好感度。数据显示，高GEO指数品牌在AI搜索中的转化率是传统SEO的3.4倍。文章通过案例说明，企业可通过监控竞品差距、补充缺失内容关键词、优化AI提示词等策略提升GEO指数。建议立即使用AIBase平台免费体验GEO监控，把握AI搜索新机遇。

GEO指数 AI搜索品牌能见度
DeepSeek崩了上热搜页面显示“服务器繁忙”

截至2025年11月3日，大量用户在微博话题#DeepSeek崩了#下集中反馈，DeepSeek平台出现服务异常状况，引发广泛关注。综合各方信息，此次故障呈现多方面表现，对用户使用造成显著影响。众多用户表示遭遇服务全面中断问题，在尝试使用平台

DeepSeek故障服务器异常服务中断
品牌在deepseek、豆包里排第几?免费GEO排名查询工具帮你一键看清

随着AI搜索普及，传统SEO正被GEO（生成式引擎优化）取代。GEO核心是提升品牌在AI生成答案中的可见度，而非获取点击流量。数据显示超60%用户已使用AI搜索，若品牌未被AI提及将失去流量入口。文章推荐免费工具AIBase，支持多平台一键检测品牌在主流AI助手的曝光排名、竞品对比及可视化报告，并提供内容权威性、语义化表达等GEO优化策略，帮助品牌在AI时代建立竞争优势。
百度智能云这项开源，让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

10月28日，百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测（MTP）技术代码。该技术通过批量生成和集中验证机制，使模型解码吞吐量提升超2倍，突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配，并经过百度内部业务验证，开发者可"开箱即用"获得稳定可靠的推理加速能力。

百度智能云 DeepSeek-V3.2 MTP技术
PayInOne携智能AI招聘产品Foundire亮相进博会，创新科技步履不停

第八届中国国际进口博览会于2025年11月5日至10日在上海成功举办。全球招聘与薪酬管理平台PayInOne在服务贸易展区亮相，重点展示其AI驱动的智能招聘平台Foundire，该平台通过人才画像匹配、自动化筛选及智能评估体系，显著提升跨境招聘效率与精准度。CEO林坦在专题演讲中强调AI技术正推动用工模式变革，助力企业实现全球化高效合规管理。展会期间，PayInOne联合多家生态伙伴举办多场活动，探讨企业出海机遇，并与政府、企业界嘉宾深入交流，巩固了其在全球人力资源服务领域的行业领导地位。

智能招聘薪酬支付跨境用工合规
颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

Utopai Studios推出专为影视制作设计的AI模型与工作流，区别于主流视频生成模型，其核心能力在于理解剧本、规划镜头及生成场景，通过自回归模型负责叙事规划与一致性约束，扩散模型专注高质量画面渲染。该系统能解决跨镜头元素漂移难题，提升制作效率与作品品质。目前工作流仅用于公司自有项目，强调AI作为创作者协作者的角色，并遵循行业道德与版权规范。

AI影视制作 Utopai Studios
苹果新版iOS 26/iPadOS 26上线一天就被紧急撤回：设备更新后出错

苹果在推送iOS 26.2和iPadOS 26.2首个开发者测试版一天后，便停止了对iPhone Air、iPhone 16e以及新款M5 iPad Pro蜂窝网络版的签名验证，这些设备暂时无法安装iOS 26.2/iPadOS 26.2 Beta版更新。据悉，已经安装了该更新的用户反馈，他的M5 iPad Pro更新后出现问题，被迫进入恢复模式，最终他将设备恢复至iPadOS 26.1版本。值得一提的是，上述受影响的

iOS 26.2 iPadOS
刘强东宣布：京东外卖独立app上线并推出京东点评

京东集团创始人刘强东在11月17日宣布，京东外卖独立App正式上线，将为用户提供更便捷的外卖服务。同时，推出“京东点评”功能，承诺永不商业化。自今年2月上线以来，京东外卖订单量快速增长，6月1日突破2500万单，入驻超150万家品质餐饮店。用户需在京东App首页“秒送”栏目下单，而“京东点评”位于秒送板块，分为美食、酒店、购物和玩乐四大板块，以图文形式分享本地生活内容。

京东外卖独立app 刘强东
千问APP悄悄上线，阿里的AI超级入口也终于来了。

阿里“千问”APP昨日在应用商店悄然上线，界面从通义APP的双色渐变变为简洁单色设计，功能大幅增强，支持Qwen全系列最新模型。此次品牌整合将阿里分散的AI触点统一为“千问”品牌，实现模型与产品名称对齐，让普通用户首次能在官方APP使用最强Qwen3-Max模型。APP默认开启联网搜索，集成图像编辑、视频通话等场景功能，通过智能意图识别实现一站式服务。这标志着阿里开始认真打技术+品牌两张牌，推动AI技术以更清晰方式触达用户。

阿里千问APP 品牌迭代

今日大家都在搜的词：

热文

3 天
7天

DeepSparse：利用稀疏性加速神经网络推理

前DeepSeek研究员罗福莉已加入小米：全力奔赴AGI

你的品牌在豆包、DeepSeek里搜不到?这份GEO品牌监控攻略，3步把曝光拉满

DeepSeek崩了上热搜页面显示“服务器繁忙”

品牌在deepseek、豆包里排第几?免费GEO排名查询工具帮你一键看清

百度智能云这项开源，让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

PayInOne携智能AI招聘产品Foundire亮相进博会，创新科技步履不停

颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

苹果新版iOS 26/iPadOS 26上线一天就被紧急撤回：设备更新后出错

刘强东宣布：京东外卖独立app上线并推出京东点评

千问APP悄悄上线，阿里的AI超级入口也终于来了。

今日大家都在搜的词：

热文

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

小米超级小爱AI大模型推出随心修图功能

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

荣耀500系列官宣将于11月24日发布

阿里巴巴回应千问崩了：状态良好欢迎来问

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

卢伟冰：小米手机双11连续三年国产销量第一

华为Mate 80系列已在华为商城开启预约

95岁巴菲特每周还上5天班此前计划年底退休

京东发布双11战报：订单总量增长近60% 下单用户同比增长40%

荣耀500系列官宣：超级标准版+超级Pro版

站长商机