DeepSparse：利用稀疏性加速神经网络推理

2023-10-26 11:46 · 稿源：站长之家

站长之家（ChinaZ.com）10月26日消息:DeepSparse是一种突破性的CPU推理运行时，采用了复杂的稀疏性技术，从而实现了神经网络推理的加速。稀疏性是指神经网络中存在许多连接权重为零的情况。

DeepSparse充分利用了这些零权重的连接，以跳过不必要的计算，从而有效地提高了推理速度。作为一个开源项目，DeepSparse的代码库可以在GitHub上找到。

项目地址:https://github.com/neuralmagic/deepsparse

目前，DeepSparse已经成功集成到了TensorFlow中，并成为了TensorFlow不可或缺的一个组件。

最新的DeepSparse LLM支持以稀疏内核进行加速，实现从非结构化稀疏权重中的速度提升和内存节省，同时支持8位权重和激活量化以及高效使用缓存的注意力键和值，从而减少内存移动。不仅如此，DeepSparse还支持多种计算机视觉和自然语言处理模型，包括BERT、ViT、ResNet、YOLOv5/8等等。

核心功能:

稀疏性加速: DeepSparse使用稀疏性来加速神经网络推理，从而提高性能。

LLM支持: 支持性能卓越的LLM推理，包括稀疏内核、8位权重和激活量化，以及缓存注意力键和值的高效使用。

模型优化: 与SparseML合作，DeepSparse可以进行模型修剪和量化，以优化神经网络模型。

多种模型支持: 支持多种计算机视觉和自然语言处理模型，适用于各种任务。

多层次API: 提供引擎、管道和服务器等多层次的API，以满足不同应用场景的需求。

（举报）

相关推荐

关键词：

DeepSparse

专业闪光迈入普及时代？唯卓仕 Spark Z3 重塑 TTL 闪光灯性价比标杆

国产光学品牌唯卓仕推出全新Spark Z3 TTL闪光灯，仅售268元。该产品最大亮点是将专业级TTL自动闪光功能下放至亲民价位，支持智能测光与功率调节，显著降低复杂光线下的曝光难度。机身采用哑光金属质感设计，重144克便于携带，支持Type-C快充和光引闪功能。这款产品填补了低价位专业闪光灯的市场空白，有望推动入门级闪光灯市场的普及化进程。

摄影用光 TTL自动闪光唯卓仕
解锁空间潜能，罗地格RESPACE，打造智慧城市的交通新枢纽

荷兰阿姆斯特丹运河区地下自动停车系统启用两周年，成为传统保护与现代创新融合的典范。该系统采用RESPACE混合托盘与机器人技术，在有限空间内最大化停车位，已服务超5.96万辆车。项目巧妙选址于历史悠久的运河下方，既保留文化遗产风貌，又提供便捷可持续的停车方案，实现现代功能需求与历史保护的完美平衡。

城市发展传统保护现代创新
免费使用！腾讯地图已接入DeepSeek-V3.1

DeepSeek V3.1于2025年8月21日发布并开源，腾讯地图率先完成接入。新版AI助手“AI叮当”在三大核心能力显著提升：思考效率更高，响应更快；上下文理解更强，支持多轮连贯对话；智能体调用更精准，尤其在中文网页理解和跨领域搜索方面表现突出。依托升级，AI叮当可提供个性化行程规划、周边推荐及景点知识问答等智能出行服务，让导航升级为全程智能生活陪伴。

DeepSeek V3.1 腾讯地图
SpaceX第10次试飞成功马斯克：星舰这次没有空中爆炸

新一代重型运载火箭“星舰”从得克萨斯州顺利发射升空，开启了其第十次试飞之旅。此次试飞任务备受瞩目，重点目标涵盖飞船部署模拟卫星、在太空中实施发动机重新点火测试等关键环节。据现场情况，发射约一个小时后，“星舰”的超重型助推器在墨西哥湾精准完成溅落。与此同时，二级飞船更是首次成功模拟释放星链卫星，并在印度洋预定海区顺利溅落，最后以解体

星舰试飞 SpaceX 重型运载火箭
2025年大模型选型核心指南：Beyond GPT-4，如何理性评估Qwen、DeepSeek等强者？

大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架，强调需超越单一指标崇拜，基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析，展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程，采用专业工具进行多维度评估，通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型，而非盲目追求流行模型。
Gemini 2.5 Flash-Lite与 DeepSeek-V3 深度对比：谁在性价比上更胜一筹？

面对琳琅满目的大模型API，开发团队常陷入选择困境。文章指出，2024年既是机遇也是挑战的时代，闭源模型选择丰富但性能与成本平衡复杂。通过AIbase等数据驱动平台进行客观对比至关重要。以Gemini 2.5 Flash-Lite和DeepSeek-V3为例，前者综合能力强适合多语言场景，后者在代码生成和成本控制上优势明显。建议开发者明确需求，通过实际测试验证模型表现，理性选择最适合的方案。

大模型API 模型选型 AI开发
Google Gemini vs Deepseek：谁更适合你的业务场景？AI大模型选型终极对比指南

企业在选择大模型时面临两难：国际大厂的Gemini技术先进，但国内DeepSeek性价比突出。AIbase平台通过真实场景测试数据指出：1）跨境电商客服场景中，Gemini多语言识别准确率提升12%，但需注意API延迟问题；2）金融研报分析场景下，DeepSeek支持128K长文本且成本仅为Gemini的1/3。决策关键：抛开参数迷雾，聚焦成本、响应速度、语言支持和场景匹配四大维度。AIbase提供可视化对比工具，3分钟生成专属选型报告，让技术决策不再玄学。

大模型选型 Gemini对比DeepSeek LLM评测
别再猜了！手把手教你用数据选择AI模型，我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

开发者分享模型选择心路历程：从盲目试错到数据驱动。曾因追求低价模型导致成本飙升，后通过AIbase平台对比Gemini 2.5 Flash-Lite和DeepSeek-V3，基于价格、上下文长度和代码能力等数据，最终选择更适合代码生成任务的DeepSeek-V3。强调没有“最好”的模型，只有“最适合”的模型，建议开发者善用专业工具进行数据驱动决策，避免隐性成本。
荐AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；快手 Klear-Reasoner 模型成功登顶

AI日报栏目聚焦人工智能领域最新动态。DeepSeek V3.1发布，大幅增强长文档分析和代码理解能力；企业微信5.0集成智能搜索、总结和机器人功能；快手Klear-Reasoner模型数学推理准确率超90%；谷歌Docs新增AI语音朗读功能；Firecrawl完成1450万美元融资并推出V2版本API；Meta上线AI语音翻译功能；微软Excel集成Copilot实现一键数据分析；Claude桌面客户端推动AI编程可视化；苹果Xcode将原生集成Cl

AI DeepSeek V3.1
荐智能体迎来“DeepSeek时刻”，为何主角是纳米AI？

大模型重塑了人工智能的产业格局，但却没有彻底颠覆人类的生产模式。在这背后，并非其技术力量不足，而是当前的应用形态仍停留在“工具赋能”的初级阶段，大模型的潜力被束缚在碎片化场景中，未能转化为重构生产逻辑的核心动能。正如360集团创始人、董事长周鸿祎所言，大模型的能力其实已经相当强大，甚至超越了我们中的许多人。只是其潜力尚未被挖掘。而�

大模型人工智能生产模式

今日大家都在搜的词：

热文

3 天
7天

DeepSparse：利用稀疏性加速神经网络推理

专业闪光迈入普及时代？唯卓仕 Spark Z3 重塑 TTL 闪光灯性价比标杆

解锁空间潜能，罗地格RESPACE，打造智慧城市的交通新枢纽

免费使用！腾讯地图已接入DeepSeek-V3.1

SpaceX第10次试飞成功马斯克：星舰这次没有空中爆炸

2025年大模型选型核心指南：Beyond GPT-4，如何理性评估Qwen、DeepSeek等强者？

Gemini 2.5 Flash-Lite与 DeepSeek-V3 深度对比：谁在性价比上更胜一筹？

Google Gemini vs Deepseek：谁更适合你的业务场景？AI大模型选型终极对比指南

别再猜了！手把手教你用数据选择AI模型，我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

荐AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；快手 Klear-Reasoner 模型成功登顶

荐智能体迎来“DeepSeek时刻”，为何主角是纳米AI？

今日大家都在搜的词：

热文

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

华为MatePad Mini外观公布支持蜂窝网络通话功能

特斯拉Model 3长续航后轮驱动版降价1万元售价25.95万起

小鹏汽车：8月共交付新车37709台单月交付量创历史新高

苹果上架翻新版Apple Pencil Pro售价849元

零跑汽车8月交付57066台增长超88%

苹果首款折叠iPhone或不会采用屏下指纹将于明年发布

小米汽车8月交付量超3万台全年交付量有望冲击42万

华为MatePad Mini官宣9月4日发布

2025民营企业500强揭晓：京东第一

SpaceX第10次试飞成功马斯克：星舰这次没有空中爆炸

小米澎湃OS3发布会官宣首批Beta版招募机型公布

今日七夕节微信 520 元大额红包限时上线

AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”

AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯

realme真我15000mAh电池容量手机亮相

华为三折叠屏手机Mate XTs非凡大师上架开启预约

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

站长商机