老显卡也能用！美团开源首发INT8无损满血版DeepSeek R1

2025-03-07 21:00 · 稿源：快科技

快科技3月7日消息，日前美团技术团队宣布对DeepSeek R1进行了INT8精度量化，让DeepSeek R1可以在如A100等老型号GPU上进行部署。

据介绍，DeepSeek R1发布以后不少企业和个人都在尝试部署满血版本，但原生版本的模型权重为FP8数据格式，对GPU芯片类型有严格限制，仅能被英伟达新型GPU支持（如Ada、Hopper架构芯片），其他型号GPU（如A100）无法直接部署。

虽然可以将FP8权重反量化为BF16权重后，在A100等GPU上进行推理，但是这对显存的要求提升了一倍，推理吞吐也会下降。

为此美团搜索和推荐平台部对DeepSeek R1模型进行了INT8精度量化尝试，发现使用INT8量化后模型精度基本无损。

基于INT8量化，DeepSeek R1模型解锁了芯片限制，可以部署到A100等其他型号GPU；并且相比BF16实现了50%的吞吐提升，进一步降低了推理成本。

目前量化代码已经发布在了开源LLM推理框架SGLang上，量化模型已经发布到了Hugging Face社区：

https://huggingface.co/meituan/DeepSeek-R1-Block-INT8

https://huggingface.co/meituan/DeepSeek-R1-Channel-INT8

对具体过程感兴趣的，可以查看官方技术报告。

（举报）

相关推荐

关键词：

品牌在deepseek、豆包里排第几?免费GEO排名查询工具帮你一键看清

随着AI搜索普及，传统SEO正被GEO（生成式引擎优化）取代。GEO核心是提升品牌在AI生成答案中的可见度，而非获取点击流量。数据显示超60%用户已使用AI搜索，若品牌未被AI提及将失去流量入口。文章推荐免费工具AIBase，支持多平台一键检测品牌在主流AI助手的曝光排名、竞品对比及可视化报告，并提供内容权威性、语义化表达等GEO优化策略，帮助品牌在AI时代建立竞争优势。
百度智能云这项开源，让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

10月28日，百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测（MTP）技术代码。该技术通过批量生成和集中验证机制，使模型解码吞吐量提升超2倍，突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配，并经过百度内部业务验证，开发者可"开箱即用"获得稳定可靠的推理加速能力。

百度智能云 DeepSeek-V3.2 MTP技术
全新开源的DeepSeek-OCR，可能是最近最惊喜的模型。

AI圈虽然天天卷，但是很多的模型，真的越来越无聊了。每天就是跑分又多了几个点。直到昨天，DeepSeek久违的发了一个新模型。 DeepSeek-OCR。这玩意，是真的有点酷。

DeepSeek-OCR AI模型 OCR技术
DeepSeek开源3B OCR模型：长文本识别达97%精度

DeepSeek在GitHub开源新一代OCR模型，采用创新光学二维映射压缩技术，在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌，较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率，显著优于同类模型。该技术路径为OCR系统小型化提供解决方案，其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

DeepSeek-OCR 光学二维映射压缩长文本识别
真我GT8 Pro搭载自研电竞独显芯片R1 将于10月21日发布

真我GT8系列将于10月21日发布，包括GT8和GT8 Pro两款机型。GT8 Pro搭载自研电竞独显芯片R1，支持多款游戏2K分辨率与144帧超分超帧并发，显著提升画面流畅度和清晰度，尤其针对二次元重载手游优化。硬件方面配备第五代骁龙8芯片、7000mAh电池与120W快充，并搭载行业首款通过理光GR认证的主摄，具备防眩光等专业相机标准。该机还支持视频动态插帧等功能，全面提升游戏与影音体验。

真我GT8系列自研电竞独显芯片R1 超分超帧功能
中国AI算力突围：东方超算Deep X算力盒子超国际竞品82%，重新定义行业标准

中国公司东方超算发布Deep X G20系列AI工作站，在MLPerf测试中性能超越NVIDIA DGX Spark达82%，价格持平，实现性能与性价比"双超越"。产品搭载Intel Ultra 9285处理器和NVIDIA RTX PRO 5000显卡，AI算力达1824 TOPS，体积仅2.7L。通过三大技术创新实现突破：智能异构计算引擎提升资源利用率40%；统一推理运行时支持多框架；深度硬件优化提升关键算子性能50-200%。该产品打破国际巨头垄断，已在量化金融、医疗影像等领域实现显著投资回报，标志着中国AI硬件实现重要突破。
什么电视适合玩PS5？海信100寸E7Q/E8Q满级游戏电视首选

今年双11是入手游戏电视的好时机，海信100E7Q/E8Q系列凭借原生4K 170Hz高刷、信芯AI画质芯片、黑曜屏Pro等配置，为PS5玩家提供丝滑流畅、画质细腻的沉浸体验。支持多主机秒识别、实时分屏攻略等功能，配合《黑神话：悟空》专属模式，从操控到音画全面优化，堪称满级游戏电视之选。

双11 PS5游戏大屏电视
iPhone 18 Pro迎双重升级：主摄和长焦脱胎换骨

iPhone 18 Pro系列影像将迎来双重升级。首先是主摄，爆料称iPhone 18 Pro系列主摄支持可变光圈，这将是苹果史上第一款支持可变光圈的机型。据悉，可变光圈技术是通过物理调节镜头光圈大小来控制相机传感器的进光量。在暗光环境下，光圈开大能接收更多光线；在明亮场景中，光圈缩小防止过度曝光。这项技术的核心优势在于让用户能够像使用专业相机一样，自主选择光圈�

iPhone 18 Pro
海尔麦浪舒适风Pro天猫首发！当日登顶行业热销榜TOP1

海尔麦浪舒适风Pro空调新品上市即热销，半小时销量破5000套，登顶行业榜首。其核心亮点在于智慧送风技术：首次采用UWB人感雷达，能精准感知8米内人体呼吸，自动调节风感；支持1-4米定制风距，人近风柔、人离节能；多维送风技术适配多种安装位置，避免直吹不适。产品还具备AI离线语音控制、24小时制热不停机及70℃高温制冷等实用功能，显示空调市场正从基础冷暖需求转向更智能、贴心的空气体验。

空调海尔麦浪舒适风Pro 智慧送风
微星MPG 242R X60N显示器开启610Hz超频时代，半价引爆FPS战场

微星推出专业电竞显示器MPG242R+X60N，以610Hz超高刷新率与0.1ms响应速度重新定义行业标准。搭载快速液晶TN面板，配合MPRT同步技术，有效消除画面拖影，在《CS:GO》等快节奏FPS游戏中实现流畅操作。支持HDR400广色域与98W Type-C反向供电，兼顾色彩表现与设备兼容性。双十一期间优惠价3999元，近乎半价折扣，为玩家提供入手高端电竞装备的绝佳时机。

电竞显示器 610Hz刷新率 0.1ms响应

今日大家都在搜的词：

热文

3 天
7天

老显卡也能用！美团开源首发INT8无损满血版DeepSeek R1

品牌在deepseek、豆包里排第几?免费GEO排名查询工具帮你一键看清

百度智能云这项开源，让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

全新开源的DeepSeek-OCR，可能是最近最惊喜的模型。

DeepSeek开源3B OCR模型：长文本识别达97%精度

真我GT8 Pro搭载自研电竞独显芯片R1 将于10月21日发布

中国AI算力突围：东方超算Deep X算力盒子超国际竞品82%，重新定义行业标准

什么电视适合玩PS5？海信100寸E7Q/E8Q满级游戏电视首选

iPhone 18 Pro迎双重升级：主摄和长焦脱胎换骨

海尔麦浪舒适风Pro天猫首发！当日登顶行业热销榜TOP1

微星MPG 242R X60N显示器开启610Hz超频时代，半价引爆FPS战场

今日大家都在搜的词：

热文

一加15今晚发布定位全能水桶机

AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度

红米REDMI K90全方位提升雷军：是不是越来越有旗舰气质

余承东曝鸿蒙智行新款享界S9将于11月上市

iPhone18发布或推迟苹果明年9月只发Pro系列和Fold折叠屏

华为MatePad Pro流金典藏版开卖：售价7799元

华为余承东：鸿蒙智行全系交付突破100万台仅用43个月

AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI

华为MatePad Mini典藏版今日开售：售价5999元起

一加Ace 6开启预售：售价2599元起

华为nova Flip S小折叠开售：首发3388元起

雷军回应K90定价：最近内存涨价太多希望大家理解这份诚意

苹果首款2nm手机芯片上热搜 A20由iPhone 18系列首发

REDMI K90标准版12+512GB降价300元小米回应：可退差价

一加15今晚发布定位全能水桶机

AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度

红米REDMI K90全方位提升雷军：是不是越来越有旗舰气质

小米汽车发布跨年购置税补贴方案至高不超15000元

余承东曝鸿蒙智行新款享界S9将于11月上市

iPhone18发布或推迟苹果明年9月只发Pro系列和Fold折叠屏

站长商机