首页 > 业界 > 关键词  > DeepSeek最新资讯  > 正文

老显卡也能用!美团开源首发INT8无损满血版DeepSeek R1

2025-03-07 21:00 · 稿源: 快科技

快科技3月7日消息,日前美团技术团队宣布对DeepSeek R1进行了INT8精度量化,让DeepSeek R1可以在如A100等老型号GPU上进行部署。

据介绍,DeepSeek R1发布以后不少企业和个人都在尝试部署满血版本,但原生版本的模型权重为FP8数据格式,对GPU芯片类型有严格限制,仅能被英伟达新型GPU支持(如Ada、Hopper架构芯片),其他型号GPU(如A100)无法直接部署。

虽然可以将FP8权重反量化为BF16权重后,在A100等GPU上进行推理,但是这对显存的要求提升了一倍,推理吞吐也会下降。

为此美团搜索和推荐平台部对DeepSeek R1模型进行了INT8精度量化尝试,发现使用INT8量化后模型精度基本无损。

基于INT8量化,DeepSeek R1模型解锁了芯片限制,可以部署到A100等其他型号GPU;并且相比BF16实现了50%的吞吐提升,进一步降低了推理成本。

目前量化代码已经发布在了开源LLM推理框架SGLang上,量化模型已经发布到了Hugging Face社区:

https://huggingface.co/meituan/DeepSeek-R1-Block-INT8

https://huggingface.co/meituan/DeepSeek-R1-Channel-INT8

对具体过程感兴趣的,可以查看官方技术报告。

举报

  • 相关推荐
  • DeepSeek满血版上线:让“服务器繁忙”成为过去式!

    DeepSeek在各大平台的话题热度持续高涨。但随着DeepSeek的热度不断攀升,官方服务器承载压力增大,导致许多用户在访问时收到“服务器繁忙,请稍后再试”的提示。具体接入教程可联系客服获取,也可提供技术指导。

  • 速度2.6倍提升,TencentOS 支持满血版DeepSeek

    TencentOSServerAI全面支持满血版DeepSeekR1,在双机16卡的硬件环境上,分别在短输入场景以及长输入场景均获得超过2.6倍的推理性能提升!本性能评估采用2台8卡服务器,显存总量共1536GB,部署TencentOSServerAI版,2台服务器采用RDMA高速网络互联,测试样本采用通用的数据集。分别测试输入200tokens/输出500tokens以及输入6144tokens/输出1024tokens下的吞吐能力,测试结果如下:TencentOSServerAI是腾讯云发布的一款针对AI场景的操作系统,提供了从基础架构到AI框架以及模型的全栈式AI环境,一方面简化部署,另一方面通过高性能的AI框架,实现大模型如DeepSeek推理效率成倍的增加。

  • 鸿蒙百度地图大升级:融合DeepSeek-R1满血版

    日前,百度地图宣布,鸿蒙版百度地图新升级,融合DeepSeek-R1满血版。华为原生鸿蒙手机用户可将鸿蒙版百度地图升级至1.4.5版,检索即可体验,比如问问DeepSeek小众景区玩法、游玩推荐,帮你设置个性化定制路线等。2025年鸿蒙生态要压强投入,10万个应用是生态成熟标志,这是未来半年到一年时间的关键目标。

  • 容联云质检代理DeepSeek满血版,攻克金融复杂场景质检难题

    在金融强监管时代,一通违规通话可能引发千万级处罚,一次客户投诉或将导致业务线停摆。传统质检依赖人工抽检或简单规则引擎,面临三大致命短板:漏检率高:抽检覆盖率不足20%,海量风险藏匿于未检数据。容联云质检代理,以AI重塑质检逻辑——让100%合规成为底线,让风险洞察反哺业务增长。

  • 荣耀文档正式接入DeepSeek满血版 新功能支持机型公布

    荣耀公司宣布了一项重要进展,其旗下的荣耀文档现已正式接入DeepSeek模型满血版,标志着荣耀在智能文档处理领域迈出了坚实的一步。此次接入后,荣耀文档将在搜索问答、文本创作等多个方面与DeepSeek实现深度结合,为用户带来更加智能、便捷的一站式文档AI创作体验。这一系列的升级和优化,无疑将进一步提升用户的生活品质、工作效率以及学习效率,让荣耀设备成为用户日常生活中不可或缺的智能助手。

  • 全品牌覆盖!比亚迪“AI 智能语音”正式接入DeepSeek满血版

    比亚迪汽车宣布旗下全品牌AI智能语音”正式接入DeepSeek满血版。比亚迪智驾负责人杨冬生在2月10日透露,比亚迪的整车智能璇玑架构”将接入DeepSeek-R1大模型。此次接入DeepSeek满血版后,比亚迪的AI智能语音系统将显著提升车端和云端的AI能力。

  • 实测腾讯元宝电脑:搭载满血版DeepSeek,装上就是AI PC

    听说了嘛?朋友,元宝电脑版新鲜出炉了!且啊,从logo上来看,就是主打一个“满血版”。从内嵌的模型来看,元宝电脑版在配置了自家的混元大模型之外有就是大火的DeepSeek。且有一说一,相信不少朋友们近期在各大腾讯系App上,开机就能刷到元宝的广告,借着DeepSeek之势,元宝今年是颇有一种“毕其功于一役”的感觉了。

  • 阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1

    阿里Qwen团队正式发布他们最新的研究成果QwQ-32B大语言模型。这是一款拥有320亿参数的模型,其性能可与具备6710亿参数的DeepSeek-R1媲美。QwQ-32B已在HuggingFace和ModelScope开源,大家也可通过QwenChat直接进行体验!

  • DeepSeek第三弹:开源DeepGEMM!

    今天上午9点,DeepSeek继续履行开源周承诺,发布了开源DeepGEMM。该帖子一经转发,立即引来了2.1万阅读量,足以见其在国内外受到追捧的热度。本次开源属于DeepSeek开源周”的第三项项目,此前已发布FlashMLA和DeepEP。

  • 突发!DeepSeek开源V3,再次震惊国外

    国内著名大模型平台DeepSeek开源了V3模型的最新版本0324。不过DeepSeek相当低调,国内的公众号、国外的社交平台没有做任何宣传,就是“悄悄”地把模型上传到huggingface。根据国外开源评测平台kcores-llm-arena对V3-0324最新测试数据显示,其代码能力达到了328.3分,超过了普通版的Claude3.7Sonnet,可以比肩334.8分的思维链版本。