首页 > 业界 > 关键词  > DeepSeek最新资讯  > 正文

AMD锐龙AI处理器轻松本地跑DeepSeek:支持70B参数

2025-02-12 19:24 · 稿源: 快科技

本地部署 DeepSeek,AMD 锐龙 AI 助力

DeepSeek 近期大受欢迎,但由于服务器负载限制,经常会出现无响应的情况。因此,本地部署体验成为更好的选择,具体规模取决于硬件配置。

AMD 锐龙 AI 处理器拥有业内最强大的 NPU,算力高达 50 TOPS(每秒 50 万亿次计算),是体验 DeepSeek 的理想选择。

如果您拥有 AMD 锐龙 AI 笔记本,可以通过 LM Studio 轻松在本地部署、体验 DeepSeek R1 精简版推理模型。

操作步骤:

  1. 安装 AMD Adrenalin 25.1.1 或更新版本的显卡驱动。
  2. 打开 lmstudio.ai/ryzenai,下载 LM Studio 0.3.8 或更新版本。
  3. 安装并启动 LM Studio,跳过引导屏幕。
  4. 点击“发现”标签页。
  5. 选择适合自己硬件的 DeepSeek R1 Distill 模型,具体选择见后。
  6. 在软件页面右侧,勾选“Q4 K M”量化模式,然后点击“下载”。
  7. 下载完成后,返回聊天选项页,从下拉菜单中选择 DeepSeek R1 distill,并确保勾选“手动选择参数”选项。
  8. 在“GPU 卸载”中,将滑块移至最大值。
  9. 点击“模型加载”。
  10. 现在,您可以在本地体验 DeepSeek R1 推理模型了!

不同硬件配置支持的不同参数量:

  • AMD 锐龙 AI MAX395 处理器,搭配 64GB 或 128GB 内存,最高支持 DeepSeek-R1-Distill-Llama-70B。
  • 搭配 32GB 内存,可支持 DeepSeek-R1-Distill-Qwen-32B。
  • AMD 锐龙 AI HX 370、AI 365 处理器,搭配 24GB 或 32GB 内存,支持 DeepSeek-R1-Distill-Qwen-14B。
  • AMD 锐龙 7040/8040 系列,搭配 32GB 内存,支持 DeepSeek-R1-Distill-Qwen-14B。

AMD 推荐将所有 Distill 运行在 Q4 K M 量化模式。

如果您使用的是台式机,AMD RX 7000 系列显卡也支持本地部署 DeepSeek R1。

  • RX 7900 XTX 旗舰显卡最高支持 DeepSeek-R1-Distill-Qwen-32B。
  • RX 7900 XT、7900 GRE、7800 XT、7700 XT、7600 XT 均支持 DeepSeek-R1-Distill-Qwen-14B。
  • RX 7600 和 RX 7650 GRE 适合 DeepSeek-R1-Distill-Llama-8B。

举报

  • 相关推荐
  • 全新开源的DeepSeek-OCR,可能是最近最惊喜的模型。

    ​AI圈虽然天天卷,但是很多的模型,真的越来越无聊了。 每天就是跑分又多了几个点。 直到昨天,DeepSeek久违的发了一个新模型。 DeepSeek-OCR。 这玩意,是真的有点酷。

  • DeepSeek开源3B OCR模型:长文本识别达97%精度

    DeepSeek在GitHub开源新一代OCR模型,采用创新光学二维映射压缩技术,在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌,较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率,显著优于同类模型。该技术路径为OCR系统小型化提供解决方案,其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

  • 华为FreeClip 2耳夹耳机正式开售:售价1299元 搭载NPU AI处理器

    华为FreeClip 2耳夹耳机10月20日开售,售价1299元。预售1小时销量破8万台,市场热度高。性能方面搭载自研低功耗芯片与NPU+AI处理器,算力提升10倍;配备超澎湃双引擎单元,响度与低频动力均翻倍。支持L2HC高清音频编码,音质清晰。新增鸿蒙AI耳边助手,支持智能播报、翻译等功能。设计采用亲肤液态材质与C形桥结构,单耳重5.1克,佩戴舒适且具备IP57防护。续航方面单次使用9小时,配合充电仓总续航达38小时,充电10分钟可用3小时。预计2025年底将升级星闪音频体验。

  • 中国AI算力突围:东方超算Deep X算力盒子超国际竞品82%,重新定义行业标准

    中国公司东方超算发布Deep X G20系列AI工作站,在MLPerf测试中性能超越NVIDIA DGX Spark达82%,价格持平,实现性能与性价比"双超越"。产品搭载Intel Ultra 9285处理器和NVIDIA RTX PRO 5000显卡,AI算力达1824 TOPS,体积仅2.7L。通过三大技术创新实现突破:智能异构计算引擎提升资源利用率40%;统一推理运行时支持多框架;深度硬件优化提升关键算子性能50-200%。该产品打破国际巨头垄断,已在量化金融、医疗影像等领域实现显著投资回报,标志着中国AI硬件实现重要突破。

  • 技嘉发布X3D系列主板:专为AMD X3D处理器打造,游戏性能提升高达25%

    技嘉推出专为AMD Ryzen X3D处理器优化的X870E AORUS X3D系列主板,首发型号包括MASTER与PRO两款。该系列搭载X3D鸡血模式2.0技术,通过AI智能场景识别可自动优化处理器性能,游戏性能最高提升25%。主板采用全快易拆设计,配备免螺丝M.2插槽、磁吸散热装甲及一键拆卸显卡插槽。集成AI黑科技2.0支持DDR5内存超频至9000MT/s+,预装网卡驱动实现开机即联网。两款主板均提供4年质保(含1年免费换新),现已在各大电商平台上市。

  • 火山 AI 搜索引擎升级:大模型时代重塑用户体验与业务增长

    火山引擎近日升级企业级AI搜索助手,底层模型升级至豆包大模型1.6,全面提升搜索、推荐、问答能力。该平台支持“开箱即用”,企业可快速构建专属对话式搜索助手,已在电商导购、视频新闻、AI搜图、智能硬件等多场景落地,帮助优化产品体验,为业务增长注入新动能。

  • WEEX反诈指南:提升警觉,防范高收益陷阱

    近年来数字资产市场快速发展,但网络诈骗层出不穷,包括仿冒交易平台、高收益投资骗局和假客服等手段。WEEX以安全为本,通过多重加密、冷热钱包分离、多因素身份验证等技术防护,结合反诈教育和实时监控系统保护用户。文章提醒投资者警惕高收益承诺,不点击陌生链接,不泄露验证信息,仅通过官方渠道下载APP,强调安全需平台与用户共同维护。

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

  • 声网与Oopz达成战略合作 共同打造游戏语音场景AI降噪极致体验

    游戏语音头部平台Oopz与声网达成战略合作,聚焦游戏开黑场景中的噪音问题。双方将结合AI降噪技术,针对复杂多变噪音环境,解决降噪不彻底、过度降噪等痛点,提升玩家沉浸式开黑体验。未来合作将覆盖连麦降噪、环境音消除等方向,优化主播端功能,共同打造更稳定流畅的语音解决方案。

  • DeepSeek-V3.2-Exp正式发布

    DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp,该模型基于V3.1-Terminus升级,引入创新的稀疏注意力机制DSA,首次实现细粒度稀疏注意力,在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面,官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整:输入缓存0.2元、输入未缓存2元、输出3元,开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

今日大家都在搜的词: