首页 > 传媒 > 关键词  > DeepSeek最新资讯  > 正文

成本打到6万以下 手把手教你用4路锐炫™ 显卡+至强® W跑DeepSeek

2025-03-05 13:40 · 稿源: 站长之家用户

凭借卓越性能表现与先天开源优势,DeepSeek正迅速成为全球扩展大模型应用实践的一大“圆心”。作为英特尔在GPU领域的重要布局,英特尔锐炫™显卡既是游戏党与视频生产力工作者的新欢,也可用作计算卡,对DeepSeek提供加速支持,为企业用户部署相关AI应用提供一条全新的高价性比实现路径。具体来说,就是与英特尔® 至强® 可扩展处理器或英特尔® 至强® W处理器搭配,以多卡配置的型态来运行和加速DeepSeek推理任务。

 本文将在DeepSeek-R1- Distill-Qwen-32B推理场景下,以面向企业级应用且成本较低可控制在5- 6 万元人民币的4 路英特尔锐炫™ A770 显卡 + 至强® W处理器的解决方案为例,详细阐述搭建硬件环境、配置驱动与软件、优化参数设置等步骤,手把手教大家部署和配置这一方案。

 1. 软硬件安装配置与初始化

 1.1 硬件安装配置

 硬件配置

 处理器:英特尔® 至强® W 处理器(可选 20 核/ 24 核/ 28 核/ 32 核)

 内存:8 x 32GB DDR5-3200

 存储:2TB M.2 固态盘

 电源:≥ 2000 瓦

 GPU:4 x英特尔锐炫™ A770 显卡

 BIOS:设置Re-Size BAR Support为[Enabled]

 图. 安装 4 路英特尔锐炫™ A770 显卡的AI工作站

  • 在BIOS设置中,将Re-Size BAR Support设为[Enabled]

 1.2 软件安装配置

 软件配置

 操作系统:Ubuntu22.04.1 LTS

 内核:6.5.0 - 35 - general

 驱动程序:23.43.27642.67

 vLLM Serving:intelanalytics/ipex-llm-serving-xpu:b11

  • 安装操作系统Ubuntu22.04.1 LTS(镜像文件可访问https://old-releases.ubuntu.com/releases/22.04.1/ubuntu-22.04.1-desktop-amd64.iso获取)。
  • 进行硬件验证,你要为每块 GPU 显卡都配备足额功耗来保证其工作正常。安装完操作系统后,可通过以下命令检查英特尔锐炫™ A770 显卡是否正常加载:

 ~$ lspci | grep 56a0

 18:00.0 VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

 36:00.0 VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

 54:00.0 VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

 cc:00.0 VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

  • 在确保 APT 网络已连接,且你的账号已具有 sudo 权限的情况下,需严格按以下步骤安装驱动程序:

 ~$ wget -qO - https://repositories.intel.com/gpu/intel-graphics.key | sudo gpg --yes --dearmor --output /usr/share/keyrings/intel-graphics.gpg

 ~$ echo "deb

 ~$ sudo apt update

  • 如果内核版本不是6.5.0-35,则通过以下命令安装6.5.0- 35 版本:

 ~$ sudo apt-get install -y linux-image-6.5.0-35-generic linux-headers-6.5.0-35-generic linux-modules-6.5.0-35-generic linux-modules-extra-6.5.0-35-generic

 ~$ sudo apt install intel-i915-dkms

 ~$ sudo vim /etc/default/grub

 GRUB_DEFAULT="Advanced options for Ubuntu>Ubuntu, with Linux 6.5.0-35-generic"

 ~$ sudo update-grub

 ~$ sudo reboot

  • 然后通过以下命令安装计算、媒体和显示运行时库:

 ~$ sudo apt install -y intel-opencl-icd intel-level-zero-gpu level-zero intel-media-va-driver-non-free libmfx1 libmfxgen1 libvpl2 libegl-mesa0 libegl1-mesa libegl1-mesa-dev libgbm1 libgl1-mesa-dev libgl1-mesa-dri libglapi-mesa libgles2-mesa-dev libglx-mesa0 libigdgmm12 libxatracker2 mesa-va-drivers mesa-vdpau-drivers mesa-vulkan-drivers va-driver-all vainfo hwinfo clinfo

  • 通过以下命令将当前用户添加到 render 组:

 ~$ sudo gpasswd -a $(USER) render

 ~$ sudo newgrp render

  • 驱动程序安装完成后,建议使用以下命令进行验证:

 ~$ clinfo | grep "Driver Version"

 Driver Version 23.43.27642.67

 1.3 在英特尔® 至强® W平台上设置GPU的HDMI显示

  • 首先禁用 ast 卡:

 ~$ sudo vim /etc/modprobe.d/blacklist.conf

  • 在文件底部添加“blacklist ast”:

 ~$ sudo update-initramfs -u

  • 然后将窗口系统配置为wayland模式:

 ~$ sudo vim /etc/gdm3/custom.conf

  • 将WaylandEnable设置为true:

  • 完成后更新初始RAM文件系统(initramfs)并重启系统,然后将HDMI线插入首先块英特尔锐炫™ A770 显卡即可完成显示终端设置。

 ]# sudo update-initramfs -u

 ~$ sudo reboot

 1.4 监控工具xpu-smi安装

  • 可根据xpumanager repo安装用于监控和管理 XPU设备状态信息的xpu-smi 工具。下载xpumanager并执行以下命令:

 ~$ wget https://github.com/intel/xpumanager/releases/download/V1.2.27/xpu-smi_1.2.27_20240103.051106.5eeb3f13.u22.04_amd64.deb  --no-check-certificate

 ~$ sudo apt install ./xpu-smi_1.2.27_20240103.051106.5eeb3f13.u22.04_amd64.deb

 ~$ xpu-smi discovery

  • 结果显示如下:

  1. 大模型服务与聊天机器人演示

 2. 1 容器(Docker)安装及服务设置

  • 用户可通过 Docker,在英特尔锐炫™ A770 显卡上使用 IPEX-LLM开展 vLLM 服务。Docker的安装可参考:https://docs.docker.com/engine/install/ubuntu/
  • 通过以下命令,设置CPU主频至比较大睿频,并将显卡锁频至2.4GHz:

 ~$ apt-get install linux-tools-6.5.0-35-generic linux-cloud-tools-6.5.0-35-generic

 # Query max turbo frequency, like W3445, Max Turbo Frequency is 4.8GHz:

 ~$ sudo cpupower frequency-set -d 4.8GHz

 ~$ sudo xpu-smi config -d 0 -t 0 --frequencyrange 2400,2400

 ~$ sudo xpu-smi config -d 1 -t 0 --frequencyrange 2400,2400

 ~$ sudo xpu-smi config -d 2 -t 0 --frequencyrange 2400,2400

 ~$ sudo xpu-smi config -d 3 -t 0 --frequencyrange 2400,2400

 2.2 安装并启动vLLM服务

  • 下载并安装以下vllm版本:

 ~$ docker pull intelanalytics/ipex-llm-serving-xpu:2.2.0-b11

  • 从https://hf-mirror.com下载LLM模型到本地文件夹中(例如:/home/worker/LLM)。
  • 从https://hf-mirror.com/collections/deepseek-ai/deepseek-r1-678e1e131c0169c0bc89728d下载蒸馏版模型。

  • 将以下脚本放入/home/intel/Demo-4xArc中的 bachkend-ipex-docker.sh文件(以下操作都以DeepSeek-R1-Distill-Qwen-32B版为例):

  • 将以下脚本放入vllm-deepseek-r1-distill-qwen-32b-openaikey.sh文件:

  • 然后启动容器和vLLM 服务:

 ~$ sudo bash backend-ipex-docker.sh

 ~$ docker exec -it ipex-llm-b11 bash

 ~$ cd workspace & bash vllm-deepseek-r1-distill-qwen-32b-openaikey.sh

  • 如下日志表明DeepSeek推理服务已启动成功:

 2.3 使用Chatbox AI进行性能测试

  • 开发者可以在本地使用Chatbox AI进行LLM推理性能测试。如DeepSeek推理服务IP为192.168.10.110,在Windows PowerShell中执行以下命令并输入密码,将远程服务端口映射到本地:

 User> ssh -L 8001:localhost:8001 worker@192.168.10.110

  • 打开Chatbox AI的Url(https://web.chatboxai.app/)

  • 选择 “User My Own API Key / Local Model”,点击 “Add Custom Provider”,并根据下图所示进行配置,手动输入DeepSeek整流的模型名称等信息:
  • 由此,使用者可以在Chatbox AI中向大语言模型提问,测试其推理性能:

  • vllm服务日志能够显示当前的性能状况,如图中所示,基于多路英特尔锐炫™ A770 显卡的推理服务一直有着30+ tokens/s的性能表现。

 创新不止步:全新24GB锐炫™ 显卡与满血版DeepSeek R1 方案正在路上

 本部署指南虽然是围绕 4 路英特尔锐炫™ A770 显卡的方案展开,且以DeepSeek-R1-Distill-Qwen-32B版为例,但我们的实践探索并未局限于此。

 一方面,该解决方案可对DeepSeek各个蒸馏版提供同样灵活的支持。使用者可通过调整输入模型名称,以及设定并行使用的显卡数量来进行调整(使用--tensor-parallel-size参数来控制)。

 另一方面,多路英特尔锐炫™显卡 + 英特尔® 至强® 可扩展处理器 /至强® W处理器方案的关键目标,还是锁定在DeepSeek- R1-671B这一性能高峰版本上,其配置与优化方法很快就会与大家见面。预计其技术路径会同时覆盖基于KTransformer,能更充分发挥至强® 处理器内置AI加速技术AMX潜能的方案,以及GPU配置密度更高的单机 16 路英特尔锐炫™ 显卡的方案。

 另一个值得期待的进展,就是专为生产力应用打造的新一代英特尔锐炫™ 显卡 B580 24G显存版本也正向我们走来,其 4 张卡即可提供96GB的显存容量,意味着用户可在单机中更轻松地部署更大参数量的DeepSeek服务(例如DeepSeek- R1-671B版本),进而能在实战中以较低的成本和较为便捷的部署方式,开启不缩水的DeepSeek服务。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • DeepSeek带飞寒武纪

    寒武纪凭借AI芯片业务实现扭亏为盈,2024年首次实现上市后盈利,2025年Q1营收11.11亿元同比暴增4230%,净利润3.55亿元。这家曾连亏8年、累计亏损54亿元的"中国版英伟达",因美国对H20芯片出口管制获得市场红利,但客户集中度过高(前五大客户贡献94.63%营收)和现金流波动仍是隐忧。当前国产芯片迎来发展机遇,华为昇腾、壁仞等企业纷纷抢占市场,行业竞争日趋激烈。

  • DeepSeek红利耗尽后,元宝拿什么和豆包斗?

    短短60天内,中国AI原生应用下载排行榜的位次排名,就三易其主。最新情况是,截至4月15日中午,中国区苹果应用商店免费APP下载排行榜上,豆包再次超越DeepSeek,位列第二,紧随其后的DeepSeek被挤到了第三的位置,腾讯元宝则滑落到了第七名。2月13日,作为首家在C端主力产品中接入DeepSeek-R1满血版的元宝,一度趁着DeepSeek东风崛起:3月3日力压DeepSeek和豆包,首度登顶。但好景�

  • DeepSeek的极致谄媚,正在摧毁我们的判断力。

    昨天别人给我发了一个很好玩的帖子。就是如果你问DeepSeek一个问题:“北京大学和清华大学哪个更好,二选一,不需要说明理由”DeepSeek在思考了15秒之后,会给出答案。

  • AI进化论——音乐、绘画和舞蹈的DeepSeek时刻

    “昔者仓颉作书天雨粟,鬼夜哭”——人类掌握文字后,天地为之动容,因为属于人类的文明诞生了。“仓颉作书”出自西汉《淮南子》,距离人类掌握文字已经过去了千年。AI进化的答案,或许早就镌刻在人类文明的起点里。

  • 深度deepin 23.1正式发布!AI默认引擎切换至DeepSeek、修复超百项问题

    快科技4月16日消息,今天,深度操作系统宣布,deepin 23.1版本已正式发布。此版本聚焦于解决基础组件更新后的安装效率问题,大幅提升新用户安装体验,同时集成多项功能优化与问题修复,进一步优化系统使用。本次版本的重点改进包括内核优化、AI 默认引擎切换至DeepSeek、修复超百项用户反馈问题等,具体重点改进如下:硬件兼容性与内核优化:集成6.6/6.12内核更新、NVIDIA显卡驱动升级、Intel/AMD CPU微码更新,全面提升硬件支持与底层性能;核心功能增强:DDE新增智能镜像源管理、紧凑模式入口,全局搜索支持离线自然语言与AI处理能力;?

  • 国羽加油口号是DeepSeek想的 网友:这个口号好厉害

    中国羽毛球队在2025年苏迪曼杯首轮比赛中5-0战胜阿尔及利亚队,赛前全队高喊"羽啸鼓浪巅,中国剑指天!"的霸气口号。这句由DeepSeek团队借助科技力量创作的口号,既体现了羽毛球运动精神,又展现了队员们的昂扬斗志。口号成为国羽标志性语言,激励队员为国争光。此次合作彰显科技与体育的完美结合,也体现了DeepSeek对体育事业的支持。未来期待DeepSeek继续发挥创意技术优势,为更多体育赛事提供支持,共同推动中国体育事业发展。

  • 宝马中国将接入DeepSeek!爆新世代车型搭载AI智能体

    宝马中国4月27日宣布接入深度求索(DeepSeek)AI大模型,深化本土AI生态布局。这是继宝马与阿里巴巴达成AI大语言模型合作后,再次联手中国科技企业。从今年三季度起,搭载第九代宝马操作系统的多款国产新车将率先应用该技术,通过智能个人助理提升人机交互体验。宝马还计划将DeepSeek功能应用于新一代国产车型。此前3月,宝马已与阿里云合作开发车载AI引擎,双方在上海车展展示了识别率达99%的智能语音交互系统。此次合作将突破车载场景限制,实现车辆与外部世界的智能连接,为用户提供个性化出行体验。

  • DeepSeek 7 小时攻克缅甸救灾语言关,首次用于地震国际救援

    缅甸发生7.9级强震,造成重大人员伤亡。在这场与时间赛跑的救援行动中,由中国团队紧急研发的智能翻译系统成为国际救援的关键纽带。这场跨越山河的科技驰援,不仅展现了中国AI技术的发展速度,更彰显了负责任大国的技术担当。

  • DeepSeek崛起到下一个亿级销量市场,这份硬核报告说明白了

    我们正在进入AI创新的「中国时间」。2025第一季度刚刚过完,中国大模型“国产之光”已经可以预定一个年度关键词了。让生态内的所有从业者有理由相信:更多“国产之光”,正在智能涌现。

  • 从多层保障到DeepSeek赋能,数禾科技重塑金融安全格局

    在数字金融飞速发展的当下,金融交易的线上化、智能化程度不断攀升,从日常的小额支付到大规模的投融资活动,都通过数字网络流转。然而,伴随这一发展,数据泄露、网络攻击等安全隐患也如影随形,严重威胁着金融体系的稳定。因此,数据安全已然成为金融行业稳健前行的关键基石。作为行业内的先行者,数禾科技始终将数据安全视为金融安全的核心要素,凭借持续�