戴尔Precision工作站：助力客户更有效地使用GenAI大语言模型

2024-04-02 15:41 · 稿源：站长之家用户

本实用指南将帮助用户了解，如何配置个人电脑才能更有效地使用生成式AI 大语言模型

生成式人工智能（GenAI）彻底改变了计算世界，戴尔科技的用户都开始考虑借助大语言模型(LLM)去开发能够提升其公司生产力、效率和创新力的新功能。戴尔科技拥有全球最丰富的AI基础设施产品组合，从云到客户端设备一应俱全[1]，因此能够为用户提供满足其一切AI需求的端到端AI解决方案和服务。戴尔科技还提供专为助力AI工作负载而设计的硬件解决方案，包括工作站、高性能计算服务器、数据存储、云原生软件定义基础设施、网络交换机、数据保护、HCI和各种服务。但用户所面临的比较大问题之一是:如何确定一台PC能够与特定的LLM有效配合。戴尔科技将尝试解答这个问题。

首先应该掌握一些关于如何帮助PC处理LLM的基础知识。虽然AI例程可以在CPU或被称为NPU的新型专用AI回路中进行处理，但目前的主流仍然是在PC中使用NVIDIA RTX GPU进行AI处理，该GPU带有被称为“张量核心”（Tensor Core）的专用回路。RTX张量核心专门用于实现混合精度数学计算，而这是AI处理的核心。但进行数学运算只是需要考虑的因素之一，鉴于LLM潜在的内存占用量，还需要额外考虑可用的内存空间。要在GPU中较大程度地发挥AI性能，就必须将LLM处理加入到GPU VRAM。NVIDIA的GPU产品线在各种移动和固定工作站产品中都可以扩展，用户可以通过所提供的张量核心数量和GPU VRAM选项来轻松调整系统规模。请注意，某些固定工作站可以搭载多颗GPU来进一步扩大容量。

市场上出现的LLM数量和种类越来越多，但在确定硬件需求时，最需要考虑的因素之一是所选LLM的参数规模。以Meta AI的Llama-2LLM为例，该模型有70亿、130亿和700亿这三种不同的参数规模。一般来说，参数规模越大，LLM的准确性就越高，在一般知识应用中的适用性也就越强。

无论用户的目标是将基础模型原封不动地用于推理，还是根据具体的用例和数据进行调整，他们都需要了解LLM对机器的要求以及如何较好地管理模型。如果能够利用用户专有的数据开发和训练出针对特定用例的模型，那么用户的AI项目就能为其带来比较大的创新和回报。在使用LLM开发新功能和应用时，参数规模比较大的模型可能会对机器性能提出很高的要求，因此数据科学家们开发出了一些办法来帮助降低处理开销和管理LLM输出准确性。

量化就是其中的一种办法。该技术通过修改LLM内部参数（即权重）的数学精度来缩小LLM的规模。降低位精度会对LLM产生两方面的影响: 一是减少处理所占用的空间和对内存的需求，二是影响LLM的输出准确性。量化可以看作是JPEG图像压缩，虽然压缩得越多，创建出的图像效率就越高，但在某些用例中可能会使图像变得模糊不清。

在实际应用中，如果用户想要运行量化为4位精度的Llama-2模型，可以考虑戴尔Precision3000和5000系列的多款移动工作站。

戴尔科技全新的3000和5000系列移动工作站集成了CPU，NPU，GPU多处理器组合，能够优化100多款应用中的AI性能，使其运行更快、能效更高。例如，它们可支持全新的协作体验，如AI驱动的视频会议，提供背景模糊、面部取景和视线纠正等功能。NPU能有效地卸载CPU或GPU上的任务，使功耗降低高达40% 。这意味着电池续航时间更长，用户无需频繁充电即可持续工作。此外，新款CPU还配备了速度更快的集成显卡，为更多媒体密集型AI工作负载提供卓越性能。CPU、NPU和GPU协同工作，共同打造灵活、高性能且节能的AI引擎，为用户带来较好体验。

此外，全新戴尔Precision3490和3590移动工作站比较高可搭载NVIDIA RTX500Ada图形处理器，提升专业用户的工作效率。Precision3591则专注于设计与创作领域，轻松应对入门级2D和3D CAD应用。而Precision5000系列移动工作站将创意应用的性能提升到了新的高度，Precision5690凭借其小巧的16英寸机身，为用户带来出色的创意应用体验。它具备广阔的视野、出色的便携性和强大的应用性能，比较高可配备NVIDIA RTX5000图形处理器。同时，机身小巧但强大功能的Precision5490作为一款14英寸超便携设备，在性能和体验方面也毫不逊色。

在更高精度（BF16）运行会增加对内存的需求，但戴尔科技的解决方案可以在任何精度上满足任何规模的LLM需求。戴尔Precision7960塔式工作站可支持多达四个NVIDIA 高性能GPU，其AI处理能力比上代产品高出80% 且每个GPU的VRAM高达48GB，而VRAM是处理GenAI大语言模型最关键的配置之一。

那么如何解决输出准确性所受到的影响?另一种被称为微调的技术可以通过在特定数据上重新训练LLM的参数子集来提高准确性，进而提高特定用例中的输出准确性。微调会调整某些已训练参数的权重，能够加快训练过程并提高输出准确性。通过将微调与量化相结合，就可以产生针对特定应用的小语言模型，这些模型非常适合部署到对AI处理能力要求较低的各种设备上。同样，如果开发人员想要对LLM进行微调，也可以放心地将Precision工作站作为构建GenAI解决方案过程中的沙盒。

在使用LLM时这些不同技术不会相互排斥。把它们结合在一起使用往往会带来更高的运行效率和准确性。

总之，LLM的规模以及哪些技术能够为有效使用LLM所需的计算系统配置提供理想参考都是关键的决定因素。戴尔科技坚信无论用户在其AI旅程中想要朝哪个方向发展，戴尔科技的台式机、数据中心等解决方案都将为其提供助力。

戴尔科技集团

戴尔科技集团致力于帮助企业和个人构建数字化未来，改进他们的工作、生活和娱乐方式，为客户提供面向数据时代全面和创新的产品、技术、解决方案及服务组合。

[1] 基于戴尔科技集团的内部分析，2023年8月。

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
土巴兔成立专项工作站,加大互联网平台企业知识产权保护

“在上级指导部门的见证下，我们作为数字经济的代表企业成立知识产权保护工作站，是对我们工作的认可，也提出了更高的要求。对于知识产权，核心技术是最大的生产力，而互联网平台对生态合作商家的赋能，其最大的创新就是技术创新……”近日，深圳市市场监督管理局、市局南山监管局深入土巴兔总部，对其在知识产权保护工作上进行调研指导，来自市局知识产权保

知识产权保护数字经济互联网平台
荐一直爆料OpenAI「草莓」的账号，竟然是个智能体？斯坦福系创企「炒作」AgentQ

当炒作出了「泼天的流量」，已经没人关心产品厉不厉害了。OpenAI的秘密项目「Q*」一直受到了圈内人士的广泛关注。更多技术细节和评估结果请参阅原论文。

OpenAI
荐语言图像模型大一统！Meta将Transformer和Diffusion融合，多模态AI王者登场

【新智元导读】就在刚刚，Meta最新发布的Transfusion，能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后，语言模型和图像大一统，又近了一步。真正的多模态AI模型，可能很快就要来了!Transformer和Diffusion，终于有了一次出色的融合。他在卡耐基梅隆大学语言技术研究所获得博士学位，师从EduardHovy教授，并在上海交通大学获得了计算机科学硕士和学士学位�

Transformer Diffusion Meta
荐阿里开源新语音模型，比OpenAI的Whisper更好！

阿里巴巴在Qwen-Audio基础之上，开源了最新语音模型Qwen2-Audio。Qwen2-Audio一共有基础和指令微调两个版本，支持使用语音向音频模型进行提问并识别内容以及语音分析。在SER和VSC测试中，Qwen2-Audio同样以显著成绩胜出。

Whisper
Nvidia 和 Mistral AI 的超精确小语言模型适用于笔记本电脑和 PC

Nvidia和MistralAI发布了一款新型的小型语言模型，据称该模型在小体积下依然具有「最先进」的准确性。该模型名为Mistral-NemMo-Minitron8B，是NeMo12B的迷你版本，参数量从120亿缩减到了80亿。开发者可以将这些优化技术应用于所有现有的语言模型，从显著提升整体性能，包括那些只能由AI加速服务器群组运行的大型语言模型。

Mistral Nvidia 人工智能
荐比OpenAI的Whisper快50%，最新开源语音模型

生成式AI初创公司aiOla在官网开源了最新语音模型Whisper-Medusa，推理效率比OpenAI开源的Whisper快50%。aiOla在Whisper的架构之上进行了修改采用了“多头注意力”机制的并行计算方法，允许模型在每个推理步骤中预测多个token，同时不会损失性能和识别准确率。aiOla表示，未来会将Whisper-Medusa的多注意力机制扩展至20个头，其推理效率将再次获得大幅度提升。

生成式AI 语音模型 Whisper-Medusa
荐Transformer作者预警：只卖模型玩不过OpenAI！

Transformer八子中最年轻的AidanGomez在最新的采访中感叹:谷歌版的AidanGomez，是给AI领域带来深远影响的Transformer作者之一。现在的AidanGomez，是估值飙升55亿美元的Cohere公司的联合创始人兼CEO。所以我认为我们的首要任务应该是提高生产力和增长。

OpenAI Transformer 人工智能
荐AI日报：谷歌Gemini引入类GPTs功能Gems；DeepMind推AI实时渲染引擎GameNGen；一男子用AI合成视频造谣被抓；OpenAI推神秘加速器Converge 2

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、谷歌推定制化聊天机器人“Gem”，让你创建专属AI虚拟助手谷歌正式推出Gemini订阅用户可定制聊天机器人Gem，满足个性化需求。该工具简化了演示文稿的创建和编辑过程，适用于PowerPoint和GoogleSlides等主流平台。

Gemini
GameNGen有哪些功能？谷歌游戏引擎AI模型怎么使用方法详细教程指南

GameNGen是什么？GameNGen是一个由神经模型驱动的前沿游戏引擎，专注于实现与复杂环境的实时互动，并在长时间的模拟中保持高质量图像。通过我们的平台，您可以轻松发现适合您的AI工具，充分发挥AI的潜力。

GameNGen
Genie完全指南：AI软件工程模型 - 使用方法教程与候补名单申请入口

探索Genie能为你带来哪些改变为什么选择Genie？Genie不仅仅是一款产品——它是一项革命性的技术，致力于AI软件工程模型的发展。通过AIbase，您可以轻松发现最适合您需求的人工智能工具，解锁AI的力量。

Genie

Nabubit:数据库设计助手，简化数据库设计、管理和演化。

Nabubit是一个旨在帮助用户优化数据库设计、管理和演化的在线工具。它提供了上传数据库架构图、可视化数据库结构、以及使用自然语言提问的功能。用户可以从头开始设计数据库，无需担心命名或记住语法。完成设计后，可以将其导出到自己喜爱的数据库或框架中。

数据库设计自然语言处理可视化

Otter Script:文档生成平台，快速创建复杂文档。

Otter Script是一个文档生成平台，它通过自动化技术帮助用户节省时间，将原本需要几天完成的复杂文档工作缩短到几分钟。它简化了工作流程，让用户可以更高效地完成更多任务。

自动化文档生成时间管理

BNA:多功能AI超级应用，涵盖社交、电商、娱乐和教育。

BNA AI Super App是一款集成了多种智能服务的超级应用，它不仅提供社交功能，如分享帖子、写博客、聊天和视频通话，还涵盖了AI电商和娱乐服务。此外，该应用还提供40种语言的AI教学服务，帮助用户学习不同的语言。BNA AI Super App以其强大的AI功能和多语言支持，满足了不同用户群体的需求。

AI 多语言学习社交

Elisi:高效能自主层级式计划助手

Elisi 是一款旨在帮助用户实现个人成长的终极组织者和指南。它通过直观的设计和用户友好的说明，帮助用户将梦想转化为清晰的结果，分解成可实现的里程碑，并通过AI技术理解并适应用户的个人需求，确保每一天都更有条理和高效。Elisi 致力于提供便捷服务，主要功能套件完全免费。

个人成长时间管理目标设定

Omi AI:个性化AI助手，记录每一刻，与AI对话获取反馈。

OMI APP是一个任务驱动的个性化AI助手，旨在通过语音和音频转录功能帮助用户提高记忆力和沟通效率。它是一个开源的AI记事本，提供提醒、建议等功能，同时注重用户隐私。

AI助手语音转录隐私保护

MeowMail:高送达率的AI电子邮件营销工具

MeowMail是一款集成在Shopify后台的电子邮件营销应用，利用AI技术自动选择最佳发送时间，提高邮件的送达率至98%以上。它支持拖放编辑、从Klaviyo导入邮件列表、使用Beefree编辑器创建新邮件，并通过设定支出限制来管理邮件营销活动。MeowMail还提供企业级支持和自动翻译文本功能，帮助商家以低成本实现高效的邮件营销。

邮件营销 AI技术 Shopify应用

Maia 100:微软定制AI加速器，专为大规模AI工作负载设计。

Maia 100是微软为Azure设计的首款定制AI加速器，专为大规模AI工作负载而打造，通过软硬件的协同优化，实现了性能、可扩展性和灵活性的最大化。它采用了TSMC N5工艺和COWOS-S互连技术，具备高达1.8TB/s的带宽和64GB的容量，支持高达700W的热设计功耗(TDP)，但以500W运行，确保了高效的能效比。Maia 100集成了高速张量单元、向量处理器、DMA引擎和硬件信号量，支持多种数据类型和张量切分方案，并通过以太网互连支持大规模AI模型。此外，Maia SDK提供了丰富的组件，支持快速部署PyTorch和Triton模型，并通过双编程模型确保高效的数据处理和同步。

AI加速器 Azure 大规模计算

LTM:超长上下文模型，革新软件开发

Magic团队开发的超长上下文模型（LTM）能够处理高达100M tokens的上下文信息，这在AI领域是一个重大突破。该技术主要针对软件开发领域，通过在推理过程中提供大量代码、文档和库的上下文，极大地提升了代码合成的质量和效率。与传统的循环神经网络和状态空间模型相比，LTM模型在存储和检索大量信息方面具有明显优势，能够构建更复杂的逻辑电路。此外，Magic团队还与Google Cloud合作，利用NVIDIA GB200 NVL72构建下一代AI超级计算机，进一步推动模型的推理和训练效率。

AI 软件开发上下文推理

EZ-work AI文档翻译:智能AI翻译，高效文档语言转换助手。

EZ-work AI文档翻译是一款专注于文档翻译的在线服务，支持多种语言的翻译，包括中文、英语、日语、俄语、阿拉伯语和西班牙语等。它使用先进的AI技术，如gpt-4o-mini和deepseek-chat模型，为用户提供快速、准确的翻译服务。该产品适用于需要文档翻译的个人和企业，尤其在国际交流和学术研究领域尤为重要。

翻译 AI 文档处理

Watson AI:会议助手，自动记录并总结会议要点。

Watson AI是一款会议助手应用程序，它通过录制系统音频和麦克风来转录和总结会议内容，自动提取行动项和会议摘要，帮助用户更高效地进行会议记录和回顾。

会议助手自动记录效率工具

PicTech AI: 免费在线AI图片翻译助力跨境电商

PicTech AI是由学以致用科技旗下的智能图像工具品牌，专注于为跨境电商提供AI驱动的图片翻译服务。该产品利用人工智能技术，实现高准确率和高清晰度的图片翻译，支持中文、英语到日语、韩语等多国语言的翻译。PicTech AI的智能抠图功能，能够准确检测图片主体边缘，一键去除背景，无需专业编辑。产品背景信息显示，其团队由来自百度、网易、阿里巴巴等行业巨头的顶尖高科技人才组成，具备强大的技术实力和产品能力。该产品定位于帮助跨境电商从业者简化工作流程，提高效率，无需懂外语或图像处理技能即可使用。

AI翻译跨境电商智能抠图

AnythingLLM:一站式AI应用，支持多种文档和模型。

AnythingLLM是一个多功能的桌面客户端，支持多种语言模型（LLM）和文档类型，提供完全私密的使用体验。用户可以根据自己的需求选择企业级模型、自定义模型或开源模型，如GPT-4、Llama、Mistral等。产品支持一键安装，本地运行，无需互联网连接，保护用户隐私。

AI 文档处理隐私保护

林哥的大模型野榜:更适合中国宝宝体质的大模型产品排行榜

林哥的大模型野榜是一个专注于中国用户需求的大模型产品排行榜，提供了多维度的评估和排名，帮助用户更好地了解和选择适合的大模型产品。

大模型排行榜多维度评估

Fluximg.com:AI文本到图像生成器，支持多尺寸和自动翻译。

Fluximg.com是一个基于Flux模型的AI图像生成网站，提供从文本到图像的转换服务。它支持多种语言，包括中文和英文，并且具有用户友好的界面。网站提供免费和专业版本，使用户能够根据自己的需求选择不同的服务级别。

AI图像生成多尺寸自动翻译

现代文转古文:将现代汉语转化为古汉语，提升文采。

现代文转古文是一款能够将现代汉语自动转换为古汉语的模型，它通过先进的自然语言处理技术，使得用户可以轻松地将现代文本转换成具有古典韵味的古文。这种转换不仅能够增加文本的文学价值，还能在教育、文学创作、文化传承等方面发挥重要作用。

古文文学转换

Zamba2-mini:先进的小型语言模型，专为设备端应用设计。

Zamba2-mini是由Zyphra Technologies Inc.发布的小型语言模型，专为设备端应用设计。它在保持极小的内存占用(<700MB)的同时，实现了与更大模型相媲美的评估分数和性能。该模型采用了4bit量化技术，具有7倍参数下降的同时保持相同性能的特点。Zamba2-mini在推理效率上表现出色，与Phi3-3.8B等更大模型相比，具有更快的首令牌生成时间、更低的内存开销和更低的生成延迟。此外，该模型的权重已开源发布(Apache 2.0)，允许研究人员、开发者和公司利用其能力，推动高效基础模型的边界。

戴尔Precision工作站：助力客户更有效地使用GenAI大语言模型

今日大家都在搜的词：

热文

站长商机