GPUStack正式发布: 为大模型而生的开源GPU集群管理器

2024-07-29 09:16 · 稿源：站长之家用户

7月26日，数澈软件Seal（以下简称“Seal”）宣布正式发布并开源比较新产品 GPUStack，GPUStack 是一个用于运行 LLM（大型语言模型）的开源 GPU 集群管理器。

尽管如今大语言模型作为公共的云上服务已经被广泛推广并在公有云上变得更加易于使用，但对企业来说，部署托管自己私有的 LLM 供企业和组织在私有环境使用仍然非常复杂。

首先，企业需要安装和管理复杂的集群软件，如 Kubernetes，然后还需要研究清楚如何在上层安装和管理 AI 相关的工具栈。而目前流行的能在本地环境运行 LLM 的方法，如 LMStudio 和 LocalAI，却大都只支持在单台机器上运行，而没有提供多节点复杂集群环境的支持能力。

Seal 联合创始人及 CTO 梁胜博士介绍道，“GPUStack 支持基于任何品牌的异构 GPU 构建统一管理的算力集群，无论目标 GPU 运行在 Apple Mac、Windows PC 还是 Linux 服务器上， GPUStack 都能统一纳管并形成统一算力集群。GPUStack 管理员可以从诸如 Hugging Face 等流行的大语言模型仓库中轻松部署任意 LLM。进而，开发人员则可以像访问 OpenAI 或 Microsoft Azure 等供应商提供的公有 LLM 服务的 API 一样，非常简便地调用 OpenAI 兼容的 API 访问部署就绪的私有 LLM。”

帮助企业简单快速地开启 LLM 创新

当前，企业如果想要在 GPU 集群上托管大模型，必须要做大量的工作来集成复杂的技术栈。通过使用 GPUStack，企业不再需要担心如何管理 GPU 集群、推理引擎和推理加速、租户和配额管理、使用和计量、性能度量、统一认证授权和访问控制，以及仪表板。

如下图所示，GPUStack 是一个构建企业私有的大模型即服务（LLMaaS）的完整平台，拥有构建大模型即服务所需的各项功能。管理员可以将模型从 Hugging Face 等模型仓库部署到 GPUStack 中，然后开发人员可以连接到 GPUStack 提供的私有大模型 API，在他们的应用中集成和使用私有大模型服务。

“随着大语言模型能力的逐渐提高，企业和组织一方面对快速进入 AI 时代充满了信心并满怀期待，希望大语言模型能尽快为自己的企业和组织带来生产效能的提高，而另一方面，对于能否有效地把如火如荼的大语言模型技术进一步与实际业务进行有机结合，是否能因此产生相应的效益，企业及团队又同时充满了疑问。我们希望通过简单易用的 GPUStack 平台，部署和运行各种开源大语言模型，提供 OpenAI 兼容的 API 接口，使得开发人员简单方便地访问任何的 LLM。” Seal 联合创始人及 CEO 秦小康介绍道，“最重要的是，我们支持 Nvidia，Intel，AMD 及众多品牌的 GPU，在支持异构 GPU 集群的同时能为企业节省更多成本。帮助企业简单快速地开启 LLM 创新是 GPUStack 团队的初心和使命。”

整合GPU资源运行大模型

组建 GPU 集群整合资源

GPUStack 可以聚合集群内的所有 GPU 资源。它旨在支持所有的 GPU 厂商，包括英伟达，苹果，AMD，英特尔，高通，华为等。GPUStack 兼容运行 MacOS、Windows 和 Linux 操作系统的笔记本电脑、台式机、工作站和服务器。

模型部署和推理

GPUStack 为在不同 GPU 上部署不同大模型选择理想的推理引擎，支持的头个推理引擎是 LLaMA.cpp，其他推理引擎（如vLLM）的支持也在路线图中。

在资源充足的情况下，GPUStack 默认将模型全部卸载到 GPU，以实现理想性能的推理加速。如果 GPU 资源相对不足，GPUStack 会同时使用 GPU 和 CPU 进行混合推理，以比较大限度地利用资源。而在没有 GPU 资源的场景下，GPUStack 也支持纯 CPU 推理。这样的设计使 GPUStack 能够更广泛地适配各种边缘或资源有限的环境。

快速与现有应用集成

GPUStack 提供了与 OpenAI 兼容的 API，并提供了大模型试验场。开发人员可以调试大模型并将其快速集成到自己的应用中。此外，开发人员还可以通过观测指标来了解应用对各种大模型的使用情况。这也有助于管理员有效地管理 GPU 资源利用。

GPU 和 LLM 的观测指标

GPUStack 提供全面的性能、利用率和状态监控指标。对于 GPU，管理员可以使用 GPUStack 实时监控资源利用率和系统状态。对于 LLM，相关指标则可以帮助开发人员评估模型的性能并优化应用。

认证和访问控制

GPUStack 为企业提供身份验证和RBAC（Role-based Access Control）功能。这保证了只有授权的管理员可以部署和管理大模型，只有授权的开发人员可以使用大模型，应用也可以通过统一的 API 认证授权访问各种大模型。

加入社区，参与开源共创

GPUStack 项目正在快速迭代，计划引入对多模态模型的支持，更多的 GPU 厂商支持，以及更多的推理引擎支持。我们十分欢迎您一起参与开源项目的贡献，也欢迎在我们的 GitHub 仓库 gpustack/gpustack 上点亮 Star 关注我们的比较新动态。

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐

关键词：

Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发，专为多轮对话场景设计，支持中英川粤等多语言/方言与副语言风格，能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点，在播客、语音合成等场景表现突出，获开发者广泛关注。Hugging Face CEO也转发相关内容，团队未来将持续优化语音对话、拟人化表达等核心交互能力，深化开源生态建设。

SoulX-Podcast TTS 语音生成模型
荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

本期AI日报聚焦多项技术突破：MiniMax发布低延迟语音合成系统Speech 2.6，实现实时交互；蚂蚁数科与宁波银行打造的金融AI方案入选国际标准；智源推出具身操作能力的Emu3.5多模态模型；Cursor 2.0通过自研模型实现多智能体协同编程；xAI升级Grok新增视频生成功能；OpenAI推出可定制安全模型；TikTok推出AI剪辑工具Smart Split；微软发布强化学习框架Agent Lightning提升大模型训练效率。

AI日报 MiniMax Speech
从工具到数智中枢：DocuVerse云办公的生态价值与企业数智化未来

飞天云DocuVerse云办公系统通过"ECM+AI"双轮驱动，将数字化工具从效率工具升级为企业"数智中枢"。其核心价值在于沉淀分散的员工经验、项目流程等数字资产，构建可复用的知识库，实现个人经验向组织能力的转化。系统突破传统文档管理局限，连接数据、流程与人员，支持快速接入第三方工具并兼容现有设备。产品兼顾中小企业快速部署与大型企业个性化需求，已服务教育、制造等多行业客户，推动企业内容管理从效率提升向价值创造跨越，成为数字化转型的可靠伙伴。

数字化工具 DocuVerse 云办公
Mini LED时代即将终结！MacBook Pro将升级为OLED屏

苹果爆料人Mark Gurman透露，MacBook Pro会率先升级OLED，时间是明年下半年，然后MacBook Air再跟进OLED，时间是2028年，届时MacBook Pro和MacBook Air都将全面迈入OLED时代。 Mark Gurman指出，苹果旗下的iPad系列、MacBook机型全部都将启用OLED屏幕，包括iPad mini、MacBook Pro、iPad Air和MacBook Air，且大概率会按此顺序推进。PS：入门款iPad暂无搭载OLED的计划。值得注意的是，MacBo

OLED MacBook Pro
【AI 智惠季】全模态大模型齐发优惠，GPU新客包月2.8折起

阿里云启动双十一“AI智慧季”大型优惠活动，聚焦企业多元AI场景落地需求，推出7000万tokens大模型免费体验、GPU新客特惠等政策，助力企业降低开发成本。同时提供标准化AI产品与解决方案，覆盖内容创作、智能客服等高频应用场景，并举办系列技术分享活动，携手企业拥抱AI新时代。

AI技术阿里云双十一优惠
未来iPad mini/iPad Air/MacBook都将升级OLED屏：LCD退场

苹果正在研发搭载OLED显示屏的iPad mini、iPad Air、MacBook Pro和MacBook Air机型，苹果已在iPad Pro中采用OLED屏，并计划在未来数月及数年内将OLED推广到更多设备上，从而淘汰LCD屏幕。具体来看，iPad mini最快会在2026年配备OLED屏，同时会提升防水性能，新款iPad mini也因此涨价100美元。至于iPad Air，其商用OLED的时间要晚于iPad mini，爆料称2026年春季亮相的iPad Air将继续使用LCD屏幕，但后续

OLED显示屏 iPad mini
荐Sora App的AI视频社交，给了百度们新希望

Sora2发布两周后，百度的蒸汽机AI视频模型，和谷歌Veo3.1撞了档期。两家公司选择同期发布并非有多默契，而是Sora2带来的压迫感促使它们不得不加快脚步。奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”，不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃，还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。这无疑是扔在AI视�

文章搜索核心标签 AI视频模型
AI排名查询工具推荐:如何查询竞争对手在AI回答中的曝光

AI搜索时代品牌面临新挑战：用户直接询问AI工具推荐，若品牌未被提及将流失流量。数据显示，2024年58.5%的谷歌搜索为零点击，ChatGPT日均查询超百亿次。AI推荐高度集中，平均每次仅引用2-7个品牌。建议使用专业GEO监控工具（如AIBase）追踪主流AI平台曝光情况，及时优化内容策略。核心逻辑已从“让用户搜到你”转变为“让AI推荐你”。
燃爆蓉城！快手王者之战暨街霸6CPT亚洲白金赛圆满收官

10月31日至11月2日，“快手王者之战VI暨CAPCOM PRO TOUR 2025亚洲白金赛”在成都成功举办。日本选手HINAO从566名选手中脱颖而出，决赛中以3:2逆转夺冠，成为CPT史上最年轻白金赛冠军。赛事汇聚全球顶尖选手，覆盖亚太多赛区，冠军直通CAPCOM CUP总决赛。快手通过独家内容策划与线上线下联动，打造“电竞+文旅”融合模式，结合成都本地文化，推动电竞赛事破圈传播，彰显游戏生态布局优势。

快手王者之战 CAPCOM PRO
AI搜索优化工具推荐：产品描述如何写才容易被AI引用

通过测试发现，优化产品描述能显著提升AI推荐排名。关键技巧包括：开篇明确产品类型及用途，避免模糊表述；用具体数据替代空泛描述，如“被10万家企业使用”；突出差异化功能，比如“支持离线编辑+双向链接”。建议使用AIBase等工具监测曝光数据，通过持续优化循环，曝光率可提升20-30%。在AI搜索时代，产品描述需为算法优化，写清楚、写具体、写出差异。

今日大家都在搜的词：

热文

3 天
7天

GPUStack正式发布: 为大模型而生的开源GPU集群管理器

Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

从工具到数智中枢：DocuVerse云办公的生态价值与企业数智化未来

Mini LED时代即将终结！MacBook Pro将升级为OLED屏

【AI 智惠季】全模态大模型齐发优惠，GPU新客包月2.8折起

未来iPad mini/iPad Air/MacBook都将升级OLED屏：LCD退场

荐Sora App的AI视频社交，给了百度们新希望

AI排名查询工具推荐:如何查询竞争对手在AI回答中的曝光

燃爆蓉城！快手王者之战暨街霸6CPT亚洲白金赛圆满收官

AI搜索优化工具推荐：产品描述如何写才容易被AI引用

今日大家都在搜的词：

热文

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

阿里回应饿了么更名：正处于灰度测试阶段

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

vivo Y500 Pro官宣11月10日发布：同档首发2亿HP5主摄

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

鸿蒙智行新款享界S9官宣11月7日开订

B站回应拉黑指定用户可屏蔽开屏广告：不实信息

问界M7提车关爱计划发布：等车超10周最高可补贴10000元

鸿蒙HarmonyOS 6与iOS数据互传功能预计12月上线

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

阿里回应饿了么更名：正处于灰度测试阶段

AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功

DeepSeek崩了上热搜页面显示“服务器繁忙”

特斯拉Cybercab不配备方向盘和踏板预计2026年二季度下线

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

OPPO ColorOS 16正式版11月升级机型公布：支持23款机型

vivo Y500 Pro官宣11月10日发布：同档首发2亿HP5主摄

站长商机