首页 > 传媒 > 关键词  > GPUStack最新资讯  > 正文

GPUStack正式发布: 为大模型而生的开源GPU集群管理器

2024-07-29 09:16 · 稿源: 站长之家用户

7月26日,数澈软件Seal(以下简称“Seal”)宣布正式发布并开源比较新产品 GPUStack,GPUStack 是一个用于运行 LLM(大型语言模型)的开源 GPU 集群管理器。

尽管如今大语言模型作为公共的云上服务已经被广泛推广并在公有云上变得更加易于使用,但对企业来说,部署托管自己私有的 LLM 供企业和组织在私有环境使用仍然非常复杂。

首先,企业需要安装和管理复杂的集群软件,如 Kubernetes,然后还需要研究清楚如何在上层安装和管理 AI 相关的工具栈。而目前流行的能在本地环境运行 LLM 的方法,如 LMStudio 和 LocalAI,却大都只支持在单台机器上运行,而没有提供多节点复杂集群环境的支持能力。

Seal 联合创始人及 CTO 梁胜博士介绍道,“GPUStack 支持基于任何品牌的异构 GPU 构建统一管理的算力集群,无论目标 GPU 运行在 Apple Mac、Windows PC 还是 Linux 服务器上, GPUStack 都能统一纳管并形成统一算力集群。GPUStack 管理员可以从诸如 Hugging Face 等流行的大语言模型仓库中轻松部署任意 LLM。进而,开发人员则可以像访问 OpenAI 或 Microsoft Azure 等供应商提供的公有 LLM 服务的 API 一样,非常简便地调用 OpenAI 兼容的 API 访问部署就绪的私有 LLM。”

帮助企业简单快速地开启 LLM 创新

当前,企业如果想要在 GPU 集群上托管大模型,必须要做大量的工作来集成复杂的技术栈。通过使用 GPUStack,企业不再需要担心如何管理 GPU 集群、推理引擎和推理加速、租户和配额管理、使用和计量、性能度量、统一认证授权和访问控制,以及仪表板。

如下图所示,GPUStack 是一个构建企业私有的大模型即服务(LLMaaS)的完整平台,拥有构建大模型即服务所需的各项功能。管理员可以将模型从 Hugging Face 等模型仓库部署到 GPUStack 中,然后开发人员可以连接到 GPUStack 提供的私有大模型 API,在他们的应用中集成和使用私有大模型服务。

“随着大语言模型能力的逐渐提高,企业和组织一方面对快速进入 AI 时代充满了信心并满怀期待,希望大语言模型能尽快为自己的企业和组织带来生产效能的提高,而另一方面,对于能否有效地把如火如荼的大语言模型技术进一步与实际业务进行有机结合,是否能因此产生相应的效益,企业及团队又同时充满了疑问。我们希望通过简单易用的 GPUStack 平台,部署和运行各种开源大语言模型,提供 OpenAI 兼容的 API 接口,使得开发人员简单方便地访问任何的 LLM。” Seal 联合创始人及 CEO 秦小康介绍道,“最重要的是,我们支持 Nvidia,Intel,AMD 及众多品牌的 GPU,在支持异构 GPU 集群的同时能为企业节省更多成本。帮助企业简单快速地开启 LLM 创新是 GPUStack 团队的初心和使命。”

整合GPU资源运行大模型

组建 GPU 集群整合资源

GPUStack 可以聚合集群内的所有 GPU 资源。它旨在支持所有的 GPU 厂商,包括英伟达,苹果,AMD,英特尔,高通,华为等。GPUStack 兼容运行 MacOS、Windows 和 Linux 操作系统的笔记本电脑、台式机、工作站和服务器。

模型部署和推理

GPUStack 为在不同 GPU 上部署不同大模型选择理想的推理引擎,支持的头个推理引擎是 LLaMA.cpp,其他推理引擎(如vLLM)的支持也在路线图中。

在资源充足的情况下,GPUStack 默认将模型全部卸载到 GPU,以实现理想性能的推理加速。如果 GPU 资源相对不足,GPUStack 会同时使用 GPU 和 CPU 进行混合推理,以比较大限度地利用资源。而在没有 GPU 资源的场景下,GPUStack 也支持纯 CPU 推理。这样的设计使 GPUStack 能够更广泛地适配各种边缘或资源有限的环境。

快速与现有应用集成

GPUStack 提供了与 OpenAI 兼容的 API,并提供了大模型试验场。开发人员可以调试大模型并将其快速集成到自己的应用中。此外,开发人员还可以通过观测指标来了解应用对各种大模型的使用情况。这也有助于管理员有效地管理 GPU 资源利用。

GPU 和 LLM 的观测指标

GPUStack 提供全面的性能、利用率和状态监控指标。对于 GPU,管理员可以使用 GPUStack 实时监控资源利用率和系统状态。对于 LLM,相关指标则可以帮助开发人员评估模型的性能并优化应用。

认证和访问控制

GPUStack 为企业提供身份验证和RBAC(Role-based Access Control)功能。这保证了只有授权的管理员可以部署和管理大模型,只有授权的开发人员可以使用大模型,应用也可以通过统一的 API 认证授权访问各种大模型。

加入社区,参与开源共创

GPUStack 项目正在快速迭代,计划引入对多模态模型的支持,更多的 GPU 厂商支持,以及更多的推理引擎支持。我们十分欢迎您一起参与开源项目的贡献,也欢迎在我们的 GitHub 仓库 gpustack/gpustack 上点亮 Star 关注我们的比较新动态。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • Humanizar Texto IA:将AI生成文本转化为自然流畅的人类语言。

    Humanizar Texto IA 是一款基于人工智能的文本优化工具,旨在将由AI生成的文本转化为更自然、更符合人类语言习惯的文本。该工具使用先进的算法,如基于GPT-3和自然语言处理技术,来改善文本的语法、风格、语调和连贯性。它不仅提高了文本的质量,还有助于用户避免被AI检测工具如ChatGPT Zero识别。Humanizar Texto IA 工具的主要优点包括提升文本质量、降低成本、全天候可用性和保障隐私。

  • AI俳句生成器:在线创作传统5-7-5格式的俳句诗

    AI俳句生成器是一个在线工具,利用人工智能技术简化了俳句的创作过程。它不仅遵循传统的5-7-5音节结构,还通过提供音节计数、同义词建议、创意提示和多俳句生成等功能,帮助用户探索和创作俳句。这个工具适合所有对日本诗歌感兴趣的人,无论是初学者还是经验丰富的诗人,都能通过它提升写作技巧和创意思维。

  • EmojiSpark:AI驱动的表情包搜索工具

    EmojiSpark是一个利用人工智能技术为用户提供快速、准确的表情包搜索服务的网站。用户可以通过输入关键词或描述来找到相应的表情包,极大地丰富了在线沟通的趣味性和表达力。该网站支持多种分类搜索,包括表情、动物、食物等,满足不同用户的需求。

  • EtsyHunt:一站式Etsy选品运营工具,提升店铺销售效率。

    EtsyHunt是一个为Etsy卖家提供全面运营服务的平台,包括关键词研究、数据化选品、店铺分析和智能邀评等功能。它通过每日更新的海量商品数据库,帮助卖家挖掘高利润的潜力爆品,优化商品Listing,提升店铺运营效率。EtsyHunt的主要优点包括数据化选品成功率提升、提供AI工具辅助运营、以及实时数据监控等。

  • Vidful.ai:AI视频生成器,轻松制作专业级视频。

    Vidful.ai是一个基于AI技术的在线视频生成器,它利用先进的算法将文本和图片快速转换为高质量的视频内容。产品集成了快手Kling AI和Luma AI Dream Machine技术,提供逼真的运动效果和影院级别的视频效果,简化了视频制作流程,使得用户无需专业的视频编辑技能即可制作出专业级的视频。Vidful.ai支持免费在线使用,适合营销、教育、社交媒体创作者和电商等多个领域的用户。

  • 豆包爱学:AI学习助手,全方位辅助学习与成长。

    豆包爱学(原河马爱学)是一款专为学习者设计的智能教育APP,依托强大的AI技术,提供解题答疑、作业批改、写作辅导、知识学习、情感陪伴等多功能服务。它旨在成为学习者和家长的全能学习助手,通过智能化手段提高学习效率,激发学习兴趣,促进全面发展。

  • AlphaProteo:AI系统设计新型蛋白质,助力生物和健康研究。

    AlphaProteo是DeepMind推出的首个AI系统,用于设计新型、高强度的蛋白质结合体,作为生物和健康研究的构建模块。这项技术有潜力加速我们对生物过程的理解,并助力新药的发现、生物传感器的开发等。AlphaProteo能够为多种目标蛋白质生成新的蛋白质结合体,包括与癌症和糖尿病并发症相关的VEGF-A。它在实验成功率和结合亲和力方面均优于现有方法,能够显著减少涉及蛋白质结合体的初步实验所需的时间。

  • Kacha:利用AI技术,将日常快照转化为艺术照片

    Kacha是一款革命性的AI照片应用程序,通过先进的AI技术,能够将用户的普通照片转化为高质量、独特且实用的艺术照片。它提供了多种风格化选项,如卡通头像、职业肖像、教堂婚纱照片等,满足不同用户的需求。Kacha的易用性和创新性使其成为图像处理领域的佼佼者,特别适合需要快速、高效地改善和风格化照片的用户。

  • 聆龙:AI笔记助手,记录、整理、对话,让知识管理更智能。

    聆龙是一款AI笔记助手,它通过语音AI笔记功能,支持用户随时记录信息,并以富文本形式保存。它还具备AI智能标签功能,能够自动生成标题,帮助用户与自己的知识库进行对话。此外,聆龙采用了独创的AI卡片盒笔记法,让用户能够不断记录,实现知识的自然呈现。产品支持多平台同步,包括安卓、苹果和Web版,满足不同用户的需求。

  • Kuakua夸夸:用心理学与AI工具带来幸福

    Kuakua夸夸是一个结合心理学和人工智能技术的网站,旨在通过提供积极词汇、理论、任务和实验,帮助用户提升幸福感,成为更好的自己。产品背景信息显示,它鼓励用户专注于当下,接受挑战,拥抱生活,从而实现个人成长和幸福。产品免费提供多种资源,包括积极词汇投票、名人名言、常见问题解答等,以促进用户的积极思考和心理健康。

  • 锐智论文AI:高质量原创AI论文写作平台

    锐智论文AI写作4.0版是一个专注于学术写作的人工智能平台,它通过最新的学术大模型技术,为用户提供高质量、原创性的论文写作服务。该平台支持多种学科和论文类型,包括毕业论文、开题报告、文献综述等,覆盖从专科到研究生的各个学历层次。它还提供了一系列辅助功能,如文献检索、查重率控制、图表和代码插入等,以满足不同用户的需求。平台注重用户隐私和数据安全,采用阿里云加密技术保护用户论文隐私。

  • FluxImage-AI:使用Flux.1 AI模型,轻松创建高分辨率、逼真图像。

    Flux Image Generator是由Black Forest Labs开发的AI图像生成工具,它利用Flux.1模型,能够根据用户的描述生成高分辨率、细节丰富的图像。这款工具不仅能够生成逼真的图像,还支持从简单提示到复杂设计的广泛风格和主题,非常适合艺术家、设计师和内容创作者使用。它的特点包括快速生成图像、提供商业使用权、支持多种图像类型,并且提供退款政策,确保用户满意度。

  • Ai Chat机器人:智能AI聊天助手,提供多语言对话和个性化服务。

    Ai Chat机器人Plus是一款基于人工智能技术的聊天机器人,它能够理解并流畅地与用户进行交流,提供信息查询、日常咨询、技术支持等服务。这款产品通过模仿人类的对话方式,为用户提供了一个直观、便捷的交互体验。它主要的优点包括快速响应、高准确率的语义理解以及个性化的服务体验。Ai Chat机器人Plus适用于需要快速、智能对话解决方案的个人和企业用户。

  • AI KATANA:亚洲最大的AI社区,提供最新AI资讯与技术交流平台。

    AI KATANA是一个专注于人工智能领域的社区网站,它为亚洲的AI爱好者、研究者和专业人士提供一个交流和学习的平台。该网站提供最新的AI新闻、技术动态、行业趋势和深度分析,帮助用户紧跟AI技术的发展。AI KATANA通过分享AI工具、资源和案例,促进知识的传播和创新思维的激发。

  • 薪酬分析助理 AI:提升企业薪酬管理效率的智能利器

    薪酬分析助理 AI 是行业首个薪酬分析AI Agent,通过对话形式帮助HR完成日常人力统计报表数据分析,同时支持查询市场薪酬及对标企业招聘动态,有效提升企业人才薪酬竞争力。利用薪酬分析助理 AI,企业能够深入洞察薪酬数据,实现精准的薪酬规划与管理,从而优化人力资源配置,促进业务发展。

  • Laminar:开源的AI代理/RAG应用的监控与分析工具

    Laminar是一个开源的监控和分析工具,专为AI代理和RAG应用设计,提供类似于DataDog和PostHog的功能。它基于OpenTelemetry进行自动监控,支持快速、可靠的数据收集和分析。Laminar使用Rust编写,具有高性能和可靠性,适用于大规模数据处理。它通过提供详细的追踪、事件和分析功能,帮助开发者和企业优化AI应用的性能和用户体验。

  • JSONGenerator:JSON数据生成工具,帮助创建和管理JSON数据结构

    JSONGenerator是一个为开发者、测试人员和教育工作者设计的终极数据生成工具,它通过使用模板来定义和生成精确及随机的JSON数据。该工具简化了手动构建JSON数据的过程,提供了一致性和大量数据的快速生成,同时支持数据结构的灵活修改。它遵循RFC 8259和ECMA-404标准,确保生成的JSON数据是经过验证和优化的。

  • Re.video:开源视频编辑框架,支持自动化视频工作流。

    Revideo是一个基于Motion Canvas的开源框架,用于程序化视频编辑。它允许开发者自动化复杂的视频工作流程,或在浏览器中构建完整的视频编辑器。Revideo支持使用Typescript创建视频模板,并能够即时预览和渲染为MP4格式的视频。它适用于大规模视频生成、A/B测试视频广告、构建网页内的视频编辑器或视频游戏等场景。

  • Replit Agent:AI工具,协助用户构建软件项目。

    Replit Agent是一个AI驱动的工具,旨在帮助用户构建软件项目。它能够理解自然语言提示,并协助从头开始创建应用程序,使得软件开发对所有技能水平的用户更加易于接近。Replit Agent是Replit在将AI编码工具普及化方面的最新尝试,它将人类与机器的协作推向了一个新的层次,使得AI代理和人类能够互补、相互填补空白并相互学习。

  • Reflection Llama-3.1 70B:世界顶尖的开源大型语言模型

    Reflection Llama-3.1 70B 是目前世界上顶尖的开源大型语言模型(LLM),采用名为 Reflection-Tuning 的新技术进行训练,使模型能够检测其推理中的错误并进行修正。该模型在合成数据上进行了训练,这些数据由 Glaive 生成。对于正在训练模型的用户来说,Glaive 是一个非常出色的工具。该模型使用标准的 Llama 3.1 聊天格式,通过特殊的标签来区分模型的内部思考和最终答案,从而提升用户体验。

今日大家都在搜的词: