首页 > 传媒 > 关键词  > DigitalOcean最新资讯  > 正文

裸金属 GPU 上线!DigitalOcean 提供单用户独享H100资源

2024-12-03 10:20 · 稿源: 站长之家用户

对于需要直接控制硬件,需要更强性能的 AI 开发者来讲,DigitalOcean 已经为你们准备好了更适合的 GPU 服务器——DigitalOcean 基于 NVIDIA GPU 的裸金属服务器

这些服务器特别设计用来应对最复杂的 AI机器学习任务,无论是大规模的模型训练还是高度定制的基础设施设置,都能轻松胜任。DigitalOcean 的裸金属 GPU 服务器配有 8 个 NVIDIA Hopper GPU 和强大的硬件,这类服务器提供强大的计算能力和专门为高性能需求设计的定制选项。

DigitalOcean H100x8 GPU 服务器的按需定价为5. 95 美元/小时。对于有长期使用需求的企业,H100 GPU 服务器 3 年期合约价格仅需 2.24 美元/小时。逻辑金属机型按合同定价

裸金属 GPU 与 GPU Droplet 有什么不同?

DigitalOcean 在数月前推出了基于 NVIDIA H100 的 GPU Droplet 云服务器。现在又再次推出了基于 NVIDIA H100 的裸金属服务器。那么这两者有什么不同呢?

DigitalOcean 的裸金属 GPU 服务器,配备 NVIDIA 加速计算技术,提供了专属于单一用户的基础设施资源,没有共享用户会产生干扰,因此您可以完全访问服务器上所有的 GPU 资源。这些服务器适用于那些需要直接控制硬件以实现理想性能,并需要更进一步保护数据隐私性的项目,非常适合大规模的模型训练、实时推理和复杂编排等应用场景。这些硬件资源将专属于你和你的团队,更有利于项目的研发与落地。

以下是裸金属 GPU 与 GPU Droplet 在参数上的不同:

我们的裸金属 GPU 和 GPU Droplets 是为满足不同工作负载需求而设计的。GPU Droplets 提供了易于扩展和快速配置的能力,非常适合专注于训练、微调或在大语言模型上运行推理任务的团队。相比之下,裸金属 GPU 提供了比较高性能和对硬件的完全控制权,非常适合需要直接访问硬件资源和需要定制化、长期的、高吞吐量的工作负载。

同时,裸金属 GPU 服务器与 GPU Droplet 在定位、资源配置、定价方面也存在不同:

GPU Droplets最适合用于中小规模任务,包括:

  • 微调:使用特定数据集调整模型

  • 推理:为运行中的应用进行推理预测任务,需要高速响应

  • 中等数据处理:轻量级分析或视频处理,这些任务需要GPU加速,但不需要完全专用的硬件

裸金属GPU最适合用于高档和定制的工作负载,它在不同 AI 业务场景下可以提供更突出的优势,包括:

  • 大规模模型训练:轻松处理大型数据集。裸金属 GPU 让您能够全面优化模型训练,提供隐私保护、性能和对整个过程的控制。

  • 模型微调:从预训练模型开始,通过特定数据集进行微调,使其适应您的具体应用场景。裸金属提供的高性能 GPU 和隔离环境使得获取特殊应用所需的准确性和性能成为可能。

  • 高速推理:借助 Hopper GPU 处理推理,您的应用可以实现实时性能,用于实时预测和决策制定——非常适合需要响应速度的面向用户的产品。

  • Web3 与 AI 结合的场景:裸金属 GPU 服务器的高可用性、高性能以及低延迟网络,可以确保区块链网络的节点间通信快速可靠,支持Web3 与 AI 技术结合的落地场景。

  • 自定义应用场景:裸金属 GPU 非常适合需要高度可配置性和可靠的专用基础设施的自定义工作负载。无论是部署 Kubernetes 集群还是自定义编排设置,这些服务器都提供了构建和扩展复杂架构所需的灵活性。

自DigitalOcean 的 GPU Droplet 推出以来,在全球范围内已经有海量的企业用户开始使用该服务。得益于 NVIDIA 系列 GPU 的计算能力,以及 DigitalOcean 在基础设施方面的长期技术积累,GPU 服务器系列产品得到了用户的广泛好评。

“对我们公司最重要的是持续提供卓越的用户体验,并不断改进。这涉及到模型的研究和开发,这就要求使用 DigitalOcean 提供的强大 GPU 计算能力。”Jacob Jackson,Supermaven 的 CEO 和创始人表示。

裸金属 GPU 服务器将率先于美国纽约和荷兰阿姆斯特丹两个数据中心上线,其它分布于全球的 14 个数据中心也将陆续上线。该产品将会为需要专属 GPU 服务器以及高性能资源的 AI 企业提供强劲助力。

如需预约测试裸金属 GPU 服务器,咨询更多相关信息,可联系 DigitalOcean 中国区全力战略合作伙伴卓普云。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • NVIDIA RTX 加速 PC 端 4K AI 视频生成,LTX-2 与 ComfyUI全面升级

    2025年是PC端AI发展的突破之年,小语言模型(SLM)准确率相比2024年提升近2倍,显著缩小了与云端大语言模型(LLM)的差距。NVIDIA在CES上宣布了一系列针对RTX设备的AI升级,以解锁PC上的生成式AI性能。通过优化ComfyUI、开源LTX-2视频生成模型、加速Ollama和llama.cpp等工具,实现了视频/图像生成性能最高提升3倍、显存占用最多降低60%,以及SLM推理性能最高提升35%。这些改进让用户能在本地RTX AI PC上无缝运行先进的工作流,同时享受隐私、安全和低延迟优势。全新的视频生成工作流和由Nexa.ai推出的Hyperlink本地智能搜索工具,将进一步推动生成式AI在2026年全面走向大众创作者、游戏玩家和生产力用户。

  • 不装了!不能帮GPU分担向量数据库的CPU不是好至强

    本文指出,CPU已不再是AI工作中的旁观者。借助内置的AMX技术,至强处理器能高效处理向量数据库等密集矩阵运算,实测性能提升数倍。这使CPU能分担数据预处理等“杂活”,让GPU更专注于高价值的训练与推理任务,优化整体AI流程的性价比与效率。

  • 新年别急着换设备,WiFi断连、卡顿、黑屏问题先试试联想想帮帮AI服务智能体

    文章对比了传统维修方式与联想“想帮帮AI服务智能体”的“AI智修”功能,指出后者在解决WiFi断连、手机卡顿、黑屏等常见问题时更高效省心。传统方法操作门槛高、步骤繁琐、耗时且易出错;而“AI智修”入口清晰,能一键直达,自动识别问题原因并引导修复,无需专业知识,适合普通用户快速自助解决问题,节省大量时间。

  • AI日报:实时世界模型 PixVerse R1发布;Vidu发布AI一键生成MV功能;可灵AI ARR达2.4亿美元

    本期AI日报聚焦多项AI领域突破:爱诗科技发布全球首个通用实时世界模型PixVerse R1,实现虚拟世界实时交互;Vidu推出AI一键生成MV功能,打造“虚拟制片厂”;MiniMax发布编程智能体基准测试OctoCodingBench;快手可灵AI年化收入达2.4亿美元;智谱联合华为开源多模态模型GLM-Image,全链路跑通国产芯片;百川智能发布医疗大模型Baichuan-M3;谷歌重构电商未来,推出Agentic AI购物系统;谷歌开源医疗AI模型MedGemma 1.5与语音识别模型MedASR。

  • 新一代中端神U!联发科天玑8500发布:跑分突破240万、GPU性能大涨25%

    苦等了一年多,联发科中端神U终于迭代了。 天玑8500今天正式发布,各项性能全面提升,尤其是游戏、影像、AI方面实力暴涨。 采用台积电N4P工艺打造,CPU是第二代全大核架构,分别是1*3.4GHz Cortex-A725 3*3.20GHz Cortex-A725 4*2.20GHz Cortex-A725。 官方表示,天玑8500的多核性能相较前代提升7%,支持的内存带宽提升12%,安兔兔跑分240 万分。 GPU采用Mali-G720 MC8,峰值性能相较前代提升了25

  • 技嘉于 CES 2026 发布CQDIMM 技术 实现 256GB 满载 DDR5-7200 极限性能

    技嘉科技在CES 2026上发布CQDIMM技术,突破高容量与高频率无法兼得的限制。通过支持CQDIMM的主板Z890AORUS TACHYON ICE CQDIMM Edition与BIOS调校技术,实现双通道256GB容量、DDR5-7200的业界纪录。技嘉优化主板电路设计,降低内存通道负载,提升信号完整性,确保高负载下稳定运行;结合独家BIOS调校技术,精准优化时钟驱动架构、时序与电压,释放极限性能。此项业界首创为高性能计算树立新标杆,满足AI计算、内容创作等对高带宽与高容量的双重需求。技嘉还与ADATA、Kingston等内存品牌合作,确保兼容性,共同打造新一代PC解决方案。

  • 从概念到实践:蚂蚁百宝箱&通义灵码首届 MCP 插件开发大赛用百余款成果点亮企业场景服务

    首届“MCP插件开发大赛”于2025年10月27日至12月7日成功举办,由蚂蚁百宝箱联合通义灵码发起、NVIDIA赞助。大赛聚焦企业真实需求,以AI工具化为核心,吸引了近600支队伍参赛,最终百余款插件落地。优秀案例如“出行鸟民宿调价助手”帮助商家数据化定价,“T-Shop商城助手”赋能小微企业智能化运营,“适老化改造师”填补银发经济智能工具空白。赛事通过平台支撑与生态协作,验证了AI作为生产力的价值,并构建了“开发者创新-平台优化-生态完善”的正向循环,为“AI+企业服务”开启新篇章。

  • 物理AI革命爆发:邦彦技术如何卡位下一代商用计算机?

    文章指出,AI正从聊天机器人演变为理解并改变物理世界的强大力量。邦彦技术以“模型+数据=安全”为核心逻辑,通过构建从底层硬件到上层应用的完整AI计算生态,卡位未来技术制高点。其推出的邦彦云PC作为下一代计算入口,以及女娲AI数字人,致力于解决AI与物理世界交互的核心难题,并重新定义安全边界。文章认为,物理AI时代竞争的关键在于全栈能力,邦彦技术凭借前瞻布局,已在这场变革中占据有利位置。

  • 快麦ERP:国内领先的电商ERP服务商,专注多平台店铺管理

    快麦ERP是国内电商圈领先的ERP服务商,专注帮助商家管理多平台店铺。它能整合各平台数据,在一个界面处理所有店铺事务,包括商品信息同步、订单分类处理和客户信息管理。在进销存方面,快麦ERP能精准核算成本、安排销售计划,提高库存周转率,是多平台电商商家的得力助手。

  • AI日报:腾讯开源3D动作神器混元Motion1.0;罗永浩发布AI讲书App“且听”;夸克AI眼镜首次OTA

    本期AI日报聚焦多领域动态:腾讯开源10亿参数文生3D动作模型,赋能游戏影视;罗永浩发布AI讲书App“且听”,年费不足40元;京东上线自营租赁业务,推动机器人技术普及;夸克AI眼镜首次OTA升级,新增图文备忘等功能;MiniMax启动港股IPO,拟募资约41.9亿港元;阿里通义实验室推出多模态智能代理MAI-UI,性能超越同行;百度文心AI发布年度提示词“工作”,反映社会关注;2026年“两新”政策新增智能眼镜等产品补贴,加速AI终端落地。

今日大家都在搜的词: