首页 > 业界 > 关键词  > 英伟达最新资讯  > 正文

英伟达展示 Hopper 计算机,Intel Gaudi2 的性价比是 H100 的 4 倍

2023-11-09 09:59 · 稿源:站长之家

站长之家(ChinaZ.com) 11 月 9 日 消息:最新一轮 MLPerf 训练 v3.1 的结果中,尽管大部分成绩并不激动人心,但两个结果引人注目。首先,NVIDIA (英伟达)使用 MLPerf 来展示其最新的霍珀(Hopper)一代超级计算机。其次,非常少见的是,英特尔和 NVIDIA 都在宣传英特尔 Gaudi 2 加速器在价格/性能方面的出色表现。

nvidia-culitho,英伟达,芯片

在封闭部门和开放部门之间,共有 209 个结果跑过 83 种不同的配置。开放部门仅提交了两种配置,每种配置只有一个不同的结果。MLPerf 训练 v3.1 有九个测试,所以平均每个提交配置的基准测试完成率只有约 27%。209 个结果中只有 14 个不是 NVIDIA 的 GPU。其中六个是英特尔展示了其 Xeon Sapphire Rapids 在 AI 中的性能,为行业 CPU 性能设定了基线。

第一个重要的信息是,NVIDIA 正在展示其新的超级计算机。这台被称为 NVIDIA Eos 的系统配备了 10,752 个 H100 GPU,通过 400Gbps Quantum-2 InfiniBand 连接。从某种角度看,如果一家公司要在开放市场上购买这样的系统,其价格很可能超过 4 亿美元

有了这台庞大的超级计算机,NVIDIA 在 MLPerf 训练套件中赢得了不同 GPU 数量的胜利。它甚至与运行 10,752 NVIDIA H100 GPUs 的 Microsoft Azure 云服务相匹配。

一般来说,提交 MLPerf 训练结果的其他公司如此之少,以至于 NVIDIA 不得不制作一个总结幻灯片,显示很少有其他公司使用其 MLPerf 训练套件。从 AMD 的财报中可以知道,它正在出货 MI300 变体,这将是 MLPerf 的「商业可用」产品。我们还知道,像 Cerebras 这样的公司没有 MLPerf 就售出了价值 10 亿美元以上的晶圆规模集群。MLPerf 推理通常非常适合供应商之间的比较。MLPerf 训练已经失去了这一点,除了一个例外。

查看 Stable Diffusion 测试,人们可能会看到 NVIDIA 的速度大约是英特尔 Gaudi2 的 8 倍。然而,当我们了解细节时,NVIDIA 使用的 H100 GPU 数量是英特尔的 16 倍才能达到这种速度提升。把这个放在一个视角中,我们预期的是,要快 8 倍,成本会超过 32 倍。换句话说,NVIDIA 的营销幻灯片在这里显示,与 NVIDIA 相比,英特尔在每美元性能方面的表现介于相当接近和 4 倍之间(约 8 倍的性能,约 32 倍的成本)。

在 64 个加速器的直接比较中,NVIDIA 大约快两倍。这对英特尔来说是一个很好的结果,因为它使用的加速器成本不到 NVIDIA 对手的一半,而且系统架构要简单得多

NVIDIA 在调整 H100 方面比英特尔在 Gaudi2 方面更进一步,但此次 MLPerf 的重大进展是支持 FP8,这导致了约 2 倍的性能提升。

英特尔现在有了一个有趣的玩法。Gaudi2 的表现似乎介于 A100 和 H100 之间,但从了解的情况来看,它的成本不到 NVIDIA的 H100 部分的一半,如果考虑到整个系统成本,可能会更低。

英特尔 Gaudi2 获得了足够的关注,以至于供应受限,但没有 H100 那么严重。

除了 NVIDIA 之外,大部分行业都放弃了 MLPerf 训练,只剩下一些英特尔的结果和一个 Google 的结果。NVIDIA H100 SXM5 是当今的大型 GPU,很少有使用 MLPerf 挑战它的。只有少数公司能够将其硬件和软件扩展到超过 1000 个加速器,所以在顶端,竞争并不激烈。如果您六个月后想要 10000 个加速器,那么您很可能是在购买 NVIDIA H100 SXM5 系统。

拥有 NVIDIA Eos 超级计算机,NVIDIA 拥有一台内部价值超过 4 亿美元的机器。目前,可能没有其他任何公司能够在这一点上与之匹敌。当然,这是零售价值,不是 NVIDIA 支付自己部件的价格,但这是一台大机器。

NVIDIA 争夺规模的有趣结果是,它展示了英特尔的 Gaudi 2 可以以四倍的性价比提供 Stable Diffusion 性能。NVIDIA 试图展示它在图表上有一个更长的条形图,但在争取更长条形图的比赛中,它失去了规模效率,给了英特尔一个大胜利。

举报

  • 相关推荐
  • 大家在看
  • Semblian 2.0:AI助手,简化会议后的繁琐工作。

    Semblian 2.0是一个AI助手,旨在通过自动化和个性化的会议后行动建议,提高工作效率。它能够生成销售提案、项目计划、功能需求等多种文档,同时提供个性化的下一步行动建议。Semblian 2.0通过分析多个会议,帮助用户识别趋势、更新信息并预测结果。此外,它还能将会议自动组织成工作流,以便用户专注于推动结果。Semblian 2.0适用于需要高效会议管理和文档生成的专业人士。

  • BlinkShot:实时AI图像生成器

    BlinkShot 是一个基于Together AI的实时AI图像生成器,它利用Flux技术在用户输入提示时毫秒级生成图像。该产品是100%免费且开源的,旨在为创意人士和开发者提供快速生成图像的能力,以支持他们的设计和创意工作。

  • Inverse Painting:逆向绘画技术,重现绘画过程

    Inverse Painting 是一种基于扩散模型的方法,能够从一幅目标画作生成绘画过程的时间流逝视频。该技术通过训练学习真实艺术家的绘画过程,能够处理多种艺术风格,并生成类似人类艺术家的绘画过程视频。它结合了文本和区域理解,定义了一组绘画指令,并使用新颖的扩散基础渲染器更新画布。该技术不仅能够处理训练中有限的丙烯画风格,还能为广泛的艺术风格和流派提供合理的结果。

  • voice-chat-pdf:使用OpenAI实时API与文档进行语音聊天

    voice-chat-pdf是一个基于LlamaIndex项目,使用Next.js构建的示例,它通过简单的RAG系统,允许用户通过语音与PDF文档进行交互。这个项目需要OpenAI API密钥来访问实时API,并在项目中生成文档的嵌入向量,以便进行语音交互。它展示了如何将先进的机器学习技术应用于提高文档交互的效率和便捷性。

  • GS-VTON:3D虚拟试衣技术

    GS-VTON是一种3D虚拟试衣技术,它通过使用高斯散射(3DGS)作为3D表示,实现了从2D虚拟试衣模型到3D空间的知识转移,同时提高了跨视图的一致性。该技术通过个性化的扩散模型,利用低秩适应(LoRA)微调,将个性化信息整合到预训练的2D虚拟试衣模型中。此外,它还提出了一个人物意识的3DGS编辑框架,以确保在编辑过程中保持一致的跨视图外观和高质量的3D几何结构。GS-VTON通过广泛的实验和与现有方法的比较分析,展示了其在3D虚拟试衣中的高保真度和先进的编辑能力,证明了其在3D虚拟试衣中的有效性。

  • Entropy-based sampling:基于熵的采样技术,优化模型输出的多样性和准确性

    Entropy-based sampling 是一种基于熵理论的采样技术,用于提升语言模型在生成文本时的多样性和准确性。该技术通过计算概率分布的熵和方差熵来评估模型的不确定性,从而在模型可能陷入局部最优或过度自信时调整采样策略。这种方法有助于避免模型输出的单调重复,同时在模型不确定性较高时增加输出的多样性。

  • TxT360:海量文本数据提取与分析

    TxT360 是一个由 LLM360 提供的 Hugging Face 空间产品,专注于从海量文本数据中提取有价值的信息。它利用先进的自然语言处理技术,能够高效地处理大规模文本数据,为用户提供深度分析和洞察。这一技术对于需要处理大量文本信息的企业和研究人员来说至关重要,因为它可以节省大量时间和资源,同时提供更准确的数据分析结果。

  • 新天工AI:全能AI助手,搜索、对话、写作、文档分析、画画、做PPT

    天工AI是一款集合了搜索、对话、写作、文档分析、画画、制作PPT等多种功能的AI助手。它通过先进的人工智能技术,为用户提供高效、便捷的服务,帮助用户节省时间,提升工作效率。天工AI的背景是随着人工智能技术的快速发展,人们对于智能化服务的需求日益增长。产品以用户友好、功能全面为定位,旨在满足不同用户在工作、学习和生活中的多样化需求。

  • ComfyUI LLM Party:基于ComfyUI前端开发的LLM工作流节点集合

    ComfyUI LLM Party旨在基于ComfyUI前端开发一套完整的LLM工作流节点集合,使用户能够快速便捷地构建自己的LLM工作流,并轻松地将它们集成到现有的图像工作流中。

  • PodLM:AI播客生成器

    PodLM是一个AI播客生成器,旨在帮助企业和营销人员轻松创建高质量的播客,以推动结果。它利用先进的AI技术,从URL和文本生成高质量播客,提供多样化的内容来源,并且是一个NotebookLM的替代品,专门用于AI播客创作。

  • realtime-playground:实时API交互体验平台

    realtime-playground是一个基于LiveKit Agents构建的交互式平台,允许用户在浏览器中直接体验OpenAI的实时API。该平台通过集成最新的API技术,为用户提供了一个实验和探索人工智能实时交互能力的场所。

  • Hailuo AI:重新定义视频创作

    Hailuo AI Video Generator 是一款利用人工智能技术,根据文本提示自动生成视频内容的工具。它通过深度学习算法,将用户的文字描述转化为视觉图像,极大地简化了视频制作流程,提高了创作效率。该产品适用于需要快速生成视频内容的个人和企业,特别是在广告、社交媒体内容制作和电影预览等领域。

  • 光映AI:AI驱动视频创作平台

    光映AI是一个利用人工智能技术帮助用户快速创建热门视频的平台。它通过AI技术简化了视频编辑过程,使得用户无需视频编辑技能也能制作出高质量的视频内容。该平台特别适合需要快速制作视频内容的个人和企业,如社交媒体运营者、视频博主等。

  • Ausha Intelligence:AI助力播客内容优化与搜索可见性提升

    Ausha Intelligence是Ausha推出的一款AI工具,旨在帮助播客制作者快速生成优化的内容,显著提高在播客应用中的可见性。它通过一键操作,可以生成全面的标题、吸引人的描述、结构化的章节、相关的标签、社交媒体帖子和新闻稿,从而增强播客的可发现性,并确保一致且有效的营销策略。Ausha Intelligence通过集成到平台中,提供了清晰、用户友好、流畅的体验。它不仅实用,还经过了播客营销策略的训练,能够推广节目、简化营销工作流程,并提高节目的可见性。Ausha Intelligence保证了无与伦比的内容质量。

  • ChatPPT:一键开启AI,免费解析PPT,与PPT畅所欲言。

    ChatPPT是一个利用人工智能技术,帮助用户一键分析PPT并生成对话总结的工具。它通过AI技术简化了PPT内容的理解和交流,使得用户能够更高效地处理演示文稿。该产品的主要优点是能够快速提取PPT中的关键信息,并通过对话形式呈现,使得内容更加通俗易懂。ChatPPT适合需要频繁处理PPT文件的商务人士和教育工作者,它能够显著提高工作效率和学习效率。

  • AI句子生成器:利用AI技术生成高质量句子的在线工具

    AI句子生成器是一个基于人工智能技术的在线工具,它能够根据用户提供的主题和类型生成连贯且上下文相关的句子。这项技术对于作家、学生和任何希望提高写作技能的人都非常有价值。它通过复杂的自然语言处理技术和机器学习模型,确保每个生成的句子都是定制化的,以满足用户的需求。AI句子生成器的主要优点包括简化写作过程、节省时间、激发创造力,并帮助用户生成多样化的句子结构和语调,提高整体写作风格。

  • AI Name Generators:AI驱动的名字生成工具,快速生成各种创意名称。

    AI Name Generators是一款利用人工智能技术自动生成各种类型名称的工具。用户只需输入一些基本信息或选择特定类别,如船名、日本名、游戏名等,系统将根据输入的标准生成一系列独特且富有创意的名字。该工具特别适合需要命名的场合,比如游戏开发者、作家和企业主,因为它节省时间并提供灵感,帮助他们找到最合适的名字。

  • HeadshotAI:AI驱动的头像生成器,在家即可制作专业级头像。

    HeadshotAI是一个利用人工智能技术生成逼真头像的平台,它使用先进的算法分析上传的照片,生成具有专业摄影效果的头像。这项技术的重要性在于,它让个人能够以更低的成本和更便捷的方式,获得高质量的头像,从而提升个人品牌和职业形象。HeadshotAI的主要优点包括无与伦比的真实感、轻松定制、快速生成、价格亲民以及无缝集成。

  • IconGen.io:AI驱动的图标生成器,快速创建精美图标。

    IconGen.io是一个由AI驱动的图标生成器,用户可以通过它快速创建适用于商业、演示文稿等场合的精美图标。该工具利用人工智能技术,简化了图标设计流程,使得即使是没有设计背景的用户也能轻松创建出专业的图标。IconGen.io的主要优点包括快速生成、易于使用、设计多样化,适合需要提升品牌形象的用户。

  • gptme:终端中的个人AI助手,具备本地工具。

    gptme是一个运行在终端的个人AI助手,它装备了本地工具,可以编写代码、使用终端、浏览网页、视觉识别等。它是一个不受软件、互联网访问、超时或隐私问题限制的ChatGPT“代码解释器”的本地替代方案。

今日大家都在搜的词: