11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
LLM若想高速推理,现如今,连GPU都无法满足了?曾造出世界最大芯片公司Cerebras,刚刚发布了全球最快的AI推理架构——CerebrasInference。运行Llama3.18B时,它能以1800token/s的速率吐出文字。值得注意的是,在Cerebras上跑的Llama3.1,上下文只有8k……相比之下,其他平台都是128K。
SFCompute是一家位于硅谷的初创公司,旨在通过其平台为小型企业提供所需的AI算力资源。该公司推出了算力租赁服务,使用户能够以较低成本获取所需资源,短时间内使用大量计算能力。资金将用于建立交易平台,并计划在未来一年内将其工程人员规模增加一倍。
微软推出了全新的NDH100v5虚拟机系列,该系列配备了最新的NVIDIAH100TensorCoreGPU和NVIDIAQuantum-2InfiniBand网络。这款虚拟机具有AI超级计算GPU、新一代CPU、低延迟网络、优化主机到GPU的性能以及大规模的内存和内存带宽等特性,能够提供无与伦比的计算能力。大规模的内存和内存带宽:DDR5内存是该系列虚拟机的核心,提供更高的数据传输速度和效率,使它们成为处理大规模数据集工作负载的理想选择。
【新智元导读】全世界最有「料」的平台来了!AmazonBedrock基础模型上新,商用Agents加快应用开发,矢量引擎赋予大模型记忆,亚马逊云科技凭借技术创新成为端到端的生成式AI领导者。AI圈依然是大事频发,几天一个爆炸性新闻。在不断创新的基础上,亚马逊云科技正在让开发者,让世界重新构想体验,把最好的产品带入生活。
机器学习及人工智能领域开放产业联盟MLCommons公布了两项MLPerf基准测试的最新数据:在人工智能算力表现测试中,英伟达的H100芯片组刷新了所有组别的纪录,也是唯一一个能够执行完所有基准测试的硬件平台。在最新的MLPerf基准测试中,H100成功创下8项测试纪录。如果按照当前的命名方式,下一代GeForce产品应该会成为GeForceRTX50系列的一员。
【新智元导读】黄老板又赢麻了!在最新的MLPerf基准测试中,H100成功创下8项测试纪录。如果迫不得已,英伟达还可以从旧的Turing版本中拿出一个产品,更新AdaLovelace,给它封个「Super」待遇,进一步扩展Ada阵容。ZhiyeLiu表示,至少今年或明年,Lovelace架构不会真正更新。
由慧与(HPE)为美国能源部旗下的国家可再生能源实验室(NREL)打造的 Kestrel 超级计算机,其规格已正式公布。在 NREL 于去年宣布了该计划之后,现在我们终于知晓它将采用 AMD 霄龙 Genoa、英特尔 Sapphire Rapids、以及英伟达 H100 加速器硬件,并且能够提供高达 44 PFLOPS 的算力。在三家科技巨头最新软硬件技术的加持下,Kestrel 旨在接替现有的 Eagle 超算。而在最近的一次会议上,HPE 首次揭示了这套超算系统的硬件规格。可知Kestrel 超算采用了标准节点 + 加速节点的组合方案,具有 44 PetaFlops 的峰值性能 —— 较 Eagle 超算提?
可知绿厂即将推出的 Hopper H100 GPU 将采用台积电 5nm 工艺,且大型单芯片内将容纳多达 144 组 SM(流处理器)单元...详细规格方面,假如 Hopper H100 GPU 与上一代 Turing 架构的规格保持一致,那每组 SM 单元或正好有 64 个 CUDA 核心 / 总计 9216 个...最后,与专注于消费游戏市场的 Ada Lovelace 衍生型号相比,Hopper H100 GPU 的 VRM 供电规模也相当惊人......