11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
英特尔发布了新一代人工智能芯片Gaudi3,引发了业界的广泛关注。Gaudi3的性能远超竞争对手英伟达的H100芯片,成为当前市场上最强大的AI芯片之一。这使得Gaudi3在AI领域的应用中具有出色的表现,特别适合处理大规模的深度学习模型。
在被大规模采用后,Sora的推理成本将很快超过训练成本。OpenAI推出的Sora模型能够在各种场景下生成极其逼真的视频,吸引了全世界的目光。视频内容的创意驱动了对OpenAI的Sora等模型最直接的需求。
日前,蔚来举办了150kWh首台量产电池包下线仪式,有网友晒出了下线仪式的现场照片。蔚来董事长李斌表示,目前,一代与二代平台的所有车型都已经完成了验证和公告,团队也进行了各种测试,续航里程等性能表现超过预期。对于蔚来车主来说,150kWh电池包上线之后,车辆的续航能力随之升级,有长途出行需求时,只需在换电站租赁150kWh电池包即可,可灵活选用。
微软工程师的爆料引发了广泛关注,透露GPT-6的训练计划不仅已启动导致大规模GPU集群的部署引发了电网崩溃的尴尬局面。这一事件凸显了AI训练对能源的巨大需求,与此同时,OpenAI内部消息的曝光也揭示了GPT-5和GPT-6的训练已经在进行中。解决这些挑战将需要全球范围内的合作与创新,以确保AI技术能够持续发展并造福人类社会。
据Factorial基金估计,OpenAI的Sora每小时在NVIDIAH100上生成5分钟的视频,相当于每天能生成120分钟的视频。报告进一步指出,为支持TikTok和YouTube的创作者社区,大约需要89,000个NVIDIAH100GPU。ChatGPT的创造者将于下周在洛杉矶与好莱坞制片厂、媒体高管和人才代理商会面,以在娱乐行业建立伙伴关系,并鼓励电影制作人将其新的AI视频生成器整合到他们的工作中。
【新智元导读】就在刚刚,老黄又来打破摩尔定律了:英伟达新核弹B200,一块能顶5个H100,30倍推理加速,能训万亿参数大模型!同时推出的AI推理微服务NIM,号称让全世界用上AI。就在刚刚结束的GTC人工智能大会上,英伟达的新一代性能巨兽Backwell诞生了!BlackwellB200GPU,是如今世界上最强大的AI芯片,旨在「普惠万亿参数的AI」。有了世界最强的处理器Blackwell,新一轮技术革命即将开启。
英伟达在GTC开发者大会上发布了最强AI加速卡BlackwellGB200,计划今年晚些时候发货。GB200采用新一代AI图形处理器架构Blackwell,其AI性能可达20petaflops,比之前的H100提升了5倍。英伟达的系统还可扩展至数万GB200超级芯片,具有11.5exaflops的FP4计算能力。
【新智元导读】LLM开源从Infra做起!Meta公布了自己训练Llama3的H100集群细节,看来Llama3快来了。每年3月份,照例各家大厂又要开始秀自己最新的产品和研究了。Meta的目标是创建灵活可靠的系统,以支持快速发展的新模式和研究。
最新发布的全球最强AI芯片WSE-3引起了行业的瞩目。该芯片采用了先进的4万亿晶体管5nm制程,拥有惊人的性能,单机可训练出24万亿参数的模型,远超英伟达H100GPU。这种技术进步将对整个AI产业产生深远的影响,加速了AI技术在各个领域的应用和发展。
3月13日,社交、科技巨头Meta在官网公布了两个全新的24KH100GPU集群,专门用于训练大模型Llama-3。Llama-3使用了RoCEv2网络,基于Tectonic/Hammerspace的NFS/FUSE网络存储,继续使用了PyTorch机器学习库。将Meta的Tectonic分布式存储解决方案和Hammerspace结合在一起,可以在不影响规模的情况下实现快速功能迭代。
英伟达团队推出了全新的模型Nemotron-4,150亿参数,在8Ttoken上完成了训练。值得一提的是,Nemotron-4在英语、多语言和编码任务方面令人印象深刻。这种能力凸显了Nemotron-415B对广泛的自然语言的深刻理解。
英伟达最新推出的Nemotron-4语言模型引起广泛关注。这一通用大模型拥有150亿参数,经过在8Ttoken上的训练,在英语、多语言和编码任务中表现出色。Nemotron-4的推出标志着英伟达在通用大模型领域的一次重要突破,为单个A100或H100GPU上运行的最佳通用大模型设定了新标准。
SemiAnalysis的行业专家对最近爆火的Groq推理系统进行了像素级的拆解,测算出其持有成本依然高达现有H100的10倍,看来要赶上老黄的步伐,初创公司还有很多要做。最近爆火的AI初创公司Groq,推出了比目前常见GPU推理系统快4倍,成本低70%的大模型推理解决方案。还有一个更为关键的问题,快速响应小型模型推理这个市场到底有多大,以至于值得抛下灵活的GPU不用,转去构建专门
近日,英伟达首次向外界公布了其最新的面向企业的AI超级计算机Eos,同时也是英伟达目前速度最快的AI超级计算机。Eos共配备了4608个英伟达H100GPU,同时还配备了1152个英特尔XeonPlatinum8480C处理器。英伟达表示,Eos整合了其在AI领域的专业技术和经验,是先前DGX超级计算机知识的结晶,可以帮助企业处理最具挑战性的项目,并实现AI目标。
【新智元导读】最近,外媒曝出SamAltman正计划筹集数十亿美元,为OpenAI建起全球性的半导体晶圆厂网络。GPT-5训练严重缺芯,OpenAI誓不让英伟达掌握主动权,干脆自己做新的AI芯片霸主?SamAltman正在筹集数十亿美元,建立一个全球性的半导体晶圆厂网络!这一事件背后的原因很可能就是,OpenAI已经无「芯」训练「GPT-5」了。如今到处奔走的Altman,能为建立晶圆厂筹到数十亿甚至数千亿美元的资金吗?能维持厂子的运营吗?目前我们只知道,他的举动有可能改变整个代工市场的格局。
为了通用人工智能的宏大目标,扎克伯格正在给Meta的AI研究部门进行大幅度的改组。Meta首席执行官马克・扎克伯格宣布,他的公司正在致力于为人工智能助手构建「通用智能」并「负责任地开源」,Meta正在将其两个主要研究小组合并在一起以实现这一目标。扎克伯格表示,Meta今年将推出一个新平台,让任何人都可以创建自己的人工智能角色,并将其分发到Meta的社交应用程序中,比如Facebook、Instagram和Threads。
NVIDIAAIGPU无疑是当下的硬通货,从科技巨头到小型企业都在抢。MetaCEO扎克伯格近日就透露,为了训练下一代大语言模型Llama3,Meta正在建造庞大的计算平台,包括将在今年底前购买多达35万块NVIDIAH100GPU。微软也是AMDInstinct的大客户。
【新智元导读】今天,小扎正式宣战「开源AGI」!下一代大模型Llama3正在训练,年底将拥有35万块H100,届时算力总和达60万块H100。为了追赶OpenAI,成立十年的FAIR团队纳入GenAI,全力奔赴AGI。这是一种令人愉悦的状态。
随着国产存储颗粒的高速发展,内存和固态硬盘价格逐渐稳定,正是新装机、配置升级的好时机。然内存条选择DDR4还是DDR5往往让人非常纠结。目前宏碁暗影骑士•龙DH100DDR43200MHz单条8GB内存条售价仅为129元,性价比非常突出,推荐选购。
小米汽车技术发布会于今日下午举办,会上,雷军正式发布了小米800V电池包。电池包是纯电车的基石,是核心部件,成本占到整车的40%-50%,并且影响着车辆的续航、安全、操控。小米还行业首创了电芯倒置技术”,可保证电芯在极端热失控情况下,快速向下释放热源,最大程度保证乘员舱安全。
【新智元导读】最近,两位哈佛辍学生共同创立的AI芯片公司,估值已达3400万美元,并计划明年交付一款名为「Sohu」的AI推理加速芯片——其LLM推理性能达到H100的10倍单价吞吐量更是高达140倍。像Pika一样的神级创业故事又要再次上演了?两位哈佛退学的年轻人,想要制造一款专用于大语言模型加速的AI加速器芯片,将于2024年第三季度交付,推理性能达H100的10倍。CerebrasSystems的CEO
【新智元导读】Inflection-2最新发布!性能碾压一众大厂模型,仅输一手GPT-4要集成到Pi?最近,InflectionAI发布了全新的一款AI模型。更炸裂的是InfectionAI对这款模型的评价——性能直超谷歌和Meta开发的两款模型,紧随OpenAI的GPT-4之后。真能充当心理咨询的角色呢。
Nvidia最近一个季度的收入显著增长,主要归功于其数据中心产品的销售。公司年度总收入增长超过200%,在180亿美元的收益中,有145亿美元来自其数据中心产品。市场规模预计将在2027年翻倍,从目前的1000亿美元增长到将近2000亿美元的总收入。
微软推出了全新的NDH100v5虚拟机系列,该系列配备了最新的NVIDIAH100TensorCoreGPU和NVIDIAQuantum-2InfiniBand网络。这款虚拟机具有AI超级计算GPU、新一代CPU、低延迟网络、优化主机到GPU的性能以及大规模的内存和内存带宽等特性,能够提供无与伦比的计算能力。大规模的内存和内存带宽:DDR5内存是该系列虚拟机的核心,提供更高的数据传输速度和效率,使它们成为处理大规模数据集工作负载的理想选择。
英伟达正式宣布推出其AIFoundry服务计划,这是一套包括英伟达AI基础模型、英伟达NeMo框架和工具,以及DGX云AI超级计算和服务的全方位解决方案,为企业打造和优化定制的生成式AI模型。英伟达AIFoundry服务将使通信和媒体提供商的领先软件和服务供应商Amdocs能够优化企业级大型语言模型,从在其业务范围内高效部署生成式AI用例,涵盖从客户体验到网络运营和配置。这些增强GPU�
在日前接受《金融时报》采访时,OpenAI首席执行官SamAltman表示,公司已经收到了备受期待的英伟达H100芯片订单,并预计不久后会收到更多。「明年在获取更多芯片方面看起来已经会更好」。更多芯片的采购还表明,该公司正在更接近于创造人工通用智能,即一种基本上能够完成人类能做的任何任务的AI系统。
英伟达Nvidia推出了H200,这是一款专为训练和部署生成式人工智能模型的图形处理单元。它基于NVIDIAHopper架构,具有先进的内存和处理能力,可处理海量的数据用于生成式AI和高性能计算工作负载。对于高性能计算应用,内存带宽对于提高数据传输速度、减少处理瓶颈至关重要。
H100再次在MLPerf中刷新了记录!英伟达超算NVIDIAEos在GPT-3模型的基准测试中,只用了3.9分钟就完成了训练。这比6月份的刷新记录的成绩——10.9分钟,提升了近3倍。为了遵守新规,HGXH20、L20PCle和L2PCleGPU不仅性能是残血的还只配备了残血版的NVLink连接。
在最新一轮MLPerf训练v3.1的结果中,尽管大部分成绩并不激动人心,但两个结果引人注目。NVIDIA使用MLPerf来展示其最新的霍珀一代超级计算机。NVIDIA试图展示它在图表上有一个更长的条形图,但在争取更长条形图的比赛中,它失去了规模效率,给了英特尔一个大胜利。
为了解决大型语言模型运行所需的GPU资源短缺问题,亚马逊AWS今日推出了AmazonElasticComputeCloudCapacityBlocksforML服务。该服务允许客户按照定义的时间购买NvidiaH100TensorCoreGPU资源,用于执行特定的AI相关任务,如训练机器学习模型或运行现有模型的实验。该新功能从今天开始在AWS美国东部区域提供。