11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
在美国硅谷圣何塞召开的NVIDIAGTC大会上,全球领先的向量数据库公司Zilliz发布了Milvus2.4版本。这是一款革命性的向量数据库系统,在业界首屈一指,它首次采用了英伟达GPU的高效并行处理能力和RAPIDScuVS库中新推出的CAGRA技术,提供基于GPU的向量索引和搜索加速能力,性能可提升50倍。关注Zilliz微信公众号,回复“北极星”可了解详情。
在整个AI算力硬件的搭建中,英伟达毫无疑问站在最顶端,其GPU的动态发展,直接关乎了行业的发展。在今天开幕的GTC2024上,黄仁勋带来了新的B200GPU,其拥有2080亿个晶体管,可提供高达20petaflops的FP4算力。”Blackwell平台能够在万亿参数级的大型语言模型上构建和运行实时生成式AI成本和能耗比前身低25倍。
【新智元导读】卷疯了!世界最快的大模型Groq一夜之间爆火,能够每秒输出近500个token。如此神速的响应,背后全凭自研的LPU。去年11月,当马斯克的同名AI模型Grok开始受到关注时,Groq的开发团队发表了一篇博客,幽默地请马斯克另选一个名字:不过,马斯克并未对两个模型名称的相似之处作出回应。
近日,英伟达首次向外界公布了其最新的面向企业的AI超级计算机Eos,同时也是英伟达目前速度最快的AI超级计算机。Eos共配备了4608个英伟达H100GPU,同时还配备了1152个英特尔XeonPlatinum8480C处理器。英伟达表示,Eos整合了其在AI领域的专业技术和经验,是先前DGX超级计算机知识的结晶,可以帮助企业处理最具挑战性的项目,并实现AI目标。
用AMD的软硬件系统也能训练GPT-3.5级别的大模型了。位于美国橡树岭国家实验室的全世界最大的超算Frontier,集合了37888个MI250XGPU和9472个Epyc7A53CPU。整个系统拥有602112个CPU核心,4.6PBDDR4内存。
OpenAI年收入破16亿美元,美股更是一片大好,以科技股为主的纳斯达克指数年底暴涨涨了43%。2023年即将落幕,2024年AI行业又将迎来来怎样的巨变?2023年对于科技行业来说,无疑是疯狂的一年。用2023年大事件一览图收尾。
英伟达官方盘点2023年10大研究,从CV到AI,从智能体到生成式AI。英伟达不但现实世界中用GPU收割全世界,也在虚拟世界中用一项项匪夷所思的技术展开了一场革命。在这个框架中,研究人员训练了一组专家降噪器,专门用于在生成过程的不同间隔中进行降噪,从提高合成能力。
国外媒体最新报道显示,微软计划在2024年通过采购大量英伟达最新款AI加速芯片B100,来最大化提升其AI计算性能。此前微软已订购了15万颗英伟达H100芯片,但考虑到B100的计算力预计可达H100的两倍以上,微软决定将部分H100订单转移至新款B100芯片。微软抢购B100可以看作是这一竞争的最新回应。
Nvidia最近一个季度的收入显著增长,主要归功于其数据中心产品的销售。公司年度总收入增长超过200%,在180亿美元的收益中,有145亿美元来自其数据中心产品。市场规模预计将在2027年翻倍,从目前的1000亿美元增长到将近2000亿美元的总收入。
在最新一轮MLPerf训练v3.1的结果中,尽管大部分成绩并不激动人心,但两个结果引人注目。NVIDIA使用MLPerf来展示其最新的霍珀一代超级计算机。NVIDIA试图展示它在图表上有一个更长的条形图,但在争取更长条形图的比赛中,它失去了规模效率,给了英特尔一个大胜利。
英伟达正在提升RTX20系列GPU用户的游戏体验,一款新的GPU驱动程序现在允许这些较旧的RTXGPU使用RTXVideoSuperResolution技术来提高旧视频的清晰度。在最新的博客文章中,英伟达确认RTXVideoSuperResolution现在支持RTX20系列显卡,包括RTX2080Ti和RTX20Super系列。在这一宣布之前,英伟达在FAQ页面中解释说,RTXVideoSuperResolution在发布时不支持RTX20系列显卡,因为「RTXVideoSuperResolution的许多算法需要为这些20系列GPU进行重构」。
由于人工智能需求的大幅增加,英伟达计划将其下一代BlackwellB100GPU的发布日期从2024年第四季度提前到2024年第二季度。该公司预计将使用SK海力士的HBM3eDRAM来驱动其最新的芯片。这表明英伟达正在加快其AIGPU的步伐,希望在未来几年继续保持领先地位。
根据知名分析师郭明錤分享的最新洞察,到2024年和2025年,AMD的AI芯片出货量将会大幅增长。郭明錤的研究表明,到2024年,AMD的AI芯片出货量预计将占到英伟达出货量的约10%。如果微软与AMD的合作进展顺利,AMD获得Meta和谷歌的订单,预计2025年AMD的AI芯片出货量将大幅达到英伟达的30%或更多。
【新智元导读】有分析公司算出来,才三个月英伟达就卖出了800多吨H100。然市值已超万亿的英伟达,竟是一个「无计划、无汇报、无层级」的公司。业内专家曾称,英伟达H100的利润率接近1000%。
市场研究公司Omdia披露,2023年第二季度,英伟达出货了900吨H100AIGPU。Omdia认为,一个带有散热器的H100GPU的平均重量超过3公斤,因此英伟达在第二季度出货了30多万块H100。Omida的最新报告显示,该公司有望达到这一里程碑。
MLPerf作为业界公认的AI系统性能基准测试,最近发布了3.1版本。英伟达最新发布的GH200GraceHopper超级芯片首次在公开基准中亮相。未来的软件优化将进一步释放这些模块中的英伟达OrinSoC的强大潜力。
关键词:Transformer;PLM;SLM;NLM;LLM;Galactica;OPT;OPT-IML;BLOOM;BLOOMZ;GLM;Reddit;H100;H800;A100;A800;MI200;MI250;LaMA;OpenAI;GQA;RMSNorm;SFT;RTX4090;A6000;AIGC;CHATGLM;LLVM;LLMs;GLM;AGI;HPC;GPU;CPU;CPUGPU;英伟达;Nvidia;英特尔;AMD;高性能计算;高性能服务器;蓝海大脑;多元异构算力;大模型训练;通用人工智能;GPU服务器;GPU集群;大模型训练GPU集群;大语言模�
伴随着2024财年第二季度财报的发布,NVIDIA的市值再创历史新高,盘中一度逼近1.2万亿美元,最新报收1.16万亿美元,相当于8个Intel、7个AMD。NVIDIA将于2023年9月28日向2023年9月7日在册的所有股东支付每股0.04美元的下一季度现金红利。
英伟达日前发布了全新的NVIDIAL40SGPU,以及搭载该加速卡的NVIDIAOVX服务器系统。这款全新的GPU和OVX服务器适用于人工智能大模型训练和推理、三维设计和可视化、视频处理、工业数字化等多种用途。这些服务器将有助于推动人工智能的发展和应用。
GPT-5的训练,需要5万张H100加持。英伟达GPU已成为各大AI公司开发大模型的首选利器。但无论你怎么看,英伟达就是堡垒里的绿色国王。
快科技8月7日消息,得益于人工智能的火爆,英伟达的业绩也是开始进入爆发期,所以还指望他们对显卡降价的,真不现实了。据外媒最新消息称,英伟达将于8月23日公布截至7月30日的2023财年第三财季财报,而从目前公司内部传出的消息看,这一季度业绩好到不行。至于接下来英伟达更多的发展动向,8月8日晚老黄也将在SIGGRAPH年度会议发表演讲。研究机构ALETHEIA对英伟达的业绩给出了乐观预期,将其目标股价设为1000美元,而该公司目前的股价仅为446.80美元。尽管目前以及可预见的未来,AI服务器的渗透比例还不足5%,但是机构预计2024年AI服务器
据英伟达官方网站公告,亚马逊云现已正式推出由英伟达H100TensorCoreGPU驱动的全新AmazonElasticComputeCloudP5实例。通过架构创新,NVIDIAH100GPU提供了超级计算级别的性能,包括第四代TensorCores、用于加速LLMs的新Transformer引擎以及最新的NVLink技术,可提供出色的性能。这些神经网络驱动着最复杂和计算密集型的生成式人工智能应用程序,例如问答、代码生成、视频和图像生成以及语音识别等。
英伟达还在准备新版的RTX4070和RTX4060,不过GPU的核心有所调整,那么售价进一步走低的话,你会购买吗?按照爆料人kopite7kimi的说法,英伟达会用一些低等级的AD103和AD106GPU打造新版的RTX4070和RTX4060。现在问题来了,你会为新款RTX4070和RTX4060买单吗?
AWS用户现在可以访问AI训练和推理领域业界基准测试中展示的领先性能。图片来自NVIDIA这家云计算巨头正式推出了由英伟达H100TensorCoreGPU提供支持的新AmazonEC2P5实例。该软件可在AWSMarketplace上获得,提供持续的安全监控、定期修补常见漏洞、API稳定性、企业支持以及访问英伟达AI专家的机会。
人工智能初创公司InflectionAI打造了一台先进的超级计算机,配备了22,000块英伟达H100GPU,这一数量惊人,带来了巨大的计算性能。InflectionAI的超级计算机预计将成为行业中规模最大的之一,仅次于AMD的Frontier。通过这台超级计算机,AI模型「Inflection1」有望在编码任务方面显著改进,因为该公司在这方面落后。
【新智元导读】黄老板又赢麻了!在最新的MLPerf基准测试中,H100成功创下8项测试纪录。如果迫不得已,英伟达还可以从旧的Turing版本中拿出一个产品,更新AdaLovelace,给它封个「Super」待遇,进一步扩展Ada阵容。ZhiyeLiu表示,至少今年或明年,Lovelace架构不会真正更新。
前不久英伟达发布了RTX4060系列显卡,主要有RTX4060Ti16GB、RTX4060Ti8GB及RTX40608GB三款,售价3899、3199及2399元起。其中RTX4060Ti8GB此前已经上市,今晚英伟达又确认RTX40608GB显卡将于6月29日上市,目前已经接受预定。更重要的是,RTX4060显卡的功耗也低了很多,大约只有RTX3060的7成,发热、噪音之类的指标也会从中受益,总之1080p新战神来了,2399元的价格也将RTX40显卡价位拉到主流市场。
国产GPU厂商沐曦今天宣布,该公司自主研发的曦云MXC500系列GPU成功点亮,只用了5个小时就完成了芯片功能测试。曦云MXC系列是该公司研发的用于AI训练及通用计算的GPU芯片,其中MXC500是沐曦对标A100/A800的算力芯片,FP32浮点性能可达15TFlops,作为对比的是A100显卡FP32性能19.5TFLOPS。去年的采访中,该公司提到了公司的新一代GPU会使用7nm甚至5nm工艺,但没有明确的消息2025年沐曦将有融合了图形渲染的完整GPU产品面市,也就是要做游戏卡。
中国拥有云计算业务的互联网巨头们在今年春节后向英伟达公司下了大量订单。字节公司订购的GPU数量超过10亿美元,包括A100和H800型号,已到货和未到货的都有。字节公司的A100数最多,如果不算今年的新增订单,字节公司A100和前代产品V100的数量总计已接近10万块。
英伟达一出手,3D建模师都馋哭了。制作一个纹理超细致的大卫3D模型,需要几步?刚刚靠着AI,市值一度飚破万亿美元的英伟达给出最新答案:给AI投喂一段普通视频,它就能自动搞定。他还曾在Meta的RealityLabs实习。