11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
美东时间周三盘后,人工智能领域的领军企业英伟达公布了其2025财年第三财季的财报。英伟达在该季度的营收达到了350.8亿美元,同比大幅增长94%,超出了分析师预计的331亿美元。在过去一年中,英伟达的股价实现了显著增长,市值从2023年11月的1.11万亿美元增长至一年后的3.58万亿美元,超越了苹果和微软,成为全球市值最高的公司。
LLM若想高速推理,现如今,连GPU都无法满足了?曾造出世界最大芯片公司Cerebras,刚刚发布了全球最快的AI推理架构——CerebrasInference。运行Llama3.18B时,它能以1800token/s的速率吐出文字。值得注意的是,在Cerebras上跑的Llama3.1,上下文只有8k……相比之下,其他平台都是128K。
【新智元导读】多年来,马斯克一直在公开谈论Dojo——这台超算将成为特斯拉人工智能雄心的基石。他最近表示,随着特斯拉准备在10月推出Robotaxi,AI团队将「加倍投入」Dojo。但一旦成功,也可以释放巨大红利。
SFCompute是一家位于硅谷的初创公司,旨在通过其平台为小型企业提供所需的AI算力资源。该公司推出了算力租赁服务,使用户能够以较低成本获取所需资源,短时间内使用大量计算能力。资金将用于建立交易平台,并计划在未来一年内将其工程人员规模增加一倍。
快科技7月7日消息,据媒体报道,行业分析师指出,即便在更为严苛的市场限制条件下,H20计算卡依然展现出强劲的销售潜力,深受客户青睐。据预测,英伟达有望在2024年向中国市场供应超过百万块H20计算卡,这一数字彰显了其市场认可度。具体而言,每块H20计算卡的定价区间稳定在1.2万至1.3万美元之间(折合人民币约为87,220元至94,489元),基于这一价格预估,其总销售额有望突破120亿美元大关,这一数字将显著超越英伟达上一个财年在中国的总收入,彰显出巨大的市场价值。值得注意的是,国内众多科技企业长期以来依赖英伟达CUDA生态系统构建
快科技7月2日消息,因涉嫌违反公平竞争,多地监管机构盯上英伟达。据报道,法国的反垄断监管机构可能指控英伟达公司存在违反公平竞争原则的行为。据悉,法国监管机构最担忧的问题就是英伟达的CUDA芯片编程软件,它是唯一和英伟达GPU芯片百分百兼容的软件,而GPU又是现在各大科技公司想要训练模型、提升计算能力必不可少的硬件。随着程序员们逐渐习惯且依赖英伟达的CUDA软件,原本不少分析师都认为CUDA是英伟达的护城河”,但现在监管机构却认为,这在某种程度上违反了公平竞争行为。自从英伟达成为生成式AI热潮的最大受益者之后,它就引起
在美国硅谷圣何塞召开的NVIDIAGTC大会上,全球领先的向量数据库公司Zilliz发布了Milvus2.4版本。这是一款革命性的向量数据库系统,在业界首屈一指,它首次采用了英伟达GPU的高效并行处理能力和RAPIDScuVS库中新推出的CAGRA技术,提供基于GPU的向量索引和搜索加速能力,性能可提升50倍。关注Zilliz微信公众号,回复“北极星”可了解详情。
在整个AI算力硬件的搭建中,英伟达毫无疑问站在最顶端,其GPU的动态发展,直接关乎了行业的发展。在今天开幕的GTC2024上,黄仁勋带来了新的B200GPU,其拥有2080亿个晶体管,可提供高达20petaflops的FP4算力。”Blackwell平台能够在万亿参数级的大型语言模型上构建和运行实时生成式AI成本和能耗比前身低25倍。
【新智元导读】卷疯了!世界最快的大模型Groq一夜之间爆火,能够每秒输出近500个token。如此神速的响应,背后全凭自研的LPU。去年11月,当马斯克的同名AI模型Grok开始受到关注时,Groq的开发团队发表了一篇博客,幽默地请马斯克另选一个名字:不过,马斯克并未对两个模型名称的相似之处作出回应。
近日,英伟达首次向外界公布了其最新的面向企业的AI超级计算机Eos,同时也是英伟达目前速度最快的AI超级计算机。Eos共配备了4608个英伟达H100GPU,同时还配备了1152个英特尔XeonPlatinum8480C处理器。英伟达表示,Eos整合了其在AI领域的专业技术和经验,是先前DGX超级计算机知识的结晶,可以帮助企业处理最具挑战性的项目,并实现AI目标。