11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
英伟达发布开源Llama-Nemotron系列模型,性能超越DeepSeek-R1。该系列包含三个版本:8B、49B和253B参数模型,其中253B的Ultra版本在推理吞吐量和内存效率上表现突出。关键技术包括:1)采用神经架构搜索优化模型结构;2)通过知识蒸馏和持续预训练提升性能;3)结合合成数据监督微调;4)在STEM领域进行大规模强化学习训练。Ultra版本在GPQA基准测试中达到开源模型最高水平,单节点8xH100即可高效运行。模型创新性支持"推理开关"功能,通过指令动态切换推理模式。训练流程包含五阶段优化,最终模型在数学推理和通用任务上均表现优异,部分基准超越专有模型。
AI不过周末,硅谷也是如此。Llama家族上新,一群LIama4就这么突然发布了。太平洋这头,已经开始落地应用和智能体了。
去年,一家名为GPUPurse的厂商将一块古老的入门级显卡GT730,做成了背包,保留PCB和芯片、元件,作为包包的一侧风扇安装在另一侧,要价达1024美元,折合约7300元人民币。如果你觉得GT730逼格太低,他家又做了一个高大上的,这次用的是AI领域常用的高端GPUH100。不知道他家的下一款作品,会对谁下手呢?
AI的物质基础是机器学习硬件,例如图形处理单元和张量处理单元。目前全球超过140款AI加速器,用于开发和部署深度学习时代的机器学习模型。https://epoch.ai/data/machine-learning-hardware-documentation#overview详细数据分析流程,参见下列NoteBook。
今晚美股开盘后,中国自动驾驶公司文远知行股价一度涨至41.1美元,大涨139.41%,股价翻倍。截止当前发稿,文远知行股价为32.5美元,涨幅89.28%,总市值为89.21亿美元。作为全球Robotaxi第一股,其主营业务为从L2到L4级的自动驾驶产品和服务,产品包括自动驾驶出租车Robotaxi、自动驾驶小巴Robobus、自动驾驶货运车Robovan、自动驾驶环卫车Robosweeper、高阶智能驾驶ADAS等。
对于需要直接控制硬件,需要更强性能的AI开发者来讲,DigitalOcean已经为你们准备好了更适合的GPU服务器——DigitalOcean基于NVIDIAGPU的裸金属服务器。这些服务器特别设计用来应对最复杂的AI和机器学习任务,无论是大规模的模型训练还是高度定制的基础设施设置,都能轻松胜任。如需预约测试裸金属GPU服务器,咨询更多相关信息,可联系DigitalOcean中国区独家战略合作伙伴卓普云。
海外知名云服务供应商DigitalOcean现已推出了搭载NVIDIAH100GPU的GPUDroplets云服务器。借助GPUDroplets,AI创业公司、开发者可以以更低的前期开发成本轻松地进行大语言模型训练、开发AIGC项目,以及开展人工智能相关的业务,并且无需面对复杂服务端开发与维护问题。为了更好地服务中国区的企业,DigitalOcean中国区独家战略合作伙伴卓普云AIDroplet将为中国区的企业提供商务咨询、技术支持等服务。
【新智元导读】两天前,马斯克得意自曝:团队仅用122天,就建成了10万张H100的Colossus集群,未来还会扩展到15万张H100和5万张H200。此消息一出,奥特曼都被吓到了:xAI的算力已经超过OpenAI了给员工承诺了价值2亿期权,这是要上天?马斯克的xAI一路狂飙突进,把SamAltman都整怕了!就在9月3日,马斯克在推上得意自曝:团队仅仅用了122天时间,就建成了有10万张H100的Colossus集群,是世界上
LLM若想高速推理,现如今,连GPU都无法满足了?曾造出世界最大芯片公司Cerebras,刚刚发布了全球最快的AI推理架构——CerebrasInference。运行Llama3.18B时,它能以1800token/s的速率吐出文字。值得注意的是,在Cerebras上跑的Llama3.1,上下文只有8k……相比之下,其他平台都是128K。
《黑神话:悟空》目前媒体评测、口碑已经解禁,目前来看除了部分瑕疵之外,这是一部堪称神作”的国产大作。英伟达也与其建立了深厚的合作,甚至下周还会为该作专门发布新版驱动,支持全景光线追踪和DLSS3,可使用帧生成技术获得超高画面和帧率。玩家下周可前往NVIDIAappBeta版、GeForceExperience或GeForce.cn,下载并安装最新版的NVIDIAGameReady驱动。