首页 > 业界 > 关键词  > Nemotron-4最新资讯  > 正文

英伟达发布Nemotron-4:150亿参数通用大模型,目标单张A100/H100可跑

2024-02-29 14:43 · 稿源:站长之家

**划重点:**

1. 🌐 Nemotron-4是英伟达最新通用大模型,拥有150亿参数,在各语言和编码任务中表现出色。

2. 💡 该模型采用Chinchilla模型的「缩放定律」,通过优化计算预算、数据和模型大小实现性能提升。

3. 🔥 在多领域下游评估中,Nemotron-415B超越同等参数规模的模型,甚至击败4倍大的模型,成为最强通用语言模型。

站长之家(ChinaZ.com)2月29日 消息:英伟达最新推出的Nemotron-4语言模型引起广泛关注。这一通用大模型拥有150亿参数,经过在8T token上的训练,在英语、多语言和编码任务中表现出色。具体而言,Nemotron-4在7个评估基准上的15B模型表现优异,超越同等参数规模的模型,甚至击败了4倍大的模型。

image.png

该模型的设计灵感来自Chinchilla模型的「缩放定律」,该定律强调在给定固定计算预算的情况下,同时优化数据和模型大小。与过去主要关注模型大小不同,这一研究强调将计算分配给更多数据的训练,以降低延迟和服务模型所需的计算量。因此,Nemotron-4的主要目标是打造一个能在单个英伟达A100或H100GPU上运行的最佳「通用大模型」。

在架构方面,Nemotron-4采用了标准的纯解码器Transformer架构,并带有因果注意掩码。核心超参数包括32亿个嵌入参数和125亿个非嵌入参数。在数据方面,研究人员使用了包含8万亿个token的预训练数据集,分为英语自然语言数据(70%)、多语言自然语言数据(15%)和源代码数据(15%)。

为了实现这一庞大模型的训练,Nemotron-4使用了384个DGX H100节点,每个节点包含8个英伟达H10080GB SXM5GPU。在16位浮点(bfloat16)算术下,每个GPU的峰值吞吐量为989teraFLOP/s。研究人员通过张量并行和数据并行的组合进行训练,并使用了分布式优化器。

在下游评估中,Nemotron-4在各领域均表现强劲,特别是在常识推理、热门综合基准和数学、代码任务上。该模型在多语言分类和生成任务中也实现了最佳性能,展现了其在不同语言的卓越理解能力。值得注意的是,Nemotron-4在机器翻译任务中取得了显著的进展,不仅在中文翻译成英文方面表现出色,而且在中文直接翻译成其他语言方面也取得了印象深刻的效果。

image.png

Nemotron-4的推出标志着英伟达在通用大模型领域的一次重要突破,为单个A100或H100GPU上运行的最佳通用大模型设定了新标准。

论文地址:https://arxiv.org/abs/2402.16819

举报

  • 相关推荐
  • AI日报:多模态大模型DeepSeek V4即将发布;谷歌即将停用Gemini 3 Pro Preview;微软推出AI软件组合

    本期AI日报聚焦行业动态:谷歌将停用Gemini 3 Pro Preview,开发者需迁移至3.1版本;DeepSeek V4发布,支持多模态生成并与华为、寒武纪合作优化硬件;微软计划推出AI软件组合,月费或高达99美元;爱奇艺财报显示利润下滑,将押注AI电影制作与去中心化转型;壁仞智能完成数亿元融资,深化端侧AI布局;英伟达将发布集成Groq技术的推理处理器,巩固市场地位;联想展示模块化AI PC概念,提升用户体验;我国发布首个国家级人形机器人标准体系,推动产业高质量发展。

  • 联想moto首款大折叠!moto razr fold国行暂定第二季度发布

    联想旗下摩托罗拉在MWC 2026上发布首款大折叠屏手机moto razr fold。该机外屏6.6英寸165Hz OLED,内屏8.1英寸2K 120Hz,均通过Pantone色彩认证。搭载骁龙8 Gen5处理器,配备16GB内存与最高1TB存储,内置6000mAh电池,支持80W有线与50W无线充电。影像采用5000万像素三摄,含索尼LYTIA 828主摄与潜望长焦。机身展开厚度约4.6mm,折叠后约9.9mm,重244g,支持IP48/49防尘防水。国行版预计2026年第二季度发布,海外版将率先登陆欧洲,捆绑手写笔售价1999欧元(约1.6万元人民币)。

  • 小度全产品矩阵亮相 AWE,看大模型时代如何让 AI 真正走进千家万户

    3月12日,中国家电及消费电子博览会(AWE2026)将在上海开幕。作为行业领先的AI助手硬件品牌,小度科技将首次携全系产品矩阵亮相,展示其“场景+AI+硬件”战略的落地成果。从智能音箱、智能屏到AI眼镜、智能摄像头等硬件,以及AI酒店、AI养老等行业解决方案,小度将呈现一个完整的AI生态。这一切的背后,是2025年底升级的“超能小度”——基于大模型打造的多模态AI智能助手,让小度产品真正具备了“看见”世界、“思考”需求的能力。在AWE现场,观众将有机会亲身体验多模态AI如何重塑家庭看护、随身办公、智能交互等场景。小度正以实际行动回答:大模型时代,AI应如何走进千家万户。

  • 无人机编队新标杆|高巨创新 EMO PLUS 定价 5388 元 / 单电版开启预订

    高巨创新EMO PLUS无人机正式发布,定价1000架起订,专为专业级编队表演设计。该产品以科技点亮夜空创意,提供全新选择,满足大型演出需求。

  • MWC首秀即焦点!讯飞AI眼镜携多模态同传大模型革新智能穿戴体验

    在2026年世界移动通信大会(MWC)上,科大讯飞以“AI Connecting Ideas”为主题,首次全球亮相其AI眼镜。该产品集多模态同传翻译与极致轻量化设计于一身,凭借领先的多模态降噪、全能翻译及多模态记录功能,吸引了众多海外运营商、技术伙伴及专业媒体的关注。其创新的唇动识别多模态降噪方案,通过摄像头捕捉说话者唇部运动,融合骨传导麦克风捕捉佩戴者声音,将音视频两路信息融合处理,在多人交谈的嘈杂背景中精准锁定目标讲话人,将语音识别和翻译的准确率提升50%以上。整机重量仅40克,相比当前市面主流同类产品重量降低了约20%,是目前全球最轻的双目单色显示多模态智能眼镜。此外,讯飞AI眼镜还具备多模态记录功能,能自动智能生成图文声并茂的会议纪要,覆盖信息记录和总结的全流程,为跨国商务人群提升工作效率。讯飞AI眼镜于北京时间3月4日上午10:10在国内电商开启预约。

  • 实测OpenClaw中文版Molili自定义大模型:这才是真·AI智能体

    本文介绍了OpenClaw中文版Molili,一款能真正执行任务的桌面AI智能体。它解决了传统AI“只会说不会做”的痛点,通过微信等平台直接下达指令,即可自动操作电脑完成查找文件、发送文档等任务。核心亮点包括:支持自定义接入各类大模型,打破模型绑定;提供8000+现成技能,覆盖办公、编程、生活等场景;注重安全与隐私,设有操作权限管控和本地数据处理机制;对中文指令和国产生态有深度优化。

  • ​别再盲目做 AI 营销了!这款 GEO监控工具,撕开了大模型引用的“黑盒”

    本文探讨了生成式引擎优化(GEO)的重要性,并介绍了AIBase推出的GEOBase平台。文章指出,当前品牌营销的关注点已从传统SEO转向GEO,即如何让品牌在AI搜索结果中获得更高可见度。GEOBase平台通过曝光趋势、引用来源、情感得分等核心功能,帮助品牌监测在各大AI平台(如DeepSeek、豆包等)中的表现,并提供数据驱动的优化策略。文章以3C品牌为例,展示了如何利用该工具分析竞争格局、优化内容投放,从而提升品牌在AI语境下的影响力。最后,文章强调GEO是算法时代的精密计算,而GEOBase为品牌提供了关键的“体检报告”和作战地图。

  • OpenClaw中文版Molili开放自定义大模型接入 国产AI智能体再突破

    3月5日,OpenClaw中文版Molili正式上线自定义接入大模型功能。该产品以极致自由度、全链路本土化适配与零门槛操作为特点,为个人及企业用户提供全新AI自动化解决方案,推动桌面AI智能体从“对话交互”向“落地执行”深度转型。核心亮点包括自定义大模型接入、全场景使用自由,支持企业无缝接入私有模型,个人用户可自主选择偏好模型,打破传统AI工具模型绑定限制。产品突破“重对话、轻执行”行业痛点,实现真实电脑端操作,覆盖文件处理、信息搜索等重复性任务,支持微信、钉钉等多平台远程指挥,并搭载8000+技能矩阵,全方位保障用户隐私与数据安全。

  • 忆联UH812a以极致存力破局大模型载入瓶颈,释放算力潜能

    随着大模型技术规模化落地,AI应用的实时性正成为企业竞争力的核心。然而,在算力持续升级的同时,模型从存储层加载至计算单元的环节却日渐成为制约系统效率与弹性的关键瓶颈。缓慢或波动的加载过程,不仅会导致昂贵算力资源的闲置,更直接影响业务响应质量。由此可见,构建高效、稳定的数据供给通道,已成为AI基础设施演进的关键方向。为验证企业级SSD在真实AI�

  • 2026年GEO优化公司评测对比:基于AI大模型“认知友好度”的五维战力排位赛

    本文基于AI大模型底层逻辑,首创“AI认知友好度五维评估体系”,深入剖析了六家头部GEO服务商如何帮助企业从“被看见”跨越到“被信任”。报告指出,传统搜索引擎的“蓝色链接”霸权正在瓦解,企业竞争焦点已从“如何被百度收录”转向“如何让AI在生成答案时优先推荐我”。通过量化评估发现,数据一致性、多模态对齐和鲁棒性成为AI时代营销的三大铁律。报告为不同企业提供了选型建议,并强调GEO优化已成为品牌在AI时代保持“存在感”的战略投资。

今日大家都在搜的词: