首页 > 业界 > 关键词  > Nemotron-4最新资讯  > 正文

英伟达发布Nemotron-4 15B: 8 万亿训练数据,性能超LLaMA-2

2024-03-07 08:48 · 稿源:站长之家

**划重点:**

1. 🌐 Nemotron-415B拥有150亿参数,基于8万亿文本标注数据预训练,在多领域测试中超越同类大小的开源模型,尤其在代码语言准确率上表现出色。

2. 🧠采用标准Transformer架构,结合自注意力、全局注意力和多头注意力等机制,以及旋转位置编码技术,提升模型表达和泛化能力。

3. 🌐 利用384个DGX H100节点,每节点搭载8个NVIDIA Hopper架构的H10080GB SXM5GPU,采用8路张量并行和数据并行的组合,以及分布式优化器进行分片。

站长之家(ChinaZ.com)3月7日 消息:英伟达最新推出的大型语言模型Nemotron-415B,以其卓越性能和创新架构引起广泛关注。该模型拥有150亿参数,基于庞大的8万亿文本标注数据进行了预训练。

在多领域测试中,Nemotron-415B在7个领域中的4个表现优异,超越了同类大小的开源模型。特别值得注意的是,在代码语言方面,Nemotron-415B展现出更高的准确率,尤其在资源稀缺的编程语言上超过了Starcoder和Mistral7B等模型。

该模型采用了标准的Transformer架构,包括多头自注意力机制和前馈神经网络。其独特之处在于,Nemotron-415B结合了自注意力和全局注意力机制,以更好地理解输入序列内部的依赖关系和输入序列与输出序列之间的对应关系。多头注意力的引入进一步提高了模型的表达能力和泛化能力。

在训练过程中,研究人员充分利用了384个DGX H100节点,每个节点搭载8个基于NVIDIA Hopper架构的H10080GB SXM5GPU。通过8路张量并行和数据并行的组合,以及分布式优化器进行分片,成功完成了Nemotron-415B的训练。

Nemotron-415B在英语、数学推理、多语言分类和代码等多个测试任务中表现出色,不仅在性能上超越了LLaMA-234B和Mistral7B,在广泛的代码语言中也取得了更高的准确率。这一成就为大型语言模型的发展和应用提供了崭新的视角。

image.png

技术报告https://arxiv.org/abs/2402.16819

举报

  • 相关推荐
  • 英伟达四季度营收681亿美元:同比暴增73%

    英伟达公布截至1月25日的第四季度业绩报告,营收与净利润均远超市场预期,展现强劲增长势头。第四季度营收达681亿美元,同比增长73%,超过预期的656.84亿美元;净利润从去年同期的221亿美元增至430亿美元,盈利能力显著提升。数据中心部门作为核心业务板块,营收达623亿美元,同比增长75%,同样超出预期的606.2亿美元,巩固了其在营收结构中的主导地位。英伟达预计第一季度营收将达780亿美元,远超分析师预期的726亿美元。

  • 联想moto首款大折叠!moto razr fold国行暂定第二季度发布

    联想旗下摩托罗拉在MWC 2026上发布首款大折叠屏手机moto razr fold。该机外屏6.6英寸165Hz OLED,内屏8.1英寸2K 120Hz,均通过Pantone色彩认证。搭载骁龙8 Gen5处理器,配备16GB内存与最高1TB存储,内置6000mAh电池,支持80W有线与50W无线充电。影像采用5000万像素三摄,含索尼LYTIA 828主摄与潜望长焦。机身展开厚度约4.6mm,折叠后约9.9mm,重244g,支持IP48/49防尘防水。国行版预计2026年第二季度发布,海外版将率先登陆欧洲,捆绑手写笔售价1999欧元(约1.6万元人民币)。

  • 无人机编队新标杆|高巨创新 EMO PLUS 定价 5388 元 / 单电版开启预订

    高巨创新EMO PLUS无人机正式发布,定价1000架起订,专为专业级编队表演设计。该产品以科技点亮夜空创意,提供全新选择,满足大型演出需求。

  • 大折叠赛道又有新玩家加入!moto Razr Fold发布:参数拉满 16100元

    自2020年进军折叠屏领域以来,moto品牌一直深耕于小折叠形态,并取得了极为亮眼的成绩。凭借出色的产品力,moto曾连续多个季度蝉联全球小折叠市场的销量冠军。 根据权威市场研究机构IDC公布的数据,2025年第一季度,联想moto razr凭借高达40.4%的市场份额,稳居全球小折叠手机销量第一的宝座,展现了其强大的市场号召力。 如今,moto决定不再局限于小折叠市场,开始正式向

  • AI日报:多模态大模型DeepSeek V4即将发布;谷歌即将停用Gemini 3 Pro Preview;微软推出AI软件组合

    本期AI日报聚焦行业动态:谷歌将停用Gemini 3 Pro Preview,开发者需迁移至3.1版本;DeepSeek V4发布,支持多模态生成并与华为、寒武纪合作优化硬件;微软计划推出AI软件组合,月费或高达99美元;爱奇艺财报显示利润下滑,将押注AI电影制作与去中心化转型;壁仞智能完成数亿元融资,深化端侧AI布局;英伟达将发布集成Groq技术的推理处理器,巩固市场地位;联想展示模块化AI PC概念,提升用户体验;我国发布首个国家级人形机器人标准体系,推动产业高质量发展。

  • 首款机器人手机!荣耀Robot Phone上手:摄像头竟会跳舞

    在MWC世界移动通信大会上,荣耀发布了一款极具话题性的前瞻产品旗下首款机器人手机Robot Phone,李杰灵在现场亲自展示了这款手机与众不同的设计与功能。 该机最大的创新点在于背部配备了一个灵动的机械臂摄像头,这颗摄像头不再是死板的固定组件,而是能够根据用户的位置、场景的变化以及具体的任务意图,主动且精准地调整拍摄视角。 此外,Robot Phone还被赋予了强大�

  • “涨听版”来了:TicNote Pods金融投研版发布

    出门问问发布全球首款4G+AI录音耳机TicNote+Pods中国版。该产品内置4G模块与“Shadow AI”双引擎,摆脱对手机和Wi-Fi的依赖,实现独立联网与AI处理。它支持双通道录音,适用于线上线下混合会议场景,并能通过云端协作构建个人及团队知识库。同时,公司与金融AI应用Alpha派合作推出金融投研版“涨听”,将独立AI能力注入投研场景,开启“独立AI终端”新纪元。

  • 云电脑一键部署OpenClaw(原Moltbot、Clawdbot)

    本文介绍了如何通过移动云云电脑快速部署开源AI智能体OpenClaw(原Moltbot/Clawdbot)。用户仅需三步即可上手:首先,在移动云官网选购支持OpenClaw镜像的云电脑实例;其次,通过云电脑客户端连接并初始化配置OpenClaw;最后,可将其接入飞书等IM应用进行交互。文章详细说明了通过营销订购、介绍页订购或一键切换镜像三种具体购买与部署方式,帮助用户快速体验其文件解析、命

  • 云电脑OpenClaw(原Moltbot、Clawdbot)飞书接入实践

    本文介绍了在移动云电脑中部署OpenClaw后集成飞书机器人的步骤。首先,在飞书开放平台创建企业自建应用,获取App ID和App Secret,并添加机器人能力。其次,通过命令行配置OpenClaw的飞书通道,重启服务。接着,在飞书平台配置机器人权限,添加“接收消息”事件并开通权限,完成应用发布。最后,在飞书客户端通过“开发者小助手”打开应用,即可开始与AI助手对话。

  • 全球首款机器人手机来了!荣耀ROBOT PHONE今年量产:机圈新物种

    荣耀将在MWC2026大会上展示全球首款机器人手机ROBOT+PHONE,该产品并非概念机,而是可量产机型,最快有望今年8月上市。其核心搭载自研YOYO端侧大模型,能通过摄像头与传感器实时感知环境,主动提供护眼提醒、行程同步等智能服务。此外,荣耀还计划推出首款人形机器人,展现其在AI与机器人领域的技术储备。这一布局预示着移动通信行业正向更高维度的智能形态演进。

今日大家都在搜的词: