首页 > 业界 > 关键词  > Nemotron-4最新资讯  > 正文

英伟达发布Nemotron-4 15B: 8 万亿训练数据,性能超LLaMA-2

2024-03-07 08:48 · 稿源:站长之家

**划重点:**

1. 🌐 Nemotron-415B拥有150亿参数,基于8万亿文本标注数据预训练,在多领域测试中超越同类大小的开源模型,尤其在代码语言准确率上表现出色。

2. 🧠采用标准Transformer架构,结合自注意力、全局注意力和多头注意力等机制,以及旋转位置编码技术,提升模型表达和泛化能力。

3. 🌐 利用384个DGX H100节点,每节点搭载8个NVIDIA Hopper架构的H10080GB SXM5GPU,采用8路张量并行和数据并行的组合,以及分布式优化器进行分片。

站长之家(ChinaZ.com)3月7日 消息:英伟达最新推出的大型语言模型Nemotron-415B,以其卓越性能和创新架构引起广泛关注。该模型拥有150亿参数,基于庞大的8万亿文本标注数据进行了预训练。

在多领域测试中,Nemotron-415B在7个领域中的4个表现优异,超越了同类大小的开源模型。特别值得注意的是,在代码语言方面,Nemotron-415B展现出更高的准确率,尤其在资源稀缺的编程语言上超过了Starcoder和Mistral7B等模型。

该模型采用了标准的Transformer架构,包括多头自注意力机制和前馈神经网络。其独特之处在于,Nemotron-415B结合了自注意力和全局注意力机制,以更好地理解输入序列内部的依赖关系和输入序列与输出序列之间的对应关系。多头注意力的引入进一步提高了模型的表达能力和泛化能力。

在训练过程中,研究人员充分利用了384个DGX H100节点,每个节点搭载8个基于NVIDIA Hopper架构的H10080GB SXM5GPU。通过8路张量并行和数据并行的组合,以及分布式优化器进行分片,成功完成了Nemotron-415B的训练。

Nemotron-415B在英语、数学推理、多语言分类和代码等多个测试任务中表现出色,不仅在性能上超越了LLaMA-234B和Mistral7B,在广泛的代码语言中也取得了更高的准确率。这一成就为大型语言模型的发展和应用提供了崭新的视角。

image.png

技术报告https://arxiv.org/abs/2402.16819

举报

  • 相关推荐
  • 英伟达正研发新型AI芯片,微美全息(WIMI.US)携算力方案加入全球科技争霸赛

    马斯克终止Dojo超级计算机项目,耗资超十亿美元后转向斥资数十亿购买英伟达AI芯片。特斯拉计划到2025年底将H100芯片数量从3.5万增至8.5万块。英伟达凭借强大训练芯片性能占据市场主导,并正为中国市场开发基于Blackwell架构的新型AI芯片B30A和RTX6000D。全球AI推理芯片市场正经历爆发式增长,预计2023至2030年复合增长率超35%。微美全息等科技公司加大AI算力投入,推动边缘计算与A

  • 英伟达机器人底层技术突破,微美全息(WIMI.US)多维布局助推产业生态爆发

    英伟达发布机器人AI芯片,黄仁勋称AI下一波浪潮将是机器人。上海发布AI+制造方案,推动3000家企业智能化。人形机器人市场前景广阔,预计2030年产量达23万台。微美全息等企业积极布局,在工业与家庭场景加速落地。机器人技术从"炫技"走向实用,正重塑产业结构和生活方式。

  • 一到秋天就emo可能患上悲秋综合征:可通过这些方式调节情绪

    随着秋季的来临,不少人发现自己情绪出现了变化,莫名感到烦躁、嗜睡且情绪低落。近日,网络上众多网友分享自身感受,称一到秋天就陷入“emo”状态,疑似患上了所谓的“悲秋综合征”。 “悲秋综合征”并非严格的医学诊断术语,它描述的是在秋天因景色萧瑟,人们内心产生凄凉、苦闷之感,甚至出现焦虑、抑郁情绪的一种状况,本质上属于季节性情感障碍。其主要表

  • 科隆国际游戏展 | MOZA正式官宣25年度旗舰直驱,与梅赛德斯-奔驰、MotoGP官宣合作

    2025年8月20-24日,德国科隆将举办全球最大游戏展会GAMESCOM。MOZA RACING将携三款旗舰新品亮相:R25 Ultra和R21 Ultra直驱基座,以及与保时捷合作的模拟赛车方向盘。现场将提供专业赛车模拟体验,并宣布与梅赛德斯-奔驰、MotoGP达成战略合作。知名赛车手将亲临互动,带来前沿设备体验和精彩赛事。

  • REDMI Note 15 Pro+首搭自研澎湃T1S芯片

    REDMI官方今日正式宣布,Note15系列将于8月21日(周四)19:00全球首发。作为该系列性能旗舰,Note15Pro首次搭载小米自研澎湃T1S信号增强芯片,这款与K80Pro同源的通信芯片,将中高频蜂窝通信性能提升最高37%,Wi-Fi和蓝牙性能同步增强16%,官方用"信号强到离谱"形容其通信表现。 据实测数据,澎湃T1S芯片在人流密集的商圈、车站等场景下,网络抢通能力显著提升;在地下车�

  • 真我GT8 Pro预热:Ultra级的产品力

    今天下午,真我举行了七周年直播活动,realme副总裁徐起提前预热真我GT8 Pro。 徐起表示,真我GT8 Pro将是一款大改款旗舰,从外观设计、核心技术、用户体验等维度全方位革新,拥有Ultra级的产品力,而且真我还将带来颠覆想象的影像效果,是真我史上最强旗舰。

  • 王腾晒出REDMI Note 15 Pro:云霞紫配色亮相

    REDMI总经理王腾在社交平台晒出了REDMI Note15Pro的官方照片,引发了广泛关注。 王腾介绍称,Note15Pro不仅拥有与Pro+同款的耐用品质,更采用了直屏形态设计,搭配优雅的大R角和超窄边框,旗舰级的质感扑面而来。他特别推荐了云霞紫配色,其细腻的云纹设计为整机增添了一抹灵动与时尚。 王腾进一步强调,Note15系列将品质从实验室带入了真实生活场景,提出了“耐久品质”的

  • REDMI Note 15 Pro+将首发第四代骁龙7s

    今日,高通正式推出第四代骁龙7s移动平台,该平台采用先进的4nm制程工艺,集成性能显著提升的Kryo CPU与Adreno GPU,可支持WFHD+分辨率下144Hz高刷新率屏幕,为用户带来细腻流畅的视觉体验。据官方测试数据,其CPU性能较前代提升7%,GPU图形渲染速度同步增长7%,被业界视为第三代骁龙7s的强化版本。 在AI算力方面,第四代骁龙7s通过端侧AI引擎实现了影像功能的突破性升级。平台

  • REDMI Note 15 Pro+发布:售价1899元起

    REDMI Note15Pro+正式发布,以1899元(12GB +256GB)的首发起售价惊艳亮相。此次发布,REDMI Note15Pro+不仅在价格上诚意满满,更在配置、设计及防护等多方面实现升级,真正做到了加量不加价。 在售价方面,REDMI Note15Pro+提供了多种存储版本供消费者选择。12GB +256GB版本售价1899元;12GB +512GB版本售价2099元;16GB +512GB版本售价2299元;卫星消息版16GB +512GB版本售价2399元。同时,该机共有子夜黑

  • 小米首款400%大音量!REDMI Note 15 Pro系列响度高达82.5dB:不怕漏接女朋友电话

    REDMI Note15 Pro系列将于8月21日19:00发布,将带来REDMI Note 15 Pro、REDMI Note 15 Pro 两款机型。 今日,REDMI继续为新机预热,REDMI Note15 Pro系列是小米首款支持400%大音量模式的手机,响度高达82.5dB。 官方宣称油烟机最强档,来电也能听得清”,在嘈杂环境用机不会错过家人、工作等重要来电。 此外,REDMI Note15 Pro系列还搭载旗舰1115对称双扬声器,是小米首款立体声大音量手机,大音量

今日大家都在搜的词: