首页 > AI头条  > 正文

Nvidia 推出新型小型开放模型 Nemotron-Nano-9B-v2,支持智能推理开关

2025-08-19 09:42 · 来源: AIbase基地

近日,Nvidia 推出了一款新的小型语言模型 Nemotron-Nano-9B-v2,这款模型在多个基准测试中表现优异,并且用户可以灵活控制其推理功能的开关。Nemotron-Nano-9B-v2的参数量为90亿,相较于其前身的120亿参数有了显著减小,旨在适应单个 Nvidia A10GPU 的部署需求。

image.png

Nvidia 的 AI 模型后训练总监 Oleksii Kuchiaev 表示,这款模型专门针对 A10GPU 进行了优化,可以实现高达6倍的处理速度,适合各种应用场景。Nemotron-Nano-9B-v2支持多种语言,包括英语、德语、西班牙语、法语、意大利语、日语,以及扩展的韩语、葡萄牙语、俄语和中文等,适用于指令跟随和代码生成任务。

该模型基于 Nemotron-H 系列,融合了 Mamba 与 Transformer 架构,能够在处理长序列时降低内存和计算需求。与传统的 Transformer 模型不同,Nemotron-H 模型使用选择性状态空间模型(SSM),在确保准确性的同时,能够高效处理更长的信息序列。

image.png

在推理功能上,Nemotron-Nano-9B-v2可以默认生成推理过程的跟踪记录,用户也可以通过简单的控制指令,如 /think 或 /no_think,来切换这一功能。此外,模型引入了运行时 “思考预算” 管理,允许开发者设定推理所用的最大 token 数量,以便在准确性和响应速度之间取得平衡。

在基准测试中,Nemotron-Nano-9B-v2展现了良好的准确性。例如,在使用 NeMo-Skills 套件的 “推理开启” 模式下,该模型在多个测试中均表现出色,显示出与其他小型开源模型相比的优势。

Nvidia 将 Nemotron-Nano-9B-v2以开放模型许可证发布,允许商业用途,且开发者可自由创建和分发衍生模型。值得一提的是,Nvidia 不会对模型生成的输出主张所有权,用户可完全控制其使用。

该模型的发布旨在为开发者提供在小规模环境中平衡推理能力和部署效率的工具,标志着 Nvidia 在提高语言模型的效率和可控推理能力方面的持续努力。

huggingface:https://huggingface.co/nvidia/NVIDIA-Nemotron-Nano-9B-v2

划重点:

🌟 Nvidia 推出了新型小型语言模型 Nemotron-Nano-9B-v2,支持用户灵活控制推理功能。  

⚙️ 该模型基于先进的混合架构,能够高效处理长序列信息,适用于多语言任务。  

📊 Nemotron-Nano-9B-v2以开放模型许可证发布,允许开发者进行商业用途和衍生模型的创建。  

  • 相关推荐
  • AI日报:腾讯混元开源Hunyuan-GameCraft;最强图像编辑器nano-banana发布;字节开源Agent专用模型 M3-Agent-Control

    本文介绍了AI领域最新动态:1)腾讯开源Hunyuan-GameCraft框架,可快速生成高质量游戏视频;2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext;3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型;4)Kimi将推出PPT生成功能;5)阿里1688将上线"诚信通AI版"会员服务;6)苹果智能家居中心推迟至2026年发布;7)万兴科技接入GPT-5;8)全球AI独角兽达498家,总估值2.7万亿美元;9)谷歌为Slides和

  • 铭凡推出N5 Pro高性能NAS主机:搭载AMD AI 9 HX 370处理器、支持144TB容量

    知名迷你PC厂商MINISFORUM推出首款高性能NAS主机N5系列,包含N5和N5 Pro两款型号。N5 Pro搭载AMD锐龙AI9 HX370处理器(12核24线程/5.1GHz)和Radeon 890M核显;N5采用锐龙7H255处理器(8核16线程/4.9GHz)和780M核显。主机支持5个HDD+3个M.2硬盘(含2个U.2企业级接口),最高144TB存储容量,配备双通道DDR5内存(最高96GB)并支持ECC校验。接口方面配备2个USB4、多个USB3.2/2.0、10G/5G网口及HDMI2.1,支持PCIe4.0扩展和OCulink外接显卡。该系列兼具NAS存储与高性能计算能力,适合虚拟化、娱乐等多场景使用,N5售价3749元起,N5 Pro售价6239元起。

  • AI日报:智谱视觉推理模型GLM-4.5V开源;达摩院开源三项具身智能核心技术;360智脑推出Light-IF系列模型

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱GLM-4.5V开源发布:全球100B级最佳视觉推理模型智谱宣布推出并开源了全球100B级效果最佳的开源视觉推理模型GLM-4.5V,这是该公司在通向通用人工智能(AGI)道路上的又一重要探

  • REDMI Note 15 Pro系列支持IP66/IP68/IP69/IP69K

    近日,REDMI官方宣布,备受期待的Note15Pro系列将于8月21日19:00正式亮相,目前新机已进入紧锣密鼓的预热阶段。 据官方透露,REDMI Note15Pro系列在防水性能上实现了重大突破,不仅全面支持IP66、IP68、IP69防水等级,更创新性地新增了IP69K认证,这意味着该系列手机能够长时间抵御高温高压喷水的侵袭,并通过了行业首个五星长效防水品质认证。REDMI手机方面表示,即便模拟用户真�

  • AI日报:GPT-5正式发布;百度将推文心5.0大模型;知网发布AIKBase V2.0多模态数据管理系统

    《AI日报》精选AI领域最新动态:1)OpenAI发布GPT-5模型,具备强大多模态能力但推理任务仍有局限;2)知网推出AIKBase V2.0多模态数据管理系统;3)Ideogram新增"角色"功能实现图像风格统一;4)Cursor发布CLI版本支持终端AI编程;5)百度即将推出全新推理模型和文心5.0大模型;6)dots.ocr推出1.7B参数多语言文档解析工具;7)特斯拉解散Dojo超算团队转向英伟达合作;8)谷歌Pixel 10引入AI相�

  • AI日报:腾讯推音效生成工具AudioGenie;阿里推智能体WebWatcher;我国首个法律垂直大模型“小包公”发布

    本文介绍了AI领域最新动态:1)腾讯推出电影级音频生成工具AudioGenie,展现中国AI技术实力;2)阿里开源多模态智能体WebWatcher,突破现有系统局限;3)港大等高校联合推出3D建模技术OmniPart,实现模型组件独立性和清晰度;4)Meta发布无需标注数据的通用图像处理模型DINOv3;5)国内首个法律大模型"小包公"发布;6)ChatGPT移动端收入突破20亿美元;7)安卓厂商借鉴灵动岛设计,新芯片推动AI功能普及;8)欧洲AI公司推出仅94MB的超小模型;9)Claude Code新增编程教学模式;10)AI技术被滥用于电商恶意退款;11)IDC报告显示2024年中国AI公有云服务市场将快速增长。

  • 文远知行获Grab数千万美元投资,双方合力推动Robotaxi在东南亚部署

    8月15日,自动驾驶企业文远知行宣布获得东南亚超级应用Grab数千万美元投资,双方将深化战略合作,重点推进Robotaxi等自动驾驶车型在东南亚市场的规模化落地。核心合作内容包括:Grab将注资支持文远知行国际化扩张;双方计划未来在东南亚部署数千辆自动驾驶车辆;文远知行技术将深度整合至Grab运营网络,提升出行服务质量和安全水平。此次合作还将建立技术培训体系,帮

  • AI日报:可灵2.1推出全新首尾帧功能;昆仑万维上线AI音乐模型Mureka V7.5;腾讯云推出AI开发工具CloudBase AI CLI

    本文介绍了AI领域最新动态:1)快手可灵2.1推出首尾帧功能,提升视频生成效果;2)昆仑万维发布Mureka V7.5音乐模型,优化人声表现;3)腾讯云推出AI开发工具CloudBase AI CLI,可减少80%编码量;4)海外新品MuleRun通过虚拟机和AI Agent带来创新游戏体验;5)Meta开源DINOv3视觉模型,无需标注即可实现卓越性能;6)宇树科技人形机器人H1获1500米赛跑金牌;7)谷歌Gemini新增记忆功能和隐私聊天模式;8)香港大学开源OpenCUA框架,打造个性化电脑助手;9)OpenAI考虑在ChatGPT引入广告;10)谷歌发布超小型开源模型Gemma 3 270M,支持手机端运行。

  • 王腾晒出REDMI Note 15 Pro:云霞紫配色亮相

    REDMI总经理王腾在社交平台晒出了REDMI Note15Pro的官方照片,引发了广泛关注。 王腾介绍称,Note15Pro不仅拥有与Pro+同款的耐用品质,更采用了直屏形态设计,搭配优雅的大R角和超窄边框,旗舰级的质感扑面而来。他特别推荐了云霞紫配色,其细腻的云纹设计为整机增添了一抹灵动与时尚。 王腾进一步强调,Note15系列将品质从实验室带入了真实生活场景,提出了“耐久品质”的

  • 小马智行二季度财报释放重要信号,文远知行Robotaxi营收暴涨836.7%

    2025年第二季度,自动驾驶行业迎来商业化加速拐点。小马智行Robotaxi业务收入达1090万元,同比增长157.8%,毛利率提升至16.1%;文远知行表现更突出,营收4590万元同比激增836.7%,毛利率达28.1%。行业增长得益于技术迭代:文远知行与联想合作推出HPC3.0计算平台,算力达2000TOPS,成本降至前代1/4,推动自动驾驶套件成本下降50%,全生命周期总成本降低84%。头部企业通过技术创新实现规模化运营,标志着Robotaxi行业正式进入商业化快车道,智能出行时代加速到来。

今日大家都在搜的词: