首页 > 业界 > 关键词  > 英伟达最新资讯  > 正文

英伟达发布430亿参数大模型ChipNeMo

2023-11-01 09:00 · 稿源:站长之家

要点:

1. 英伟达发布了拥有430亿参数的大语言模型ChipNeMo,专注于辅助芯片设计,提高工作效率。

2. ChipNeMo支持问答、EDA脚本生成、Bug总结和分析等任务,帮助芯片设计师完成工作。

3. ChipNeMo的研发采用了领域自适应技术,提升了性能并减小模型大小。

站长之家(ChinaZ.com)11月1日 消息:英伟达最新发布的430亿参数大语言模型ChipNeMo专注于辅助芯片设计,旨在提高工程师的工作效率。这一大语言模型的应用范围广泛,包括问答、EDA脚本生成和Bug总结等任务,使芯片设计变得更加便捷。

英伟达首席科学家Bill Dally强调,即使提高生产率的幅度不大,使用ChipNeMo仍然是值得的。ChipNeMo的数据集包括Bug总结、设计源、文档以及硬件相关的代码和自然语言文本,经过数据采集、清洗和过滤后,共有241亿个token。

image.png

英伟达采用了领域自适应技术,包括自定义标记器、领域自适应持续预训练、带有领域特定指令的监督微调等方法,以提升大语言模型在工程助理聊天机器人、EDA脚本生成和Bug摘要和分析等领域的性能。

结果显示,这些领域自适应技术不仅提高了性能,还减小了模型大小,但仍有改进空间。英伟达的这一举措标志着大语言模型在半导体设计领域的应用迈出了重要的一步,为专业化领域提供了有用的生成式AI模型。

更多详情点击进入AiBase产品库ChipNeMo页面查看

举报

  • 相关推荐
  • 中国石油发布3000亿参数昆仑大模型:华为、中国移动、科大讯飞联合打造

    日前,中国石油发布3000亿参数昆仑大模型,标志着中国石油在人工智能领域迈出关键一步。 据了解,昆仑大模型由中国石油、中国移动、华为、科大讯飞联合打造,2024年8月完成备案,成为中国能源化工行业首个通过备案的大模型。 去年8月28日,330亿参数昆仑大模型发布,11月28日又发布700亿参数昆仑大模型。

  • 英伟达重夺全球市值第一头衔 再度超越微软

    去年6月19日,英伟达股价曾以135.58美元创下历史新高,当时总市值达3.335万亿美元,一举超越微软和苹果,首次登上全球市值最高上市公司的宝座。此后,在全球市值排名中,英伟达与苹果、微软展开激烈角逐,三者轮番登顶。上一次英伟达成为市值最高的公司是在今年1月24日。 从英伟达自身的财务表现来看,其业绩也相当亮眼。根据英伟达2026财年第一季度财报,该季度公司

  • AI日报:GPT-4.1正式上线ChatGPT;阿里通义万相Wan2.1-VACE开源;可灵大模型视频生成量约占30%份额

    本文报道了AI领域最新动态:1)阿里通义万相开源视频编辑统一模型VACE;2)OpenAI发布GPT-4.1增强编码能力;3)Stability AI推出超轻量341M文字转语音模型;4)快手可灵视频生成模型占据30%市场份额;5)微软WizardLM团队整体加入腾讯混元大模型研发体系;6)腾讯宣布混元图像2.0将于5月16日发布;7)上海成立人工智能标识生态联盟;8)Lightricks发布13B参数视频生成模型LTX-Video;9)谷歌DeepMind推出AlphaEvolve优化AI训练速度;10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。

  • 超越OpenAI?Claude4大模型能连续工作7小时,创SWE-Bench得分纪录

    过去的 AI 模型往往只能维持几分钟的“注意力”,而 Opus 4 的表现意味着,AI 终于具备了完整工作日级别的协作能力……

  • 英伟达纵深扩展量子计算版图,微软/微美全息共发力奔赴技术革命新征程!

    英伟达CEO黄仁勋在COMPUTEX2025发表主题演讲,宣布推出企业AI计算平台NVIDIA RTX PRO服务器,搭载RTX PRO6000 Blackwell GPU,专为驱动AI工厂和加速企业AI工作负载设计。同时英伟达布局量子计算,设立全球量子AI技术研发中心G-QuAT,并投资量子计算初创公司PsiQuantum。微软宣布将后量子密码学技术整合到Windows系统,谷歌高管预测量子计算应用或将在五年内实现。微美全息作为量子产业先锋,通过量子计算与AI超算融合实现技术突破。全球科技巨头正加速布局量子计算领域,英伟达引领AI产业向纵深发展,在新竞争格局下进军量子计算,押注下一代技术浪潮。

  • 英伟达最新高算力芯片上车 雷军:小米YU7全系标配激光雷达

    5月22日,小米正式发布YU7智能汽车,全系标配激光雷达和4D毫米波雷达。新车搭载第三代骁龙8移动平台,采用4nm工艺,显著提升运行速度,OTA升级最快仅需15分钟。配备英伟达Thor计算平台,算力达700TOPS,支持大模型上车。激光雷达探测距离200米,暗光环境下性能更强,能精准识别异形障碍物。同时应用ALD镀膜技术摄像头,有效减少眩光干扰,提升雨雾天气行车安全,实现更智能的辅助驾驶体验。

  • AI机器人赛道竞速,英伟达/微美全息GPU+AI全栈布局双轮驱动产业化浪潮!

    英伟达CEO黄仁勋在Computex2025电脑展发表主题演讲,宣布公司转型为AI基础设施提供商。重点展示了四大方向:消费级RTX显卡、B300服务器芯片、Omniverse软件平台及自动驾驶/机器人技术。推出全新GB300 Blackwell Ultra AI平台,提升训练和推理能力。黄仁勋强调机器人技术将引领下一场工业革命,推出Isaac GR00T机器人开发平台和Jetson Thor处理器。摩根士丹利预测人形机器人市场规模将达60万亿美元,中国到2050年市场规模或达6万亿元。微美全息等企业正加速布局该领域,通过AI视觉、自然语言处理等技术提升机器人环境感知与决策能力。黄仁勋指出智能体(Agent)、模型(Model)和机器人(Robot)将成为未来十年技术话语权争夺的关键。

  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。

  • ChatGPT重磅升级GPT-4.1:编程专家模型登场

    OpenAI于5月15日正式推出GPT-4.1模型,采用差异化推送策略:付费用户可体验完整版,普通用户使用轻量级GPT-4.1 mini。新版模型在编程任务表现突出,能精准遵循指令,避免冗长输出。测试显示其响应速度提升30%,输出稳定性提高40%,部分性能超越GPT-4o。同时OpenAI宣布将斥资30亿美元收购编程工具Windsurf,强化开发者生态,与Google同日发布的Gemini-GitHub形成直接竞争。两大巨头的动作标志着AI编程助手进入生态竞争新阶段。

  • 2499元起!英伟达RTX 5060显卡开启预约:5月20日0点开售

    英伟达RTX 5060显卡5月14日开启预约,5月20日正式发售,基础款统一售价2499元。该显卡采用GB206-250 GPU芯片,配备3840个CUDA核心,加速频率2497MHz,搭载8GB GDDR7显存(等效频率28GHz),功耗145W。相比RTX 4060,核心数增加25%,显存带宽提升65%,功耗增加30W。支持DLSS 4技术,可助力游戏实现100FPS流畅体验。华硕、七彩虹、技嘉、微星等品牌双风扇版本已上架电商平台。