首页 > 业界 > 关键词  > Mistral最新资讯  > 正文

Nvidia 和 Mistral AI 的超精确小语言模型适用于笔记本电脑和 PC

2024-08-24 13:57 · 稿源:站长之家

站长之家(ChinaZ.com) 8月24日消息:NvidiaMistral AI 发布了一款新型的小型语言模型,据称该模型在小体积下依然具有「最先进」的准确性。该模型名为 Mistral-NemMo-Minitron 8B,是 NeMo 12B 的迷你版本,参数量从 120 亿缩减到了 80 亿。

英伟达

据 Nvidia 深度学习研究副总裁 Bryan Catanzaro 在博客文章中介绍,这款 80 亿参数的小型语言模型通过两种不同的 AI 优化方法实现了规模缩减。开发团队使用了结合剪枝和蒸馏的技术。「剪枝通过去除对准确性贡献最小的模型权重来缩小神经网络的规模。蒸馏过程中,团队在一个较小的数据集上重新训练了这个经过剪枝的模型,从而大幅提高了因剪枝导致的准确性下降。」

这些优化使得开发人员能够在「原始数据集的一小部分」上训练优化后的语言模型,从而在计算成本上节省高达 40 倍。通常情况下,AI 模型需要在模型规模和准确性之间进行权衡,但通过 Nvidia 和 Mistral AI 的新剪枝和蒸馏技术,语言模型可以同时兼顾这两者。

配备了这些增强功能的 Mistral-NeMo-Minitron 8B 据称在九项同类规模的语言驱动 AI 基准测试中表现出色。所节省的计算资源足以让笔记本电脑和工作站 PC 本地运行 Minitron 8B,使其比云服务更快且更安全。

Nvidia 围绕消费者级计算硬件设计了 Minitron 8B。该语言模型被封装为 Nvidia NIM 微服务,并针对低延迟进行了优化,以提高响应速度。Nvidia 通过其定制模型服务 AI Foundry,将 Minitron 8B 调整为能够在低配置设备(如智能手机)上运行。尽管性能和准确性可能略有下降,但 Nvidia 表示该模型仍然是高准确性的语言模型,并且只需极少的训练数据和计算资源

剪枝和蒸馏技术似乎是人工智能性能优化的下一前沿。理论上,开发者可以将这些优化技术应用于所有现有的语言模型,从而显著提升整体性能,包括那些只能由 AI 加速服务器群组运行的大型语言模型。

举报

  • 相关推荐
  • 向量索引入核,驾驭亿级向量数据:MatrixOne×NVIDIA cuVS GPU加速实践

    矩阵起源(MatrixOrigin)专注于将AI深度融入企业核心业务,通过AI驱动自动化复杂工作流,提升运营效率。其为安利销售代表打造AI助手,实现快速检索与客户沟通;为金盘科技构建AI原生数据底座,将ERP与MES数据转化为洞察。MatrixOne数据库结合传统关系型能力与高性能向量索引,通过集成NVIDIA cuVS与RAFT库,实现GPU加速的向量索引构建与查询,显著提升性能并降低硬件开销,支持企业级AI应用的规模化落地。

  • 首批搭载NVIDIA RTX Spark翻转本:Computex微星发布Prestige N16 Flip AI+

    微星在Computex 2026上推出首款与英伟达联合研发、搭载RTX Spark芯片的Prestige N16 Flip AI+笔记本。该产品采用二合一翻转设计,集成英伟达全栈AI架构与全套RTX图形技术,配备16英寸4K+双层OLED触控屏、99.9Wh大电池、灵隐触控笔和心流触控板,专为创作者、开发者和游戏玩家打造,融合专业创作、AI开发与高性能游戏体验,重塑个人电脑使用体验。

  • NVIDIA 携手微软,在个人 AI 时代重塑 Windows PC

    NVIDIA发布RTX Spark超级芯片,专为个人AI智能体打造Windows PC,具备1 Petaflop AI性能、128GB统一内存及完整CUDA与RTX生态。与微软合作提供安全原生体验,支持创作者、开发者和游戏玩家处理90GB以上3D场景、12K视频编辑、运行120B参数大模型及1440p超100FPS游戏。华硕、戴尔、惠普、联想等OEM将于今年秋季推出轻薄笔记本。

  • Computex 2026:NVIDIA 携手微软发布 RTX Spark,在个人 AI 时代重塑 Windows PC;DLSS 4.5 光线重建发布,现已有超过 1,000 款 RTX 游戏和应用

    在Computex 2026上,NVIDIA发布全新超级芯片RTX Spark,专为个人AI智能体时代重塑Windows PC。该芯片提供1 Petaflop AI性能、领先能效及最高128GB统一内存。NVIDIA与微软合作打造原生Windows体验,包括安全基元和OpenShell。华硕、戴尔、惠普、联想、微软Surface及微星将在今年秋季推出搭载RTX Spark的轻薄笔记本和紧凑型台式机。同时,NVIDIA还发布了DLSS 4.5光线重建技术,并宣布RTX游戏和应用已超过1000款。

  • 卓世科技亮相 2026海南(三亚)人工智能科技大会,具身智能通用大脑赋能自贸港产业升级

    5月19日-25日,2026海南(三亚)人工智能科技大会以“睿见未来”为主题举办。卓世科技作为国家级专精特新“小巨人”企业受邀参展,创始人李伟伟发表主题演讲,展示自研“璇玑玉衡”大模型与具身智能通用大脑技术体系,深度对接海南自贸港AI产业生态。大会聚焦物理AI、智能制造、医疗康养等前沿赛道,搭建政产学研资用一体化平台。卓世科技针对行业痛点,提出分层赋能、即插即用的通用大脑解决方案,涵盖AI数字员工、陪伴交互大脑、非人形协同大脑及人形自主作业大脑等,并公布“数据资产、模型能力、场景方案、适配服务、验证认证”五大货架体系,助力海南打造全球人工智能“自贸高地”。

  • 卓世科技荣膺「2026 福布斯中国人工智能科技企业 TOP50」

    近日,《福布斯》发布“2026福布斯中国人工智能科技企业TOP50”榜单,卓世科技凭借其行业大模型创新、自主可控的“璀璨玉衡”大模型体系、Tri-Core三核协同具身智能通用大脑,以及在工业制造、企业服务、健康养老、教育等多领域的深度商业化落地能力成功入选。同时,其创始人屠静女士也入选“人工智能影响力人物”。这标志着卓世科技已跻身中国人工智能产业核心阵营,其技术实力与产业价值获得高度认可。

  • 腾讯云TVP走进银河通用×NVIDIA×福田戴姆勒,解码AI驱动产业硬核突围之路

    腾讯云TVP于4月24-25日举办“硬核突围 智见未来”活动,首创“两天三站”模式,带领70+行业领袖走进银河通用机器人、NVIDIA和福田戴姆勒汽车。活动聚焦具身智能产业化、Agent发展趋势和企业AI转型,通过参观、分享、圆桌论坛等形式,探讨AI驱动硬科技产业进化的核心路径,强调数据、算法、硬件深度协同的产业变革正在发生。

  • 网易外贸通TradingClaw重磅上线,开创外贸增长新范式

    网易外贸通推出TradingClaw,这是一款基于AI大模型的外贸智能体,旨在解决外贸企业从“低效重复”向“能力平权”的生产力跃迁问题。TradingClaw通过内置Agent团队,实现从“命令式交互”到“主动意图感知”的跨越,自动拆解任务、分配资源,并覆盖客户调研、开发、运营、流量获取等全业务周期。它整合全链路数据,提供精准客户匹配、个性化营销方案和策略复盘,降低外贸门槛,使小团队也能轻量化撬动全球市场,推动企业从经验驱动转向数智资产驱动。

  • 算力生态金融齐发力 仙工智能夯实具身智能发展根基

    近日,仙工智能在具身智能领域达成三项重磅合作:与芯擎科技签署战略协议,共建“车规级芯片算力+工业机器人算法”一体化平台;向张江租赁交付首单设备,实现“设备租赁+智能制造”闭环模式;参与香港中文大学“香港具身智能实验室”建设,推动产学研成果转化。这些合作覆盖底层算力、产业生态和金融赋能,完善了其“算力+生态+金融”三维布局,加速具身智能机器人规模化商业应用。

  • 苹果MacBook Ultra首发全新OLED:Mini-LED落幕

    苹果即将推出品牌史上定位最高端的笔记本新品MacBook Ultra,这款全新设备将首发搭载定制的双层OLED屏幕。 现在市面上在售的MacBook Pro采用的还是Mini-LED屏幕,这类屏幕依然需要配套独立的背光模组,对比度、黑色纯净度始终存在物理层面的上限。 这次应用的双层串联OLED拥有完全自发光的核心特性,它在传统单层OLED面板基础上额外添加了一层独立的有机发光层,原本单层OLED�

今日大家都在搜的词: