首页 > 业界 > 关键词  > 英伟达最新资讯  > 正文

英伟达和 Mistral 的新模型「Mistral-NeMo」为台式电脑带来企业级人工智能

2024-07-21 09:59 · 稿源:站长之家

站长之家(ChinaZ.com) 7 月 21 日消息:英伟达(Nvidia)和法国初创公司 Mistral AI 日前联合宣布推出一款新语言模型,旨在将强大的 AI 功能直接带到企业桌面。这款名为 Mistral-NeMo的模型拥有 120 亿个参数和 128,000 个 Token 上下文窗口,是寻求在不依赖大量云资源的情况下实施 AI 解决方案的企业的强大工具

英伟达

Nvidia 应用深度学习研究副总裁 Bryan Catanzaro 在接受媒体采访时强调了该模型的可访问性和高效性。他说:「我们与 Mistral 共同训练了一款 120 亿参数的模型,并将其以 Apache 2.0 许可发布。我们对该模型在许多任务中的准确性非常满意。」

Nvidia 作为 GPU 制造和 AI 硬件领域的巨头,与欧洲 AI 新星 Mistral AI 的合作,标志着 AI 行业在企业解决方案方面的重大转变。通过专注于更小但功能强大的模型,这一合作旨在让更多企业能够接触到先进的 AI 技术。

在巨人之间的小人物:小型模型如何改变游戏规则

Catanzaro 进一步解释了小型模型的优势:「小型模型显然更易于获取和运行,商业模式也可以不同,因为人们可以在自己的系统上运行这些模型。实际上,这个模型可以在许多人已经拥有的 RTX GPU 上运行。」

这一发展正值 AI 行业的关键时刻。虽然目前大量关注集中在像 OpenAI 的 GPT-4 这样拥有数百亿参数的巨大模型上,但越来越多的人对能够在企业硬件上本地运行的高效模型产生兴趣。这一转变主要是因为数据隐私、低延迟需求以及更具成本效益的 AI 解决方案等因素。

Mistral-NeMo 的 128,000 个 Token 上下文窗口是其一大亮点,使该模型能够处理和理解比许多竞争对手更大的文本块。Catanzaro 表示:「我们认为长上下文能力对许多应用非常重要。如果它们可以避免微调,那就使得部署更加简单。」

长短之分:上下文在 AI 中的重要性

这一扩展的上下文窗口对处理长文档、复杂分析或复杂编码任务的企业非常有用。它可能消除频繁的上下文刷新需求,从而带来更连贯和一致的输出。

该模型的高效性和本地部署能力可能会吸引那些互联网连接有限或有严格数据隐私要求的企业。然而,Catanzaro 澄清了该模型的预期使用情况:「我认为更多是针对笔记本电脑和台式机,而不是智能手机。」

这种定位表明,虽然 Mistral-NeMo 将 AI 带到个人企业用户的身边,但它还没有达到移动设备部署的阶段。

行业分析师认为,这一发布可能会显著扰乱 AI 软件市场。Mistral-NeMo 的推出可能会改变企业 AI 部署的方式。通过提供一个可以在本地硬件上高效运行的模型,Nvidia 和 Mistral AI 正在解决企业在广泛采用 AI 时面临的许多问题,如数据隐私、延迟和高昂的云解决方案成本。

这一举措可能使资源有限的小企业也能利用以前只有大型企业才能使用的 AI 能力。然而,这一发展的真正影响将取决于模型在实际应用中的表现以及围绕它的工具和支持生态系统的发展。

该模型目前以 NVIDIA NIM 推理微服务的形式提供,并且很快将推出可下载版本。其 Apache 2.0 许可允许商业使用,这可能会加速其在企业中的采用。

民主化 AI:将智能带到每一个桌面的竞赛

随着各行业企业继续努力将 AI 整合到运营中,像 Mistral-NeMo 这样的模型代表了更高效、可部署的 AI 解决方案的趋势。是否会挑战大型云模型的主导地位还有待观察,但它无疑为企业中的 AI 集成开辟了新的可能性。

Catanzaro 在采访中以展望未来的声明总结道:「我们相信,这个模型代表了让 AI 对各类企业更可访问和实用的方向的重要一步。这不仅是关于模型的强大能力,还在于将这种能力直接交到可以用它来推动日常运营中创新和效率的人们手中。」

随着 AI 领域的不断发展,Mistral-NeMo 的发布标志着为企业提供更可访问、高效和强大的 AI 工具方面的重要里程碑。这将如何影响更广泛的 AI 生态系统还有待观察,但可以肯定的是:将 AI 能力更接近最终用户的竞赛正在升温,Nvidia 和 Mistral AI 已经在这一方向上迈出了大胆的一步。

举报

  • 相关推荐
  • 英伟达正研发新型AI芯片,微美全息(WIMI.US)携算力方案加入全球科技争霸赛

    马斯克终止Dojo超级计算机项目,耗资超十亿美元后转向斥资数十亿购买英伟达AI芯片。特斯拉计划到2025年底将H100芯片数量从3.5万增至8.5万块。英伟达凭借强大训练芯片性能占据市场主导,并正为中国市场开发基于Blackwell架构的新型AI芯片B30A和RTX6000D。全球AI推理芯片市场正经历爆发式增长,预计2023至2030年复合增长率超35%。微美全息等科技公司加大AI算力投入,推动边缘计算与A

  • OpenAI的开源模型现已在IBM watsonx.ai上提供

    OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B,允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台,采用专家混合架构,支持本地或云端部署,不受商业用途限制。模型具备高透明度,输出完整推理链,在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态,IBM强调其开放战略,为企业提供灵活、安全的AI开发选择。

  • OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

    OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。 官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、�

  • AI日报:海螺AI首尾帧功能上线;元石科技发布问小白5;OpenAI发布全新语音模型GPT-Realtime

    AI日报栏目每日提供人工智能领域热点内容,聚焦开发者,帮助洞悉技术趋势、了解创新AI产品应用。最新动态包括:MiniMax海螺AI首尾帧功能上线;元石科技发布问小白5挑战GPT-5;OpenAI推出语音模型GPT-Realtime;谷歌Gemini AI优化表格处理;腾讯黑科技实现AI配音;百度计划培养千万AI人才;MathGPT.ai反作弊功能推广;苹果Xcode集成Claude Sonnet4;微软发布自研AI模型MAI系列;xAI推出高效编码模型Grok Code Fast1;SuperCLUE多模态评测Gemini-2.5-Pro居首;9月1日起AI内容标识新规实施,违规将承担法律风险。

  • OpenAI CEO:GPT-6将具备个性化记忆 记住用户偏好习惯

    OpenAI的首席执行官萨姆奥尔特曼(Sam Altman)在近日的一次专访中,透露了下一代大模GPT-6的最新进展。他表示,GPT-6 的开发正在积极推进中,其发布节奏将比从GPT-4到GPT-5的周期更快。 奥尔特曼特别强调,GPT-6将不再局限于单纯回答问题,而是朝着与用户深度适配”的方向演进。他举例描述

  • 真我GT8 Pro预热:Ultra级的产品力

    今天下午,真我举行了七周年直播活动,realme副总裁徐起提前预热真我GT8 Pro。 徐起表示,真我GT8 Pro将是一款大改款旗舰,从外观设计、核心技术、用户体验等维度全方位革新,拥有Ultra级的产品力,而且真我还将带来颠覆想象的影像效果,是真我史上最强旗舰。

  • 酷睿 Ultra 赋能 AIPC 轻薄本:不止性能飞跃,更懂用户需求的智能新体验

    AI技术正从实验室走向日常生活,AIPC(人工智能个人计算机)成为满足用户多元化需求的关键载体。英特尔酷睿Ultra处理器凭借先进技术布局,突破传统轻薄本性能瓶颈,实现高效多任务处理与强大AI算力融合。华硕灵耀14Air等产品以性能与体验双优特质脱颖而出,不仅提升办公创作效率,更重新定义轻薄本的使用价值。随着技术迭代与生态完善,AIPC正从“小众尝鲜”走向“大众普及”,智能体验将成为未来轻薄本的标准配置。

  • 奥尔特曼称自己不适合担任CEO OpenAI上市后或卸任

    OpenAI首席执行官Sam Altman近日接受采访时透露,虽然公司正推进数万亿美元级的计算基础设施投资计划,但他对上市后继续担任CEO持保留态度。 Altman坦言,尽管主导着OpenAI多项战略级项目,但自认缺乏上市公司CEO所需的核心管理素质与市场敏感度。 他特别强调,上市企业领导者需具备应对复杂投资者关系与监管环境的综合能力,而自己可能并非最优人选。

  • 华为Pura 80 Ultra宣布降价:直降1000元

    继此前对Pura80Pro/Pro机型推出约800元降幅的优惠活动后,今日华为官方正式宣布,旗舰机型Pura80Ultra直降1000元,起售价由9999元下调至8999元,创下该机型上市以来的价格新低。 作为华为影像技术的集大成者,Pura80Ultra凭借卓越的硬件配置与算法优化持续领跑行业。该机型搭载6.8英寸LTPO OLED显示屏,分辨率达2848×1276像素,支持1-120Hz自适应刷新率与3000尼特峰值亮度,配合5700mAh大容

  • 问界新M5 Ultra跃影红亮相成都车展,现场上演“人从众”

    成都车展上,问界新M5 Ultra以“跃影红”配色惊艳亮相,成为全场焦点。其外观设计灵感源自极光掠影,流动红色车身搭配黑色运动轮毂,尽显低调张扬气质。新车搭载华为ADS辅助驾驶系统,配备激光雷达与毫米波雷达,提供更智能安全的驾驶体验。四驱版4.3秒破百,增程版续航达1440km,满足年轻用户对性能与续航的双重需求。售价22.98万元起,即日起至10月9日订车可享最高37000元权益。

今日大家都在搜的词: