首页 > 业界 > 关键词  > DeepSeek最新资讯  > 正文

英伟达:DeepSeek R1 现可在 NVIDIA NIM 平台上使用

2025-01-31 10:20 · 稿源:站长之家

站长之家(ChinaZ.com) 1月31日消息:英伟达网站发布的博客文章,DeepSeek R1 671b 已作为英伟达的 NIM 微服务预览版本在 build.nvidia.com 上发布。

1737959259-7169.png

据博客文章介绍,DeepSeek-R1 是一款拥有最先进推理能力的开放模型。与传统模型直接给出答案不同,像 DeepSeek-R1 这样的推理模型会对查询进行多轮推理处理,通过链式思考、共识方法和搜索策略生成最佳答案。

这一系列推理过程——即利用推理得出最佳答案——被称为「推理时扩展」(test-time scaling)。DeepSeek-R1 是这一扩展法则的完美示例,展示了为何加速计算对于代理 AI 推理的需求至关重要。

当模型允许逐步「思考」问题时,它们会生成更多的输出 token 和更长的生成周期,因此模型质量持续提升。显著的推理时计算对实现实时推理和高质量响应至关重要,推理模型如 DeepSeek-R1 需要更大的推理部署来支持这一过程。

R1 在需要逻辑推理、思维推导、数学计算、编程和语言理解等任务中,提供了领先的准确性,同时具备高效的推理能力。

为了帮助开发者安全地测试这些功能并构建专用智能体,拥有 6710 亿参数的 DeepSeek-R1 模型现已作为 NVIDIA NIM 微服务预览版在 build.nvidia.com 上发布。DeepSeek-R1 NIM 微服务能够在单个 NVIDIA HGX H200 系统上每秒处理最多 3,872 个 token。

开发者可以测试并实验即将推出的应用程序接口(API),该接口预计将很快作为可下载的 NIM 微服务发布,成为 NVIDIA AI 企业软件平台的一部分。

DeepSeek-R1 NIM 微服务简化了部署,支持行业标准的 API。企业可通过在其首选加速计算基础设施上运行 NIM 微服务,最大程度保障安全性和数据隐私。使用 NVIDIA AI Foundry 和 NVIDIA NeMo 软件,企业还可以为特定的 AI 智能体创建定制化的 DeepSeek-R1 NIM 微服务。

举报

  • 相关推荐
  • 深度系统deepin 23.1发布:NVIDIA显卡、Intel/AMD处理器集体升级

    快科技4月16日消息,deepin深度操作系统团队发布了deepin 23.1版本,主要解决基础组件更新后的安装效率问题,大幅提升新用户安装体验,同时集成多项功能优化与问题修复,进一步优化系统使用。本次版本重点改进:硬件兼容性与内核优化:集成Linux 6.6/6.12内核更新、NVIDIA显卡驱动升级、Intel/AMD CPU处理器微码更新,全面提升硬件支持与底层性能;核心功能增强:DDE新增智能镜像源管理、紧凑模式入口,全局搜索支持离线自然语言与AI处理能力;开发工具与跨平台支持:应用商店适配Debian/Ubuntu/Arch等子系统环境,支持快速启动;如意玲珑

  • 超越DeepSeek-R1英伟达开源新王登顶,14万H100小时训练细节全曝光

    英伟达发布开源Llama-Nemotron系列模型,性能超越DeepSeek-R1。该系列包含三个版本:8B、49B和253B参数模型,其中253B的Ultra版本在推理吞吐量和内存效率上表现突出。关键技术包括:1)采用神经架构搜索优化模型结构;2)通过知识蒸馏和持续预训练提升性能;3)结合合成数据监督微调;4)在STEM领域进行大规模强化学习训练。Ultra版本在GPQA基准测试中达到开源模型最高水平,单节点8xH100即可高效运行。模型创新性支持"推理开关"功能,通过指令动态切换推理模式。训练流程包含五阶段优化,最终模型在数学推理和通用任务上均表现优异,部分基准超越专有模型。

  • 《流浪地球3》自研AI问答应用WEi:基于DeepSeek R1开发

    快科技4月15日消息,今日,电影《流浪地球 3》官宣开机,导演郭帆,吴京、沈腾等主演参加开机仪式。在开机仪式上,吴京表示,希望自己在戏里能多演喜剧,沈腾多演动作戏。据新浪电影官微,《流浪地球3》开机现场还介绍了一位新同事”自主研发的专属AI问答应用WEi。WEi基于国产大模型DeepSeek R1开发,通过整合多元化知识库资源,包括在线信息源的专业资料、图像和影视�

  • 科大讯飞星火X1“火箭”升级:性能对标OpenAI o1DeepSeek R1

    今日,科大讯飞高级副总裁于继栋在上海AI无界智营全球”2025科大讯飞全球智能营销产品发布会上透露,讯飞星火X1将于近期再次升级。升级后的讯飞星火X1在保持原有数学任务国内领先优势的基础上,推理能力、文本生成和语言理解等通用任务方面的效果将对标业界领先的OpenAIo1和DeepSeekR1模型。科大讯飞曾宣称:这一新版本的发布,预期就可以实现数学答题和过程思维链能力全面对标甚至超过OpenAIo1。

  • DeepSeek带飞寒武纪

    寒武纪凭借AI芯片业务实现扭亏为盈,2024年首次实现上市后盈利,2025年Q1营收11.11亿元同比暴增4230%,净利润3.55亿元。这家曾连亏8年、累计亏损54亿元的"中国版英伟达",因美国对H20芯片出口管制获得市场红利,但客户集中度过高(前五大客户贡献94.63%营收)和现金流波动仍是隐忧。当前国产芯片迎来发展机遇,华为昇腾、壁仞等企业纷纷抢占市场,行业竞争日趋激烈。

  • DeepSeek上新!开源发布DeepSeek-Prover-V2-671B新模型

    快科技4月30日消息,今日,DeepSeek 今日在 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。据介绍,DeepSeek-Prover-V2-671B 其参数量达到6710亿,使用了更高效的 safetensors 文件格式,并支持 BF16、FP8、F32 等多种计算精度,方便模型更快、更省资源地训练和部署。在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。同时支持超长上下文,最大位置嵌入达163840,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提

  • DeepSeek红利耗尽后,元宝拿什么和豆包斗?

    短短60天内,中国AI原生应用下载排行榜的位次排名,就三易其主。最新情况是,截至4月15日中午,中国区苹果应用商店免费APP下载排行榜上,豆包再次超越DeepSeek,位列第二,紧随其后的DeepSeek被挤到了第三的位置,腾讯元宝则滑落到了第七名。2月13日,作为首家在C端主力产品中接入DeepSeek-R1满血版的元宝,一度趁着DeepSeek东风崛起:3月3日力压DeepSeek和豆包,首度登顶。但好景�

  • 三星电视接入DeepSeek-R1 AI本土化交互能力再升级

    近日,三星电视正式接入DeepSeek-R1,AI能力进一步得到强化。据悉,用户无需复杂的操作步骤,唤醒智能语音助手三星小贝,在对应的语音助手对话页面内,即可便捷体验深度思考功能。三星电视融合DeepSeek大模型矩阵,通过强化学习、蒸馏技术等提升深度思考与推理能力,使得电视能够更准确地理解用户深层的意图和需求,为用户提供更流畅、更简单、更自然的交互与服务体�

  • AI进化论——音乐、绘画和舞蹈的DeepSeek时刻

    “昔者仓颉作书天雨粟,鬼夜哭”——人类掌握文字后,天地为之动容,因为属于人类的文明诞生了。“仓颉作书”出自西汉《淮南子》,距离人类掌握文字已经过去了千年。AI进化的答案,或许早就镌刻在人类文明的起点里。

  • DeepSeek爆火100天,大厂又找回初心了

    DeepSeek R1模型发布100天后,中国AI行业竞争格局被彻底重构。该模型3个月内用户突破1.9亿,成为国内最大AI原生应用。腾讯、百度等科技大厂纷纷接入,其中腾讯元宝APP借助DeepSeek流量一度登顶苹果应用下载榜。字节和阿里选择自研路线,字节推出"深度思考"功能,阿里则专注开源模型研发。随着DeepSeek热潮减退,豆包重回下载量榜首,元宝跌出前20。科技大厂在享受DeepSee