首页 > 业界 > 关键词  > DeepSeek最新资讯  > 正文

英伟达:DeepSeek R1 现可在 NVIDIA NIM 平台上使用

2025-01-31 10:20 · 稿源:站长之家

站长之家(ChinaZ.com) 1月31日消息:英伟达网站发布的博客文章,DeepSeek R1 671b 已作为英伟达的 NIM 微服务预览版本在 build.nvidia.com 上发布。

1737959259-7169.png

据博客文章介绍,DeepSeek-R1 是一款拥有最先进推理能力的开放模型。与传统模型直接给出答案不同,像 DeepSeek-R1 这样的推理模型会对查询进行多轮推理处理,通过链式思考、共识方法和搜索策略生成最佳答案。

这一系列推理过程——即利用推理得出最佳答案——被称为「推理时扩展」(test-time scaling)。DeepSeek-R1 是这一扩展法则的完美示例,展示了为何加速计算对于代理 AI 推理的需求至关重要。

当模型允许逐步「思考」问题时,它们会生成更多的输出 token 和更长的生成周期,因此模型质量持续提升。显著的推理时计算对实现实时推理和高质量响应至关重要,推理模型如 DeepSeek-R1 需要更大的推理部署来支持这一过程。

R1 在需要逻辑推理、思维推导、数学计算、编程和语言理解等任务中,提供了领先的准确性,同时具备高效的推理能力。

为了帮助开发者安全地测试这些功能并构建专用智能体,拥有 6710 亿参数的 DeepSeek-R1 模型现已作为 NVIDIA NIM 微服务预览版在 build.nvidia.com 上发布。DeepSeek-R1 NIM 微服务能够在单个 NVIDIA HGX H200 系统上每秒处理最多 3,872 个 token。

开发者可以测试并实验即将推出的应用程序接口(API),该接口预计将很快作为可下载的 NIM 微服务发布,成为 NVIDIA AI 企业软件平台的一部分。

DeepSeek-R1 NIM 微服务简化了部署,支持行业标准的 API。企业可通过在其首选加速计算基础设施上运行 NIM 微服务,最大程度保障安全性和数据隐私。使用 NVIDIA AI Foundry 和 NVIDIA NeMo 软件,企业还可以为特定的 AI 智能体创建定制化的 DeepSeek-R1 NIM 微服务。

举报

  • 相关推荐
  • DeepSeek引发美国地震!怀疑中国通过新加坡获取NVIDIA AI芯片

    DeepSeek大模型的出色表现引发美国AI行业上下震动,不仅性能与OpenAIO1旗鼓相当,更关键的是训练成本低得多,也引发了美国政府的猜疑和调查,新加坡都被牵扯进来。DeepSeek官方没有详细披露大模型训练的硬件规模,只说用了数量有限的2048颗H800GPU,在两个月内训练了6710亿个参数的V3大模型,相当于280万个GPU小时。NVIDIA强调,与新加坡相关的收入并不意味着转移到中国,其公开文件显示的是客户账单地址非发货地址。

  • 性能对标OpenAI o1DeepSeek R1正式上线英伟达NIM平台

    据英伟达官方网站消息,DeepSeekR1671b版本已作为英伟达NIM微服务的预览版在build.nvidia.com平台上发布。这一微服务基于单个英伟达HGXH200系统,能够实现每秒处理多达3872个token的高效性能。DeepSeekR1是幻方量化旗下AI公司DeepSeek所发布的大型模型,其在数学、代码编写、自然语言推理等多项任务上展现出的性能,足以与OpenAI的o1模型相媲美。

  • 英伟达回应股价遭DeepSeek暴击:DeepSeek是出色的AI进步

    日前,美股收盘英伟达股价暴跌17%,市值一夜蒸发5888.62亿美元。业界认为这是受到中国AI大模型DeepSeek人工智能模型冲击,导致美国芯片股集体下跌,英伟达受到最严重冲击。DeepSeek-R1API服务定价为每百万输入tokens1元/4元,每百万输出tokens16元。

  • DeepSeek官方推荐:R1要这样设置

    咱们到底该如何部署DeepSeek-R1,才能体验最佳啊?对于这个问题,DeepSeek官方发话了:DeepSeek推荐的设置非常简单,只有四项内容。其实在此前相关文档中有所涉及,我们在这里再来回顾一下。DeepSeek表示:file_template=\"""[filename]:{file_name}[filecontentbegin]{file_content}[filecontentend]{question}"""对于Web搜索,{search_results},{cur_data}和{question}是参数。

  • 不花钱实现DeepSeek R1自由,我们为你试了所有途径

    DeepSeek官网最近挤出了一种春运抢票的感觉,一步一卡顿,有种自己和前沿科技之间的距离就卡在了“服务器繁忙”这5个字上。卡到崩溃的网友和AI玩起了角色扮演:比起研究怎么用好DeepSeek,眼下更现实的问题是——怎么用上DeepSeek。对内容行业以及内容从业者来说,也将迎来一个越来越卷的内容生产时代。

  • 硅基流动首发上线DeepSeek-V3/R1:联手华为云、DeepSeek打造

    硅基流动宣布大模型云服务平台SiliconCloud首发上线基于华为云昇腾云服务的DeepSeek-V3、DeepSeek-R1。无论是在昇腾上适配DeepSeek-R1V3双模型是在此前上线其他模型的过程中,硅基流动都得到了DeepSeek与华为云的大力支持,SiliconCloud上线的这两款模型主要包括五大特点:1、基于华为云昇腾云服务,首发推出了DeepSeekx硅基流动x华为云的R1V3模型推理服务。5、与DeepSeek官方优惠期价格保持�

  • DeepEdge10已完成DeepSeek R1系列模型适配

    云天励飞芯片团队完成DeepEdge10“算力积木”芯片平台与DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Llama-8B大模型的适配,可以交付客户使用。DeepSeek-R1-Distill-Qwen-32B、DeepSeek-R1-Distill-Llama-70B大模型、DeepSeekV3/R1671BMoE大模型也在有序适配中。云天励飞将继续努力,用自主研发的AI芯片,与更多国内AI生态合作伙伴一起,共同为提升国产AI产业竞争力、推动国产AI技术发展做出贡献。

  • 硅谷李师傅预警DeepSeek冲击英伟达:至少2个月还有黑天鹅出现

    硅谷投资人李强对DeepSeek冲击英伟达股价的现象发表了看法,并预测未来2-5个月内可能还有更多黑天鹅事件出现。由于市场对英伟达股票的期望值很高,因此在DeepSeek导致股价下滑的背景下,未来2-5个月内可能还会出现更多的黑天鹅事件,这些事件可能导致英伟达的股票产生巨大的波动。李强作为硅谷AMINOCAPITAL的创始及管理合伙人,拥有丰富的投资经验和独到的投资见解,是业界公认的杰出投资人。

  • GPU竞争失衡 AMD股价重挫 分析师:市场只认NVIDIA

    在本周五,AMD股价下跌2.36%,收于2023年11月以来的最低水平。虽然在GPU领域AMD可以说是NVIDIA的最大竞争对手,但其股价表现却显得乏力,因为与之相对的是,费城半导体指数累涨超20%,英伟达则飙升了160%,AMD周二发布了业绩报告,数据中心事业部营业额创季度新高,达39亿美元,同比增长69%,然业绩公布后,投行分析师却纷纷下调对AMD股价的预期。但凡AMD能获得15%的市场份额,也能意味着一大笔收入。

  • 老黄应该把招聘负责人开了!DeepSeek核心成员赵成钢曾就职英伟达

    连日来,DeepSeek团队因其卓越表现备受瞩目。这支团队的最大特点是成员年轻且充满活力,其中清北应届生占据了重要地位。赵成钢的职业生涯还包括在商汤科技的实习经历,他曾在2020年6月至2020年12月期间在该公司实习。

热文

  • 3 天
  • 7天