首页 > 业界 > 关键词  > DeepSeek最新资讯  > 正文

绕开英伟达护城河CUDA!消息称DeepSeek准备适配国产GPU

2025-02-02 09:23 · 稿源: 快科技

科技媒体报道,DeepSeek绕过了英伟达的CUDA技术,为研发大模型开辟了新途径,引起了业内巨头的关注。

北京航空航天大学的黄雷副教授解释说,绕过CUDA意味着DeepSeek能够直接操作GPU驱动函数,实现更精细化的操作,例如通过使用PTX(并行线程执行)来提升多节点通信效率。

这种优化显著提高了训练速度。假设竞争对手需要训练模型十天,而DeepSeek只需五天。这意味着DeepSeek可以在相同时间内为模型提供更多数据,从而间接提升模型性能。

据悉,DeepSeek内部拥有精通PTX语言的开发者。如果未来DeepSeek使用国产GPU,其在硬件适配方面将更加得心应手。通过了解硬件驱动提供的基本函数接口,DeepSeek可以参照英伟达GPU的编程接口编写相关代码,从而让大模型更轻松地适配国产硬件。

举报

  • 相关推荐
  • DeepSeek爆火后英伟达首份财报发布:利润大增80%

    美东时间2月26日盘后,英伟达公布了2025财年第四季度业绩报告。这是今年1月末DeepSeek横空出世后,英伟达公布的首份财报,华尔街和所有投资者都在关注。2025财年英伟达营收达到1305亿美元,同比增长114%;预计2026财年Q1营收区间为430亿美元上下浮动2%。

  • DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

    【新智元导读】斯坦福和普林斯顿研究者发现,DeepSeek-R1生成的自定义CUDA内核,完爆了o1和Claude3.5Sonnet,拿下总排名第一。虽然目前只能在不到20%任务上超越PyTorchEager基线,但GPU编程加速自动化的按钮,已经被按下!近日,来自斯坦福和普林斯顿的研究者发现,DeepSeek-R1已经能生成自定义CUDA内核了还在一众推理模型中,直接拿下了TOP1!紧随其后,OpenAIo1和Claude3.5Sonnet分别排第二和第三。他曾在苹果公司设计GPU,在Anyscale开发分布式系统,并在NVIDIADRIVE部门从事自动驾驶汽车的开发工作。

  • DeepSeek-R1自写CUDA内核跑分屠榜,斯坦福学霸狂飙GPU编程自动化挑战人类

    斯坦福和普林斯顿研究者发现,DeepSeek-R1生成的自定义CUDA内核,完爆了o1和Claude3.5Sonnet,拿下总排名第一。虽然目前只能在不到20%任务上超越PyTorchEager基线,但GPU编程加速自动化的按钮,已经被按下!近日,来自斯坦福和普林斯顿的研究者发现,DeepSeek-R1已经能生成自定义CUDA内核了还在一众推理模型中,直接拿下了TOP1!紧随其后,OpenAIo1和Claude3.5Sonnet分别排第二和第三。他曾在苹�

  • 寻找DeepSeek梁文锋

    AI大模型DeepSeek凭借好用、开源、免费三大特点火爆全球,成为史上最快突破3000万日活跃用户的APP,如今当下各行各业都在被DeepSeek化。就是这样一家公司,在爆火之前,外界知之甚少,它极少出现在媒体报道、猎头招聘、同行调研之中,也从未像“AI六小龙”那样激起过市场的水花。但无论如何,DeepSeek打破巨头了在AI领域的叙事,现在投资人们迫切希望在下一个DeepSeek出现之�

  • 广告盯上DeepSeek

    AI搜索加广告,是必然吗?定焦One原创作者|王璐编辑|魏佳DeepSeek们最近因为答案中疑似“夹带”广告被骂了。起因是科普博主“三个老爸实验室”称在腾讯元宝接入的DeepSeek里发现,生成答案中有“建议通过58到家等正规平台比价预约”“建议通过快回收平台或本地正规回收商询价”等广告倾向性内容。需要提醒大家的是,即便有没有广告,AI的回答也不是绝对客观中立。

  • DeepSeek们的成本,是怎么计算的?

    DeepSeek彻底让全球都坐不住了。马斯克携“地球上最聪明的AI”——Gork3在直播中亮相,自称其“推理能力超越目前所有已知模型”,在推理-测试时间得分上,也好于DeepSeekR1、OpenAIo1。大模型的降本速度还会越来越快。

  • 我已确诊为“DeepSeek人格”:勿扰

    可能是AGI迟迟不来、等待“AI更像人/超越人”太辛苦。也或许是“AI代替人类劳动力”的预言太惊悚,吓到了人类。”说到底,AGI还没达到,终究是人被异化了。

  • 不受DeepSeek影响,英伟达新财报创记录,收入超1300亿美元

    今早5点,全球AI领导者英伟达在官网发布了,第四季度和2025财年的财务业绩报告。第四季度收入创纪录达到393亿美元,比第三季度增长12%,比去年同期增长78%;数据中心第四季度收入创纪录达到356亿美元,比第三季度增长16%,比去年同期增长93%。全球超过75%的最强超级计算机系统由NVIDIA技术驱动。

  • 人均DeepSeek,自上而下进行时

    席卷全球的「DeepSeek风暴」还在对各行各业进行无差别扫射,打工人的焦虑指数已然爆表。春节假期刚复工,黎阳看到律所的群里接连发来几条有关「AI培训」的信息。每个人都要做好迎接冲击波的准备。

  • 第一本关于DeepSeek的书出现了…

    三言Pro消息DeepSeek在春节期间火爆全网后,三言Pro此前在《第一波利用DeepSeek搞钱的人出现了》中写道,最先用DeepSeek赚到钱的依然是卖课的。一大波草根导师开始售卖DeepSeek课程。若需系统学习,推荐从官方文档和开源社区起步,逐步深入复杂场景非依赖商业化教程。

热文

  • 3 天
  • 7天