首页 > 业界 > 关键词  > DeepGEMM最新资讯  > 正文

DeepSeek第三弹:开源DeepGEMM!

2025-02-26 09:59 · 稿源: 快科技

快科技2月26日消息,今天上午9点,DeepSeek继续履行开源周承诺,发布了开源DeepGEMM。该帖子一经转发,立即引来了2.1万阅读量,足以见其在国内外受到追捧的热度。

据了解,DeepGEMM是一个专注于为FP8高效通用矩阵乘法(GEMM)库,支持普通及混合专家(MoE)分组的矩阵计算需求,可动态优化资源分配以提升算力效率。

该库基于CUDA开发,采用轻量级即时编译(JIT)模块,在运行时动态编译内核,无需预先编译安装。

值得一提的是,DeepGEMM设计目标是为DeepSeek-V3/R1模型的训练与推理提供简洁高效的底层支持,尤其针对Hopper架构GPU(如H800)优化,兼顾高性能与低成本。

作为开源周的第三项成果,DeepGEMM的发布延续了DeepSeek此前开源模型与工具(如FlashMLA)的策略,进一步降低高性能计算技术的应用门槛。

另外,本次开源属于DeepSeek开源周”(2月24日-28日)的第三项项目,此前已发布FlashMLA(高效解码内核)和DeepEP(专家并行通信库)

DeepSeek第三弹:开源DeepGEMM!

举报

  • 相关推荐
  • 寻找DeepSeek梁文锋

    AI大模型DeepSeek凭借好用、开源、免费三大特点火爆全球,成为史上最快突破3000万日活跃用户的APP,如今当下各行各业都在被DeepSeek化。就是这样一家公司,在爆火之前,外界知之甚少,它极少出现在媒体报道、猎头招聘、同行调研之中,也从未像“AI六小龙”那样激起过市场的水花。但无论如何,DeepSeek打破巨头了在AI领域的叙事,现在投资人们迫切希望在下一个DeepSeek出现之�

  • 广告盯上DeepSeek

    AI搜索加广告,是必然吗?定焦One原创作者|王璐编辑|魏佳DeepSeek们最近因为答案中疑似“夹带”广告被骂了。起因是科普博主“三个老爸实验室”称在腾讯元宝接入的DeepSeek里发现,生成答案中有“建议通过58到家等正规平台比价预约”“建议通过快回收平台或本地正规回收商询价”等广告倾向性内容。需要提醒大家的是,即便有没有广告,AI的回答也不是绝对客观中立。

  • DeepSeek们的成本,是怎么计算的?

    DeepSeek彻底让全球都坐不住了。马斯克携“地球上最聪明的AI”——Gork3在直播中亮相,自称其“推理能力超越目前所有已知模型”,在推理-测试时间得分上,也好于DeepSeekR1、OpenAIo1。大模型的降本速度还会越来越快。

  • 本周开始,DeepSeek 宣布将开源 5 个代码库!

    备受关注的中国人工智能模型公司DeepSeek已宣布,将开源五个关键代码库。在此之前的2月21日,Deepseek通过官方SNS平台宣布了这一消息。”长期以来,开源一直被视为实现技术民主化和提高透明度的一种重要方式,Deepseek本次的开源也受到了开源支持者的欢迎。

  • 我已确诊为“DeepSeek人格”:勿扰

    可能是AGI迟迟不来、等待“AI更像人/超越人”太辛苦。也或许是“AI代替人类劳动力”的预言太惊悚,吓到了人类。”说到底,AGI还没达到,终究是人被异化了。

  • DeepSeek代码开源周收官,世界已经变了

    AI公司DeepSeek为期五天的“代码开源周”告一段落。本周一至周五,DeepSeek以每日不定时一更的频率,开源多个代码库,涵盖FlashMLA、DeepEP通信库、DeepGEMM、并行优化策略、并行文件系统3FS。‌技术亮点‌:3FS的主要功能和优势包括性能和可用性、强一致性、文件接口开发、多样化的工作负载等。

  • 人均DeepSeek,自上而下进行时

    席卷全球的「DeepSeek风暴」还在对各行各业进行无差别扫射,打工人的焦虑指数已然爆表。春节假期刚复工,黎阳看到律所的群里接连发来几条有关「AI培训」的信息。每个人都要做好迎接冲击波的准备。

  • 第一本关于DeepSeek的书出现了…

    三言Pro消息DeepSeek在春节期间火爆全网后,三言Pro此前在《第一波利用DeepSeek搞钱的人出现了》中写道,最先用DeepSeek赚到钱的依然是卖课的。一大波草根导师开始售卖DeepSeek课程。若需系统学习,推荐从官方文档和开源社区起步,逐步深入复杂场景非依赖商业化教程。

  • DeepSeek让腾讯阿里重新上桌了

    “领导都认真了”春节复工之后,在深圳一家传统企业担任行政岗位的棘棘,被通知她多了一项工作内容:“用DeepSeek完成部分工作、提升工作效率,部门领导要求每周梳理上报AI工具使用成果。”这让她感到惊讶,“我们是传统行业,虽然之前有使用一些AI技术,但是仅限于研发同事,没有涉及到我们行政部。当DeepSeek指出一条更经济的道路,下场玩家们还要不要继续沉湎于这场有关算力资源的“无限战争”?接下来或许有人会给出更保守的答案。

  • 谷歌:我们的Gemma 3,单GPU便能媲美Deepseek

    在AI领域,“经济效益”一直是热门话题,在DeepSeek实现了令人瞠目的规模经济效益之后,谷歌也不甘落后地加紧了步伐。谷歌发布了他们最新的开源大型语言模型Gemma3。需要注意的是,竞争对手使用的H100芯片数量都是谷歌的估计,Deepseek仅披露了一个使用1814块英伟达性能稍弱的H800GPU芯片来作为R1模型提供服务的例子。

热文