DeepSeek第三弹：开源DeepGEMM！

2025-02-26 09:59 · 稿源：快科技

快科技2月26日消息，今天上午9点，DeepSeek继续履行开源周承诺，发布了开源DeepGEMM。该帖子一经转发，立即引来了2.1万阅读量，足以见其在国内外受到追捧的热度。

据了解，DeepGEMM是一个专注于为FP8高效通用矩阵乘法（GEMM）库，支持普通及混合专家（MoE）分组的矩阵计算需求，可动态优化资源分配以提升算力效率。

该库基于CUDA开发，采用轻量级即时编译（JIT）模块，在运行时动态编译内核，无需预先编译安装。

值得一提的是，DeepGEMM设计目标是为DeepSeek-V3/R1模型的训练与推理提供简洁高效的底层支持，尤其针对Hopper架构GPU（如H800）优化，兼顾高性能与低成本。

作为开源周的第三项成果，DeepGEMM的发布延续了DeepSeek此前开源模型与工具（如FlashMLA）的策略，进一步降低高性能计算技术的应用门槛。

另外，本次开源属于DeepSeek开源周”（2月24日-28日）的第三项项目，此前已发布FlashMLA（高效解码内核）和DeepEP（专家并行通信库）。

DeepSeek第三弹：开源DeepGEMM！

（举报）

相关推荐

关键词：

剪辑快人一步！索尼ICE-Cloud助力婚礼视频团队高效高质交付

北京二十四格文化有限公司（24Frames）成立于2004年，专注极致纪实影像美学，深耕婚礼电影、商业宣传、纪录片、综艺及艺人合作等领域。团队以真实事件与情感为核心，融合高级审美与技艺，打造富有共情力的影片，助力品牌传递深度价值。面对跨地域协作与高清素材传输等挑战，公司通过索尼与分秒帧联合推出的ICE-Cloud云平台优化流程，实现拍摄至交付的高效协同，显著�

婚礼视频拍摄纪实影像美学商业宣传片
微算法科技（NASDAQ MLGO）：以隐私计算区块链筑牢多方安全计算（MPC）安全防线

微算科技开发的隐私计算区块链将区块链技术融入多方安全计算（MPC），构建安全可信的分布式计算平台。通过区块链共识机制、加密算法和智能合约，对MPC参与方身份验证、数据加密存储、任务执行及结果验证等环节进行保护，确保数据“可用不可见”。该技术显著提升数据隐私保护和计算可靠性，在金融、医疗、政务等领域实现跨主体数据安全协作，释放数据价值。

数据流通多方安全计算隐私计算
前DeepSeek研究员罗福莉已加入小米：全力奔赴AGI

11月12日，“95后AI天才少女”罗福莉宣布加入小米MiMo大模型团队。她曾因“雷军千万年薪挖角”话题引发热议，拥有丰富AI研发经历，先后在幻方量化和DeepSeek参与大模型研发。罗福莉表示，将与团队致力于推动AI从语言迈向物理世界，全力构建通用人工智能。她的加入将为小米AI研究注入新活力。

AI天才少女小米大模型罗福莉
你的品牌在豆包、DeepSeek里搜不到?这份GEO品牌监控攻略，3步把曝光拉满

GEO指数是AI搜索时代的品牌可见度衡量指标，量化品牌被AI引用、推荐和对比的频率与深度。与传统SEO比拼搜索排名不同，GEO衡量的是品牌在AI回答中的提及率和好感度。数据显示，高GEO指数品牌在AI搜索中的转化率是传统SEO的3.4倍。文章通过案例说明，企业可通过监控竞品差距、补充缺失内容关键词、优化AI提示词等策略提升GEO指数。建议立即使用AIBase平台免费体验GEO监控，把握AI搜索新机遇。

GEO指数 AI搜索品牌能见度
DeepSeek崩了上热搜页面显示“服务器繁忙”

截至2025年11月3日，大量用户在微博话题#DeepSeek崩了#下集中反馈，DeepSeek平台出现服务异常状况，引发广泛关注。综合各方信息，此次故障呈现多方面表现，对用户使用造成显著影响。众多用户表示遭遇服务全面中断问题，在尝试使用平台

DeepSeek故障服务器异常服务中断
PCEVA深度评测：忆联AE531 QLC SSD以高效稳定，从容应对多元应用场景挑战

PCEVA对忆联首款QLC商用消费级SSD AE531进行深度评测。该产品在性能测试中全面超越同级，顺序读写达6817/5680MB/s，SLC缓存策略提供约110GB空间，60℃满载无降速。跨平台兼容性与低TCO设计满足企业降本增效需求，验证了QLC在商用场景下的稳定优势。

SSD评测 QLC性能商用存储
餐饮数字化转型标杆：睿食拓数智方案，助力兰湘子380+门店高效运营管理

湘菜品牌兰湘子通过“小炒”“现炒现做”模式在正餐行业成功突围，六年扩张至380家门店。其高速发展依赖睿食拓提供的全链路数字化解决方案：前厅通过智能POS系统整合多渠道订单，小程序集成预点餐功能；后厨采用KDS系统实现无纸化操作与订单协同；总部借助数据驾驶舱实时监控全国门店运营。该方案精准破解效率、体验、管理三大核心难题，支撑品牌年均5000万用餐人次的高效运转，成为正餐业“数字化+烟火气”协同发展的标杆案例。

湘菜品牌兰湘子现炒现做
卖家精灵将亮相浙江跨交会，以AI+大数据赋能华东卖家高效出海！

2025年11月25-27日，中国（浙江）跨境电商进出口交易会将在义乌国际博览中心举办。展会聚焦"专业化突围、品牌化出海、全球化布局"，设五大展区覆盖海外工厂、全链路服务、未来商业技术等，汇聚超1200家企业。依托义乌产业优势，结合AI智能选品与全域数据方案，助力卖家实现"选市场、找产品、链资源、学实操"全链路赋能，构建"买全球、卖全球"一站式跨境生态。

跨境电商进出口交易会供应链资源
快速部署、投资低！海尔集成式高效机房省电一半

11月12日，第11届建筑环境与能源应用技术交流大会在福州召开，聚焦能源转型与建筑低碳发展。针对国内多数制冷机房能效偏低、存在“大马拉小车”现象，海尔智慧楼宇推出集成式高效机房解决方案，具备快速部署、投资成本低、综合省电50%三大优势，实现“即装即用”。在腾讯上海青浦数据中心应用中，该方案大幅缩短部署周期。同时，针对老旧机房改造推出即插即用诊断箱，3-7天完成数据采集与诊断，助力能效跃升。某锂电池企业应用14套方案后，年省电费超千万元，综合节能率达52%。此外，磁悬浮方案在新领域表现卓越，东江赢合新能源产业基地采用后，年省电费约2500万元。未来，海尔将持续深耕细分场景，推动行业绿色升级，让高效节能成为建筑标配。

建筑环境能源应用低碳发展
geo生成式引擎优化是什么？GEO优化原理与工具推荐

在AI技术日新月异的今天，我们的信息获取方式正经历着一场革命。生成式引擎优化（Generative Engine Optimization，简称GEO）是AI搜索时代应运而生的新型优化策略，它被视为传统SEO在AI时代的进化版。与传统SEO专注于提升网页在搜索引擎结果中的排名不同，GEO的核心目标是让品牌信息能够被DeepSeek、豆包、文心一言等主流AI平台识别、引用并直接推荐给用户。这种转变是因为搜索�

GEO AI搜索生成式引擎优化

今日大家都在搜的词：

热文

3 天
7天

DeepSeek第三弹：开源DeepGEMM！

剪辑快人一步！索尼ICE-Cloud助力婚礼视频团队高效高质交付

微算法科技（NASDAQ MLGO）：以隐私计算区块链筑牢多方安全计算（MPC）安全防线

前DeepSeek研究员罗福莉已加入小米：全力奔赴AGI

你的品牌在豆包、DeepSeek里搜不到?这份GEO品牌监控攻略，3步把曝光拉满

DeepSeek崩了上热搜页面显示“服务器繁忙”

PCEVA深度评测：忆联AE531 QLC SSD以高效稳定，从容应对多元应用场景挑战

餐饮数字化转型标杆：睿食拓数智方案，助力兰湘子380+门店高效运营管理

卖家精灵将亮相浙江跨交会，以AI+大数据赋能华东卖家高效出海！

快速部署、投资低！海尔集成式高效机房省电一半

geo生成式引擎优化是什么？GEO优化原理与工具推荐

今日大家都在搜的词：

热文

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

卢伟冰：小米手机双11连续三年国产销量第一

95岁巴菲特每周还上5天班此前计划年底退休

京东发布双11战报：订单总量增长近60% 下单用户同比增长40%

荣耀500系列官宣：超级标准版+超级Pro版

荣耀500系列开启预约：Pro版外观首次亮相

站长商机