DeepSeek开源周第3天：发布DeepGEMM，FP8 GEMM库助力AI训练与推理

2025-02-26 09:33 · 来源： AIbase基地

中国人工智能公司DeepSeek在其“开源周”第3天宣布推出DeepGEMM——一款支持FP8通用矩阵乘法（GEMM）的开源库。这一工具专为密集型和混合专家(MoE)矩阵运算设计，为DeepSeek V3和R1模型的训练与推理提供强大支持。官方消息通过X平台发布，迅速引发技术社区的热烈反响。

据DeepSeek官方账号发布的帖子，DeepGEMM在NVIDIA Hopper GPU上可实现高达1350+ TFLOPS的FP8计算性能。其核心逻辑仅约300行代码，却能在大多数矩阵尺寸上超越专家调优的内核，展现了极高的效率和简洁性。该库无需复杂依赖，采用即时编译（Just-In-Time）技术，支持密集布局和两种MoE布局，设计上“像教程一样干净”，便于开发者学习和使用。

X用户@TechBitDaily评论称:“DeepGEMM的发布是DeepSeek开源周的一大亮点，其FP8性能和简洁设计令人印象深刻。”另一位用户@AIObserverCN指出，该库在支持MoE模型的高效训练方面具有显著优势，可能推动AI社区在Hopper架构上的进一步创新。

作为开源周的一部分，DeepGEMM的发布延续了DeepSeek推动AI技术透明化和社区协作的承诺。此前，该公司已在首两天发布了FlashMLA和DeepEP工具，分别聚焦于快速语言模型架构和专家并行通信。此次DeepGEMM的亮相，进一步展示了其在AI基础设施建设上的技术实力。业内人士认为，这款库不仅将提升DeepSeek自家模型的性能，也为全球开发者提供了一个高效、易用的矩阵运算工具，未来应用前景可期。用户现可通过GitHub获取DeepGEMM，探索其在AI训练与推理中的潜力。

项目地址：https://github.com/deepseek-ai/DeepGEMM

相关推荐

秘塔AI也终于悄悄上线了DeepResearch。

测试完以后，我觉得这玩意，还是值得我将近通宵写一篇的。深度研究，也就是DeepResearch。我过去写过很多次秘塔AI了，因为我自己的搜索习惯，现在基本就是，大活上ChatGPT用DeepResearch，常识问答直接找豆包，一般的AI搜索就是秘塔AI。当然很多ChatBot产品都有AI搜索，但是我自己这两年，还是习惯用秘塔AI和Perplexity这样形态的原生AI搜索产品了，这可能就是习惯的力量吧。
服务中小微企业，哪家城商行更优？DeepSeek答案是这样的

文章指出中小企业是中国经济的"毛细血管"，贡献了50%以上税收、60%以上GDP、70%以上技术创新和80%以上城镇就业。在融资难题下，城商行是关键一环。宁波银行凭借差异化战略定位、数字化赋能、产品创新和区域深耕，成为服务中小企业的标杆。其通过"四专"模式、智能风控系统和本土化服务，实现普惠小微贷款余额2199亿元，不良率连续18年低于1%。文章认为宁波

中小企业中国经济城商行
全球优质AI语音大模型盘点：Whisper、Gemini Speech

本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括：OpenAI Whisper（多语言识别与翻译）、Google Gemini（情感化语音生成）、Meta AudioCraft（音乐创作与风格转换）。国内讯飞星火（方言识别）、阿里通义（电商客服）、百度文心（车载场景）表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署

AI语音大模型语音交互技术多语言识别
OpenAI发布ChatGPT Agent智能体：支持写代码、做PPT、分析金融

OpenAI推出ChatGPT智能体，整合网页交互、数据搜索与多模态协作功能，可完成代码生成、PPT制作、金融分析等复杂任务。该智能体融合Operator的网页自动化操作、Deep Research的数据分析能力及优化后的GPT-4对话引擎三大核心模块。目前面向付费用户开放，Pro版近乎无限使用，其他版本每月限50次任务。OpenAI承认其仍存在金融建模需人工验证、非英语文本解析准确率低等技术局限，并

OpenAI ChatGPT智能体人工智能
INDEMIND：停止堆功能，扫地机器人需要回归第一性原理

文章批评当前扫地机器人行业过度追求"花哨"功能而忽视核心清洁能力的问题。厂商为差异化竞争不断叠加视频通话、机械手等创新功能，却导致产品复杂化、故障率上升，用户体验未获实质提升。指出行业应回归本质，聚焦感知、规划、决策三大核心能力升级，解决避障不佳、覆盖率低等基础痛点。介绍INDEMIND公司通过立体视觉技术构建三维语义地图，实现厘米级障碍
荐A日报：B站升级动漫视频生成模型AniSora V3；字节开源4D视频生成框架EX-4D；DeepSWE开源AI Agent系统强势登顶

AI日报栏目汇总了近期AI领域的重要进展：1)字节跳动开源EX-4D框架，可将单目视频转换为多视角4D视频；2)B站开源动漫视频生成模型AniSora V3，支持多种风格；3)DeepSWE+开源基于Qwen3-32B的AI Agent系统；4)字节开源3亿参数图像编辑模型VINCIE-3B；5)Stability AI推出移动端音频生成模型Stable Audio Open Small；6)谷歌发布免费教育AI工具套件Gemini for Education；7)Topview推出革命性AI数字人带货技术Avatar

人工智能 AI技术趋势 4D视频生成
领先OpenAI三个月，百度文库GenFlow领跑通用Agent领域，2.0版本8月上线

百度文库即将在8月发布GenFlow2.0版本，该版本具备更强大的多模态能力，支持生成多种内容形态，大幅缩短任务交付时间。相比OpenAI同日发布的ChatGPT+Agent，百度文库早在4月就已上线GenFlow1.0，实现全场景覆盖和全链路调度。GenFlow基于MoE架构，在成本、性能和效率上占优，能快速生成PPT、研报等多样化内容，且依托百度14亿专业文档资源，内容质量更可靠。此外，GenFlow还能调用用户个人数据实现个性化定制，并提供内容后期编辑功能，灵活性更高。
荐A日报：Kimi开放平台上线Kimi Playground；OpenAI重磅发布ChatGPT Agent；Suno推人声替换功能

【AI日报】汇总了近期AI领域重要进展：1)月之暗面推出Kimi Playground平台，实现从对话助手到智能助理的转变；2)OpenAI发布ChatGPT Agent，支持自主执行浏览、购物等任务；3)Suno发布v4.5+版本，新增人声替换等音乐创作功能；4)谷歌Veo3视频生成模型上线，支持文本转视频；5)全球首个直播流扩散模型MirageLSD发布，实现实时视频转换；6)VSCode编程助手Traycer提升大型代码库处理效率；7)ART框架支持Python一键训练AI Agent；8)NVIDIA语音识别模型Canary-Qwen-2.5B词错率创新低；9)Mistral AI推出Le Chat挑战ChatGPT；10)百度小度上线首个支持物理交互的MCP Server；11)Lightricks的LTXV模型实现60秒高质量视频生成；12)开源模型LTX-Video13B支持30倍速高清视频生成。
荐刚刚，OpenAI通用智能体ChatGPT Agent正式登场

Agent AI 时代，比我们想象中来得要早一些。北京时间周五凌晨，OpenAI 突然开启了新产品直播。本次发布的是全新的 ChatGPT Agent，它实现了通用智能体（Agent）能力的关键升级。
荐AI日报：智谱上线PPT生成功能AI Slides；可灵 AI 发布可图2.1模型

本文介绍了AI日报栏目及近期AI领域多项突破性进展：1)智谱推出免费AI Slides工具，基于GLM模型快速生成高质量PPT；2)可灵AI发布可图2.1模型，支持180多种风格图像生成；3)NVIDIA推出DiffusionRenderer技术，实现视频到可编辑3D场景转换；4)墨刀AI新增30秒生成高保真原型功能；5)Higgsfield推出Soul ID工具，10张照片即可生成虚拟形象；6)谷歌DeepMind开源GenAI Processors工具库；7)谷歌Veo新增图像转视频功能；8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

今日大家都在搜的词：

热文

3 天
7天

站长商机

广告

商务合作侵权投诉广告服务版权声明招聘

©CopyRight 2002-2020 CHINAZ.COM