DeepSeek代码开源周收官，世界已经变了

2025-03-01 12:47 · 稿源： TechWeb.com.cn

3月1日消息，AI公司DeepSeek为期五天的 “代码开源周” 告一段落。

本周一至周五，DeepSeek以每日不定时一更的频率，开源多个代码库，涵盖FlashMLA、DeepEP通信库、DeepGEMM、并行优化策略、并行文件系统3FS。

DeepSeek认为：通用人工智能（AGI）不存在“高高在上的象牙塔”，而是秉持车库创业精神，与社区共同构建创新力量。

五天的代码开源，展示了DeepSeek在优化大模型训练、推理、通信以及文件系统方面的技术创新与突破。这些开源项目不仅提升了AI模型的性能和效率，也为AI领域的研究者和开发者提供了宝贵的资源和工具。

从模型开源，到代码开源，DeepSeek凭一己之力，重塑了大模型世界。

英伟达跌落神坛

在这一周里，AI大模型火起来至今的最大赢家（赚钱最多）英伟达发布了最新财报。但是股价已经连跌多日，从130多美元跌到120美元左右。

英伟达2025财年第四季度营收同比增长78%，较此前连续五个季度三位数增长的态势显著放缓，且同比增速为近两年来最低水平。2024财年第四季度曾达到265%的峰值‌。

分析师们在分析英伟达营收增速放缓的原因时认为一方面是微软、Meta等核心客户同步研发自研芯片以减少对英伟达的依赖；一方面是‌DeepSeek-R1低成本AI模型降低算力需求，部分削弱市场对英伟达高端芯片的依赖‌。

当日，英伟达股价大跌8.5%，市值蒸发2740亿美元。

一个月前，DeepSeek发布的低成本、高性能开源推理模型R1引发市场震动，英伟达股价一度暴跌近17%。

尽管英伟达CEO黄仁勋强调，DeepSeek的开源工具和低成本模型虽然对行业产生了冲击，但英伟达通过软硬件协同优化，依然保持了在AI芯片领域的领先地位。

但是也未能阻止投资者对其业绩增速放缓、毛利率下降及中国AI公司DeepSeek的影响的担忧。

被改变的还有同行。

OpenAI最新大模型GPT-4.5被槽太贵

闭源大模型no1的OpenAI在周五发布了最新的最强大模型GPT-4.5，当然也是最贵的。

GPT-4.5是OpenAI史上参数规模最大的模型，其计算量是上一代的10倍。GPT-4.5的API价格为每百万Tokens 75美元，相较上一代GPT-4o的2.5美元上涨30倍。

GPT-4.5不是一个专注于推理的模型，GPT-4.5并不能完全替代GPT-4o，在基准测试中它的某些能力低于o1、o3-mini。

这款被网友吐槽“贵得要死”的大模型，并没能如OpenAI此前的历届旗舰大模型发布时一样引发好评热议如潮。现在，更多人会用DeepSeek来酸它：有免费好用的DeepSeek开源可用，给我一个花这么多钱用你的理由？

附上DeepSeek代码开源周内容：

2月24日：Flash MLA开源

（详情： https://www.techweb.com.cn/it/2025-02-24/2957370.shtml）

‌开源内容‌：DeepSeek开源了Flash MLA，这是一个针对英伟达Hopper GPU优化的高效MLA（Multi-head Latent Attention，多头潜注意力）解码内核。

‌核心特性‌：特别针对可变长度序列进行优化，使用基准为Hopper GPU、CUDA 12.3及以上版本、PyTorch 2.0及以上版本。在H800 SXM5平台上，内存受限配置下可达最高3000GB/s，计算受限配置下可达峰值580 TFLOPS。

‌技术亮点‌：FlashMLA的设计参考了FlashAttention 23以及CUTLASS的技术实现，通过KV压缩与潜在变量、低秩降维技术、动态序列处理等优化，显著减少了大模型训练和推理过程中的内存占用。

2月25日：DeepEP通信库开源

（详情：https://www.techweb.com.cn/it/2025-02-25/2957421.shtml）

‌开源内容‌：DeepSeek开源了DeepEP，这是一个用于MoE（混合专家）模型训练和推理的EP（Expert Parallelism）通信库。

‌核心特性‌：为所有GPU内核提供高吞吐量和低延迟，支持低精度操作（包括FP8）。针对NVLink到RDMA的非对称带宽转发场景进行深度优化，提供高吞吐量，并支持SM数量控制。

‌技术亮点‌：对于对延迟敏感的推理解码，DeepEP包含一组低延迟内核和纯RDMA，以最大限度地减少延迟。同时，引入了一种基于钩子的通信计算重叠方法，不占用任何SM资源。

2月26日：DeepGEMM代码库开源

‌（详情：https://www.techweb.com.cn/it/2025-02-26/2957487.shtml）

开源内容‌：DeepSeek开源了DeepGEMM代码库，专为简洁高效的FP8通用矩阵乘法（GEMMs）而设计。

‌核心特性‌：同时支持普通的和专家混合（MoE）分组的GEMM运算，为V3/R1训练和推理提供动力支持。使用CUDA编写，无需编译，通过轻量级即时编译模块在运行时编译所有内核。

‌技术亮点‌：DeepGEMM设计简洁，代码量约为300行，但性能在各种矩阵形状上与专家调优的库相匹配或超越。在H800上测试，计算性能最高可达1358 TFLOPS，内存宽带最高可达2668 GB/s。

2月27日：并行优化策略开源

（详情：https://www.techweb.com.cn/internet/2025-02-27/2957552.shtml）

开源内容‌：DeepSeek开源了三项并行优化策略，包括DualPipe、EPLB和Profile-data。

DualPipe‌：一种用于V3/R1模型训练中实现计算与通信重叠的双向流水线并行算法，显著减少管道气泡（空闲时间）。

EPLB‌：一个针对V3/R1的专家并行负载均衡工具，根据估计的专家负载计算平衡的专家复制和放置计划。

Profile-data‌：DeepSeek基础设施中的数据分析，包括来自训练和推理框架的性能剖析数据，旨在帮助社区更深入地理解通信与计算重叠策略及相关底层实现细节。

2月28日：3FS文件系统开源

‌（详情：https://www.techweb.com.cn/internet/2025-02-28/2957580.shtml）

开源内容‌：DeepSeek开源了Fire-Flyer文件系统（3FS），一个高性能并行文件系统。

‌核心特性‌：应对AI训练和推理工作负载的挑战，利用现代SSD和RDMA网络提供共享存储层，简化分布式应用程序的开发。在由180个存储节点组成的大型测试集群上，总读取吞吐量达到约6.6个TIB/S。

‌技术亮点‌：3FS的主要功能和优势包括性能和可用性、强一致性、文件接口开发、多样化的工作负载（如数据准备、数据加载器、检查点、用于推理的KVCache）等。

（举报）

相关推荐

关键词：

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
全新开源的DeepSeek-OCR，可能是最近最惊喜的模型。

AI圈虽然天天卷，但是很多的模型，真的越来越无聊了。每天就是跑分又多了几个点。直到昨天，DeepSeek久违的发了一个新模型。 DeepSeek-OCR。这玩意，是真的有点酷。

DeepSeek-OCR AI模型 OCR技术
百度智能云这项开源，让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

10月28日，百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测（MTP）技术代码。该技术通过批量生成和集中验证机制，使模型解码吞吐量提升超2倍，突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配，并经过百度内部业务验证，开发者可"开箱即用"获得稳定可靠的推理加速能力。

百度智能云 DeepSeek-V3.2 MTP技术
人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

10月28日，麒麟信安人工智能孵化器在长沙启动，旨在汇聚AI领域人才、技术与资本，构建开放协同的创新生态。该项目获湖南省多部门支持，已吸引60余个项目入围，组建了首批30余位专家导师团，并与多家顶尖机构共建联合体，通过政策扶持、资本对接等多维度赋能，培育优质AI项目在湘落地发展，助力区域打造人工智能产业创新高地。

人工智能孵化器麒麟信安创新创业
DeepSeek开源3B OCR模型：长文本识别达97%精度

DeepSeek在GitHub开源新一代OCR模型，采用创新光学二维映射压缩技术，在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌，较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率，显著优于同类模型。该技术路径为OCR系统小型化提供解决方案，其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

DeepSeek-OCR 光学二维映射压缩长文本识别
卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力，近日正式加入中国人工智能产业发展联盟（AIIA），成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可，未来将携手联盟推动AI技术研发与产业化，助力中国品牌全球化。依托八年积累的海量电商数据与算法体系，卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案，服务超百万跨境卖家，显著提升运营效率与决策精准度。

人工智能跨境电商 AI大数据
行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

2025年10月，海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业，标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程，确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品，推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术，为用户提供更安全、智能的健康饮食体验。

冰箱品牌人工智能技术海尔冰箱
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲，强调高质量数据集是人工智能产业决胜关键。他指出，算力、算法和数据构成AI三大要素，而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施，通过集中管理、分散赋能模式，打通数据采集、治理到AI训练全链路，推动产业智能化升级。该平台已在制造、金融等领域落地，助力企业释放数据要素价值，实现弯道超车。

人工智能数据基础设施数字经济
品牌在deepseek、豆包里排第几?免费GEO排名查询工具帮你一键看清

随着AI搜索普及，传统SEO正被GEO（生成式引擎优化）取代。GEO核心是提升品牌在AI生成答案中的可见度，而非获取点击流量。数据显示超60%用户已使用AI搜索，若品牌未被AI提及将失去流量入口。文章推荐免费工具AIBase，支持多平台一键检测品牌在主流AI助手的曝光排名、竞品对比及可视化报告，并提供内容权威性、语义化表达等GEO优化策略，帮助品牌在AI时代建立竞争优势。

今日大家都在搜的词：

热文

3 天
7天

DeepSeek代码开源周收官，世界已经变了

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

全新开源的DeepSeek-OCR，可能是最近最惊喜的模型。

百度智能云这项开源，让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

人工智能巨头OpenAI拟上市估值或高达1万亿美元

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

DeepSeek开源3B OCR模型：长文本识别达97%精度

卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

品牌在deepseek、豆包里排第几?免费GEO排名查询工具帮你一键看清

今日大家都在搜的词：

热文

iPhone锁屏滑动相机能关闭了苹果iOS 26.1 RC准正式版发布

AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅

鸿蒙智行：全新问界M7上市36天交付破20000台

OPPO ColorOS 16正式版推送：首批适配11款机型

小米17 Pro系列妙享背屏全新掌机游戏等新功能上线

AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑

微信升级：支持一次撤回全部消息、删好友能保留聊天记录等功能

美股4万亿美元市值上市公司已达3家苹果、微软、英伟达组成三巨

微信红包封面现已支持跳转「微信小店」

iPhone 18系列或将首发自研基带C2

iPhone锁屏滑动相机能关闭了苹果iOS 26.1 RC准正式版发布

一加15今晚发布定位全能水桶机

AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度

AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅

AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI

红米REDMI K90全方位提升雷军：是不是越来越有旗舰气质

鸿蒙智行：全新问界M7上市36天交付破20000台

iPhone18发布或推迟苹果明年9月只发Pro系列和Fold折叠屏

余承东曝鸿蒙智行新款享界S9将于11月上市

华为余承东：鸿蒙智行全系交付突破100万台仅用43个月

站长商机