首页 > 业界 > 关键词  > DeepSeek最新资讯  > 正文

DeepSeek第二炸:开源首个用于 MoE 模型训练通信库

2025-02-25 11:28 · 稿源: 快科技

快科技2月25日消息,今天是DeepSeek开源周第二日,一早,DeepSeek如约就放出了开源代码库DeepEP王炸。

据了解,DeepEP是首个用于 MoE 模型训练和推理的开源 EP 通信库,它填补了MoE模型专用通信工具的空白,为大规模分布式AI训练和实时推理场景提供了更高效的底层支持。

在这里,简单介绍一下DeepEP的技术性能特点:

1、高效通信架构

支持优化的全对全通信模式,实现节点内和节点间的NVLink与RDMA互联,提升数据传输效率

2、多精度与调度优化

原生支持FP8低精度运算调度,降低计算资源消耗。

3、重性能内核

据介绍,高吞吐量内核可适用于训练和推理预填充场景,最大化数据处理能力;

4、低延迟内核

它针对推理解码场景设计,采用纯RDMA通信和自适应路由技术,减少延迟。

5、资源控制与重叠机制

通过灵活的GPU资源控制策略,实现计算与通信过程的高效重叠,避免资源闲置。

6、深度优化场景

针对NVLink到RDMA的非对称带宽转发场景进行专项优化,提升异构网络下的传输性能;

此外,它还支持SM(Streaming Multiprocessors)数量动态控制,平衡不同任务(如训练与推理)的吞吐量需求。

DeepSeek第二炸:开源首个用于 MoE 模型训练通信库

举报

  • 相关推荐
  • 全新开源的DeepSeek-OCR,可能是最近最惊喜的模型。

    ​AI圈虽然天天卷,但是很多的模型,真的越来越无聊了。 每天就是跑分又多了几个点。 直到昨天,DeepSeek久违的发了一个新模型。 DeepSeek-OCR。 这玩意,是真的有点酷。

  • DeepSeek开源3B OCR模型:长文本识别达97%精度

    DeepSeek在GitHub开源新一代OCR模型,采用创新光学二维映射压缩技术,在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌,较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率,显著优于同类模型。该技术路径为OCR系统小型化提供解决方案,其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

  • 中国AI算力突围:东方超算Deep X算力盒子超国际竞品82%,重新定义行业标准

    中国公司东方超算发布Deep X G20系列AI工作站,在MLPerf测试中性能超越NVIDIA DGX Spark达82%,价格持平,实现性能与性价比"双超越"。产品搭载Intel Ultra 9285处理器和NVIDIA RTX PRO 5000显卡,AI算力达1824 TOPS,体积仅2.7L。通过三大技术创新实现突破:智能异构计算引擎提升资源利用率40%;统一推理运行时支持多框架;深度硬件优化提升关键算子性能50-200%。该产品打破国际巨头垄断,已在量化金融、医疗影像等领域实现显著投资回报,标志着中国AI硬件实现重要突破。

  • 生成式 AI 搜索优化(GEO)完全指南:从入门到落地

    随着生成式AI工具普及,用户更倾向直接提问而非传统搜索,导致优质内容可能被AI忽略。本文介绍生成式引擎优化(GEO)策略,帮助内容被AI理解、引用并整合进答案。核心包括:优化内容结构(如摘要、问答块、列表)、使用Schema标记、构建权威性,并推荐AIBase等工具监控引用效果。GEO是SEO的演进,需重塑写作方式以适应AI阅读逻辑。

  • AI时代品牌营销致胜秘诀:用数据驱动GEO优化,让AI排名持续在线

    当DeepSeek、豆包、文心一言等AI助手成为10亿用户的信息入口,品牌面临生死抉择:要么出现在AI推荐中,要么彻底消失。文章指出,AI营销与传统SEO完全不同,是一场没有终点的动态竞赛,需要持续投入和调整。品牌需建立“监测-分析-优化”闭环机制,使用专业工具实时监控排名波动,快速响应算法迭代和用户提问变化。成功关键在于让AI“看见”并“信任”品牌,通过补充权威数据、多媒体内容、长尾语义覆盖等方式提升可信度,在流量红利期抢占先机。

  • ​​AI搜索引擎优化新趋势:GEO生成式引擎优化如何提升品牌AI可见度?​

    AI时代品牌需抢占AI搜索优化(AISEO)与生成式引擎优化(GEO)先机。文章指出,随着豆包、文心一言等AI助手成为主要信息渠道,品牌在AI平台的可视度直接影响用户决策。核心策略包括:优化品牌在AI训练数据中的曝光,发布高质量内容;参与问答社区自然植入品牌;使用GEO排名工具监测优化效果。重点推荐AIBase平台的GEO查询工具,可覆盖主流AI平台并提供竞品分析和专业优化建议,帮助品牌提升AI推荐权重,抢占流量入口。

  • 本地业务如何获得AI推荐,生成式 GEO优化策略分享(含工具实操)

    本文探讨生成式AI时代本地业务如何抢占AI推荐入口。指出传统SEO已不足,需采用生成式GEO策略。核心要素包括:确保NAP信息精准一致、标注实时营业状态;创建结构化FAQ和场景化内容;通过多平台评价提升可信度;优化页面为"可被摘录"模式。文章提供五步操作流程,并推荐AIBase工具监测本地GEO表现,强调构建"快速回答+场景页面"模板是未来竞争关键。

  • 生成式引擎优化(GEO)到底该怎么做?如何让你的内容出现在 AI 回答框中?

    本文介绍生成式引擎优化(GEO)的概念,即通过优化内容让AI模型在回答中直接引用或推荐。与SEO针对搜索引擎排名不同,GEO核心在于让AI“认识”内容,策略包括采用问答结构、逻辑清晰的段落,强调品牌和功能点。推荐使用AIBase工具查询内容在AI搜索中的排名情况,帮助监控和提升可见性。

  • 如何提高自己网站在 AI 回答里的曝光?GEO 优化全攻略

    如今越来越多人不再使用传统搜索引擎,而是直接询问ChatGPT等AI工具。AI已成为新的信息分发入口,若你的网站内容能被AI直接引用、推荐或总结成回答,便能在生成式搜索时代抢占先机。这就是GEO(生成式引擎优化)的核心价值。文章提出优化内容结构、采用问答形式写作、增强权威性等实用技巧,并推荐使用AIBase工具实时监测内容在AI中的曝光情况。掌握GEO意味着让AI主动为你的内容“代言”。

  • GEO如何优化?GEO生成式引擎优化平台推荐

    在数字化浪潮席卷的当下,品牌在AI平台中的可见度成为众多企业关注的焦点。AIBase推出的GEO优化分析工具(https://app.aibase.com/zh/tools/geo)为品牌主提供了一站式AI平台品牌可见度检测与优化服务。 核心功能:该工具的核心功能是智能检测品牌在AI平台中的曝光情况,覆盖豆包、Deepseek、通义千问、腾讯元宝、文心一言等五大主流AI平台。用户通过简单操作,即可模拟真实用户搜�

今日大家都在搜的词: