首页 > 业界 > 关键词  > DeepGEMM最新资讯  > 正文

DeepSeek第三弹:开源DeepGEMM!

2025-02-26 09:59 · 稿源: 快科技

快科技2月26日消息,今天上午9点,DeepSeek继续履行开源周承诺,发布了开源DeepGEMM。该帖子一经转发,立即引来了2.1万阅读量,足以见其在国内外受到追捧的热度。

据了解,DeepGEMM是一个专注于为FP8高效通用矩阵乘法(GEMM)库,支持普通及混合专家(MoE)分组的矩阵计算需求,可动态优化资源分配以提升算力效率。

该库基于CUDA开发,采用轻量级即时编译(JIT)模块,在运行时动态编译内核,无需预先编译安装。

值得一提的是,DeepGEMM设计目标是为DeepSeek-V3/R1模型的训练与推理提供简洁高效的底层支持,尤其针对Hopper架构GPU(如H800)优化,兼顾高性能与低成本。

作为开源周的第三项成果,DeepGEMM的发布延续了DeepSeek此前开源模型与工具(如FlashMLA)的策略,进一步降低高性能计算技术的应用门槛。

另外,本次开源属于DeepSeek开源周”(2月24日-28日)的第三项项目,此前已发布FlashMLA(高效解码内核)和DeepEP(专家并行通信库)

DeepSeek第三弹:开源DeepGEMM!

举报

  • 相关推荐
  • Vidda投影全矩阵新品重磅发布 引领三色激光进入AI计算影像新时代

    5月8日,以“有态度 就登场”为主题的海信& Vidda全场景新品发布会正式举行。Vidda智能投影携5款重磅新品集中亮相,涵盖C5Master、C5UltraMax、C5Ultra、C5ProMax四大旗舰机型,以及户外专属的LightGo流光派,不仅完成了从家用高端旗舰到便携户外场景的全赛道深度布局,更以跨代级的AI计算影像技术与硬件革新,重新定义三色激光投影的行业标准。价格方面,C5Master首发限时补贴到手�

  • DeepSeek专家模式无法上传文件 官方提示:目前资源紧张

    多位网友今日反馈,DeepSeek的专家模式”已无法上传文件,官方提示资源紧张,不支持文件上传”。 经测试,DeepSeek的网页端和App均已下线了专家模式”的上传文件功能。 目前,DeepSeek的快速模式”依然可以上传文件、图片等,不过还是仅识别图片中的文字。

  • DeepSeek回应聊天记录搜索:正在灰度测试 并非全量推送

    近日,不少网友在社交平台上发帖称,DeepSeek能查聊天记录了。 今日实测发现,DeepSeek网页版和APP页面均可通过关键词搜索,查询用户和DeepSeek之间的历史聊天内容。 将DeepSeek APP检查更新至2.1.0(213)版本后,其侧边栏顶部会新出现搜索聊天内容”搜索框。 框内输入关键词后页面会显示多条包含这个词的历史聊天记录,点击某条聊天记录即可定位至具体聊天位置。

  • 网易新闻、网易小蜜蜂已接入DeepSeek-V4 智能内容与社区体验全面升级

    近日,网易传媒旗下网易新闻和网易小蜜蜂正式接入DeepSeek-V4大模型,全面升级新闻资讯分发、智能内容创作、社区互动及个性化推荐等核心场景。此举旨在提升内容精准度与效率,优化随看随问、跟帖问答、AI搜索等模块,实现全链路智能化。同时,网易小蜜蜂推出“校园龙虾养成计划”,将AI融入年轻用户社交场景,打造趣味养成与社区互动新体验。未来,网易将持续探索AI在内容生态与智能社区领域的创新应用。

  • 腾讯宣布开源Agent Memory:Token消耗直降61% 虾马一键部署

    今日,腾讯云宣布正式开源TencentDB Agent Memory,面向Agent长任务场景提供短期记忆压缩与长期个性化记忆能力。 长期记忆已于上月上线免费使用,本次开源的重点则是短期记忆压缩。 随着Agent在代码开发、网页搜索、研究分析等场景中的任务链路持续变长,大量工具调用、网页内容和中间结果会快速占满上下文窗口,导致Token成本上升、任务状态丢失以及推理稳定性下降。 Agen

  • DeepSeek首次有了视觉能力,技术论文却被它连夜删掉了

    DeepSeek做了件罕见的事情:在终于开始灰测多模态能力后,它放出了一篇解释背后技术的论文,但这篇论文却在发布没多久就又被悄悄撤掉。 4月29日,DeepSeek研究员陈小康在X发布一条推文——现在,我们可以看见你了。配图中,DeepSeek 标志性的鲸鱼 logo 摘下眼罩,露出了眼睛。 过去,DeepSeek 最被外界熟知的是它在文本、代码和推理任务上的能力。但真实世界里的问题,并不总�

  • ​云计算规模持续扩张,业务连续性成为企业安全的新命题

    2026年中国云计算市场规模预计接近1.4万亿元,91%企业已采用多云或混合云架构。云已成为支撑AI、工业互联网等战略底座,但物理世界不确定性(如武装冲突、海底电缆中断)导致多可用区同时失效,传统云架构假设失效。企业需重新定义业务连续性边界,采用跨地域全球分布、策略随用户流动、混合架构的SASE方案,如Check Point SASE,以“中断必然发生”为前提,确保基础设施受损时核心运营仍可持续。

  • 时隔一个月又崩了!DeepSeek网页及API服务出现异常 官方称正在修复

    今日,多名用户在社交平台反馈DeepSeek服务异常,平台对话页面提示服务器繁忙,请稍后重试”。官方服务状态网站显示DeepSeek网页及API服务不可用。今日下午,官方状态页面更新信息,确认问题已定位,正在实施修复。

  • 微云全息(NASDAQ:HOLO)量子赋能大数据实时计算系统:技术创新与行业实践

    微云全息(NASDAQ:HOLO)研发出量子赋能大数据实时计算系统,通过将量子技术的并行性与纠错优势融入数据处理全流程,实现数据效能的跨越式提升。该系统采用“五模块协同架构”,涵盖量子纠错编码、量子增强计算引擎、量子算法库等核心模块,将传统小时级数据清洗压缩至分钟级,计算能效提升三个数量级,未来计划深化量子-经典混合计算在智能制造、元宇宙等领域的应用。

  • 填补空白!DeepSeek灰度上线识图模式

    DeepSeek正灰度测试识图模式,用户可在网页端和App端上传图片进行内容理解、描述与分析,填补了多模态能力的空白。该模式与快速、专家模式并列,作为独立一级入口存在,表明视觉理解被定位为核心能力。部分用户已可使用,但另一些用户虽看到入口却收到暂不可用的提示。实测显示,当前开放的主要是图片理解能力,涵盖视觉问答、截图分析等场景,尚未支持图像生成、视频理解或跨模态生成,更接近视觉语言模型范畴。

今日大家都在搜的词: