首页 > 业界 > 关键词  > DeepSeek最新资讯  > 正文

DeepSeek前实习生魔改MoE,用迭代机制把内存需求砍了42%,团队:“免费午餐”优化方法

2025-03-05 14:16 · 稿源: 量子位公众号

DeepSeek MoE“变体”来了,200美元以内,内存需求减少17.6-42%!名叫CoE(Chain-of-Experts),被认为是一种“免费午餐”优化方法,突破了MoE并行独立处理token、整体参数数量较大需要大量内存资源的局限。与并行处理不同,CoE使专家能在单层内串行通信,形成一种迭代机制,即专家

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 前DeepSeek研究员罗福莉已加入小米:全力奔赴AGI

    11月12日,“95后AI天才少女”罗福莉宣布加入小米MiMo大模型团队。她曾因“雷军千万年薪挖角”话题引发热议,拥有丰富AI研发经历,先后在幻方量化和DeepSeek参与大模型研发。罗福莉表示,将与团队致力于推动AI从语言迈向物理世界,全力构建通用人工智能。她的加入将为小米AI研究注入新活力。

  • ​你的品牌在豆包、DeepSeek里搜不到?这份GEO品牌监控攻略,3步把曝光拉满

    GEO指数是AI搜索时代的品牌可见度衡量指标,量化品牌被AI引用、推荐和对比的频率与深度。与传统SEO比拼搜索排名不同,GEO衡量的是品牌在AI回答中的提及率和好感度。数据显示,高GEO指数品牌在AI搜索中的转化率是传统SEO的3.4倍。文章通过案例说明,企业可通过监控竞品差距、补充缺失内容关键词、优化AI提示词等策略提升GEO指数。建议立即使用AIBase平台免费体验GEO监控,把握AI搜索新机遇。

  • DeepSeek崩了上热搜 页面显示“服务器繁忙”

    截至2025年11月3日,大量用户在微博话题#DeepSeek崩了#下集中反馈,DeepSeek平台出现服务异常状况,引发广泛关注。综合各方信息,此次故障呈现多方面表现,对用户使用造成显著影响。 众多用户表示遭遇服务全面中断问题,在尝试使用平台

  • 网上爆火的便秘果可以缓解便秘吗 专家:不妨试试这些方法

    ​近日,一款名为“便秘果”的产品在网络上迅速走红,不少消费者因听闻其能快速缓解便秘而纷纷尝试。然而,专家提醒,这款看似神奇的“便秘果”虽短期通便效果显著,但潜在风险却不容忽视,长期或随意使用可能带来严重健康问题。 据了解,“便秘果”实为腊肠树的干燥果实,内含大黄素、番泻苷等蒽醌类泻药成分。这些成分通过强烈刺激肠道蠕动,能在饮用后几小

  • AI日报:xAI推出Grok 4.1;OceanBase发布首款AI数据库seekdb;Kimi K2成功接入Perplexity

    本期AI日报聚焦多项技术突破:蚂蚁集团"灵光"AI助手实现30秒生成可编辑应用;xAI推出免费Grok 4.1模型显著提升质量与速度;Poe推出200人群聊功能支持多模型协作;OceanBase发布首款AI数据库seekdb实现混合搜索;国产模型Kimi K2接入Perplexity展现国际竞争力;谷歌DeepMind推出通用智能体SIMA2在3D游戏中任务完成率达62%;ElevenLabs升级为一站式内容生成平台;昆仑万维推出轻量级多模态智能体Skywork R1V4-Lite,用户拍照即可自动完成任务。

  • 趣链科技牵头两项IEEE国际标准正式发布,全球技术标准再添“中国方案”

    近日,IEEE标准协会正式发布由趣链科技牵头制定的两项区块链国际标准,标志着我国在数字技术国际标准化工作中取得重要突破。两项标准分别为《区块链即服务参考架构标准》和《区块链一体机参考架构标准》,由浙江大学等机构主导制定,多家产学研机构专家共同参与。标准规范了区块链服务化平台与软硬件融合系统的技术框架,将提升我国在全球区块链领域的标准制定能力与国际话语权,为产业协同创新提供支撑。

  • 2025空气净化器品牌权威解析:长效分解技术与滤网等级评测

    《2025中国空气净化器行业白皮书》指出,新房装修带来的甲醛等污染是消费者购买的核心驱动力,占比达68.5%。报告强调,选购时需超越传统“三高一低”标准,重点关注分解式除醛技术(如纳米凝胶、贵金属催化剂)与滤网长期效能。文章详细解析了滤网技术差异:HEPA滤网针对固态污染物,而甲醛等气态污染物需催化分解技术避免二次污染。此外,滤网等级并非越高越好,需结合风道设计综合考量。最后,白皮书推荐了斯帝沃、飞利浦等十大品牌,并提供新房、母婴家庭等场景化选购指南,建议消费者依据实际需求理性选择。

  • OceanBase发布首款AI数据库seekdb:三行代码构建AI应用 实现百亿级多模数据混合搜索

    今日,在2025 OceanBase年度发布会上,OceanBase发布并开源了其首款AI数据库OceanBase seekdb(简称seekdb)。 开发者仅需三行代码,即可快速构建知识库、智能体等AI应用,轻松应对百亿级多模数据检索,真正实现开箱即用”的AI数据基座。 该产品支持向量、全文、标量及空间地理数据的统一混合搜索,深度融合AI推理与数据处理,并兼容Hugging Face、LangChain等30余种主流AI框架。 这一�

  • DTC2025|TCL华星印刷OLED小尺寸突破,全产业技术创新布局

    2025年11月14日,TCL华星在苏州举办全球显示生态大会(DTC2025),以“臻图视界,印韵生辉”为主题。大会展示了AI技术成果及多款LCD、OLED、MLED新品,发布《视觉健康白皮书2.0》。TCL华星强调AI与显示深度融合,推出“AI五星架构”及星智X-Intelligence 3.0大模型,推动产业升级。重点技术包括印刷OLED、Micro LED等创新产品,如全球首款Real Stripe RGB OLED手机显示。公司致力于通过绿色制造和视觉健康技术,打造可持续显示生态,与合作伙伴共促产业转型。

  • 全球开源技术峰会GOTC 2025 圆满落幕

    11月2日,为期两天的全球开源技术峰会GOT C2025在北京圆满落幕。本届峰会聚焦开源与人工智能深度融合,汇聚全球顶尖专家、行业领袖与数千开发者,共同探讨开源驱动的AI未来蓝图。现场吸引超3000人次参与,线上直播观看量突破500万,全网曝光超6亿次。大会设立十二大专题论坛,覆盖大模型应用、AI编程、云原生AI等前沿领域,并发布Open AgentKit等关键项目。通过“论坛+市集�

今日大家都在搜的词: