DeepSeek前实习生魔改MoE，用迭代机制把内存需求砍了42%，团队：“免费午餐”优化方法

2025-03-05 14:16 · 稿源：量子位公众号

DeepSeek MoE“变体”来了，200美元以内，内存需求减少17.6-42%!名叫CoE（Chain-of-Experts），被认为是一种“免费午餐”优化方法，突破了MoE并行独立处理token、整体参数数量较大需要大量内存资源的局限。与并行处理不同，CoE使专家能在单层内串行通信，形成一种迭代机制，即专家

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

前DeepSeek研究员罗福莉已加入小米：全力奔赴AGI

11月12日，“95后AI天才少女”罗福莉宣布加入小米MiMo大模型团队。她曾因“雷军千万年薪挖角”话题引发热议，拥有丰富AI研发经历，先后在幻方量化和DeepSeek参与大模型研发。罗福莉表示，将与团队致力于推动AI从语言迈向物理世界，全力构建通用人工智能。她的加入将为小米AI研究注入新活力。

AI天才少女小米大模型罗福莉
你的品牌在豆包、DeepSeek里搜不到?这份GEO品牌监控攻略，3步把曝光拉满

GEO指数是AI搜索时代的品牌可见度衡量指标，量化品牌被AI引用、推荐和对比的频率与深度。与传统SEO比拼搜索排名不同，GEO衡量的是品牌在AI回答中的提及率和好感度。数据显示，高GEO指数品牌在AI搜索中的转化率是传统SEO的3.4倍。文章通过案例说明，企业可通过监控竞品差距、补充缺失内容关键词、优化AI提示词等策略提升GEO指数。建议立即使用AIBase平台免费体验GEO监控，把握AI搜索新机遇。

GEO指数 AI搜索品牌能见度
DeepSeek崩了上热搜页面显示“服务器繁忙”

截至2025年11月3日，大量用户在微博话题#DeepSeek崩了#下集中反馈，DeepSeek平台出现服务异常状况，引发广泛关注。综合各方信息，此次故障呈现多方面表现，对用户使用造成显著影响。众多用户表示遭遇服务全面中断问题，在尝试使用平台

DeepSeek故障服务器异常服务中断
网上爆火的便秘果可以缓解便秘吗专家：不妨试试这些方法

近日，一款名为“便秘果”的产品在网络上迅速走红，不少消费者因听闻其能快速缓解便秘而纷纷尝试。然而，专家提醒，这款看似神奇的“便秘果”虽短期通便效果显著，但潜在风险却不容忽视，长期或随意使用可能带来严重健康问题。据了解，“便秘果”实为腊肠树的干燥果实，内含大黄素、番泻苷等蒽醌类泻药成分。这些成分通过强烈刺激肠道蠕动，能在饮用后几小

便秘果腊肠树果实蒽醌类泻药
荐AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；Kimi K2成功接入Perplexity

本期AI日报聚焦多项技术突破：蚂蚁集团"灵光"AI助手实现30秒生成可编辑应用；xAI推出免费Grok 4.1模型显著提升质量与速度；Poe推出200人群聊功能支持多模型协作；OceanBase发布首款AI数据库seekdb实现混合搜索；国产模型Kimi K2接入Perplexity展现国际竞争力；谷歌DeepMind推出通用智能体SIMA2在3D游戏中任务完成率达62%；ElevenLabs升级为一站式内容生成平台；昆仑万维推出轻量级多模态智能体Skywork R1V4-Lite，用户拍照即可自动完成任务。

AI助手蚂蚁集团灵光App
趣链科技牵头两项IEEE国际标准正式发布，全球技术标准再添“中国方案”

近日，IEEE标准协会正式发布由趣链科技牵头制定的两项区块链国际标准，标志着我国在数字技术国际标准化工作中取得重要突破。两项标准分别为《区块链即服务参考架构标准》和《区块链一体机参考架构标准》，由浙江大学等机构主导制定，多家产学研机构专家共同参与。标准规范了区块链服务化平台与软硬件融合系统的技术框架，将提升我国在全球区块链领域的标准制定能力与国际话语权，为产业协同创新提供支撑。

IEEE标准区块链即服务数字技术
2025空气净化器品牌权威解析：长效分解技术与滤网等级评测

《2025中国空气净化器行业白皮书》指出，新房装修带来的甲醛等污染是消费者购买的核心驱动力，占比达68.5%。报告强调，选购时需超越传统“三高一低”标准，重点关注分解式除醛技术（如纳米凝胶、贵金属催化剂）与滤网长期效能。文章详细解析了滤网技术差异：HEPA滤网针对固态污染物，而甲醛等气态污染物需催化分解技术避免二次污染。此外，滤网等级并非越高越好，需结合风道设计综合考量。最后，白皮书推荐了斯帝沃、飞利浦等十大品牌，并提供新房、母婴家庭等场景化选购指南，建议消费者依据实际需求理性选择。

空气净化器甲醛超标滤网技术
OceanBase发布首款AI数据库seekdb：三行代码构建AI应用实现百亿级多模数据混合搜索

今日，在2025 OceanBase年度发布会上，OceanBase发布并开源了其首款AI数据库OceanBase seekdb（简称seekdb）。开发者仅需三行代码，即可快速构建知识库、智能体等AI应用，轻松应对百亿级多模数据检索，真正实现开箱即用”的AI数据基座。该产品支持向量、全文、标量及空间地理数据的统一混合搜索，深度融合AI推理与数据处理，并兼容Hugging Face、LangChain等30余种主流AI框架。这一�

OceanBase AI数据库 seekdb
DTC2025|TCL华星印刷OLED小尺寸突破，全产业技术创新布局

2025年11月14日，TCL华星在苏州举办全球显示生态大会（DTC2025），以“臻图视界，印韵生辉”为主题。大会展示了AI技术成果及多款LCD、OLED、MLED新品，发布《视觉健康白皮书2.0》。TCL华星强调AI与显示深度融合，推出“AI五星架构”及星智X-Intelligence 3.0大模型，推动产业升级。重点技术包括印刷OLED、Micro LED等创新产品，如全球首款Real Stripe RGB OLED手机显示。公司致力于通过绿色制造和视觉健康技术，打造可持续显示生态，与合作伙伴共促产业转型。

TCL华星显示生态大会印刷OLED
全球开源技术峰会GOTC 2025 圆满落幕

11月2日，为期两天的全球开源技术峰会GOT C2025在北京圆满落幕。本届峰会聚焦开源与人工智能深度融合，汇聚全球顶尖专家、行业领袖与数千开发者，共同探讨开源驱动的AI未来蓝图。现场吸引超3000人次参与，线上直播观看量突破500万，全网曝光超6亿次。大会设立十二大专题论坛，覆盖大模型应用、AI编程、云原生AI等前沿领域，并发布Open AgentKit等关键项目。通过“论坛+市集�

开源技术人工智能全球峰会

今日大家都在搜的词：

热文

3 天
7天

DeepSeek前实习生魔改MoE，用迭代机制把内存需求砍了42%，团队：“免费午餐”优化方法

前DeepSeek研究员罗福莉已加入小米：全力奔赴AGI

你的品牌在豆包、DeepSeek里搜不到?这份GEO品牌监控攻略，3步把曝光拉满

DeepSeek崩了上热搜页面显示“服务器繁忙”

网上爆火的便秘果可以缓解便秘吗专家：不妨试试这些方法

荐AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；Kimi K2成功接入Perplexity

趣链科技牵头两项IEEE国际标准正式发布，全球技术标准再添“中国方案”

2025空气净化器品牌权威解析：长效分解技术与滤网等级评测

OceanBase发布首款AI数据库seekdb：三行代码构建AI应用实现百亿级多模数据混合搜索

DTC2025|TCL华星印刷OLED小尺寸突破，全产业技术创新布局

全球开源技术峰会GOTC 2025 圆满落幕

今日大家都在搜的词：

热文

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

华为Mate X7外观公布搭载全新折叠玄武架构

阿里巴巴回应千问崩了：状态良好欢迎来问

荣耀500系列官宣将于11月24日发布

小米超级小爱AI大模型推出随心修图功能

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

iPhone Pocket正式开售：联名三宅一生售价1299元起

1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

微信小程序将在iOS端支持接入虚拟支付苹果抽成15%

华为Mate X7外观公布搭载全新折叠玄武架构

华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

站长商机