昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE

2024-06-03 17:42 · 稿源：站长之家

站长之家(ChinaZ.com) 6月3日消息:2024年6月3日，昆仑万维宣布开源了一个性能强劲的2千亿稀疏大模型，名为 Skywork-MoE。这个模型是在之前开源的 Skywork-13B 模型的基础上扩展而来的，是首个完整应用并落地 MoE Upcycling 技术的开源千亿级 MoE 大模型。同时，这也是全球首个支持在单台4090服务器上进行推理的开源千亿级 MoE 大模型。

Skywork-MoE 的模型权重、技术报告完全开源，可以免费商用，无需申请。模型的总参数量为146B，激活参数量为22B，共有16个 Expert，每次激活其中的2个 Expert。与其他主流模型相比，在相同的激活参数量下，Skywork-MoE 的性能接近70B 的 Dense 模型，推理成本下降了近3倍。

微信截图_20240603174240.png

为了解决 MoE 模型训练困难、泛化性能差等问题，Skywork-MoE 采用了两种训练优化算法:Gating Logits 归一化操作和自适应的 Aux Loss。此外，为了高效进行大规模分布式训练，Skywork-MoE 提出了两个并行优化设计:Expert Data Parallel 和非均匀切分流水并行。

在推理方面，Skywork-MoE 是目前能够在8台4090服务器上进行推理的最大开源 MoE 模型。通过首创的非均匀 Tensor Parallel 并行推理方式，在 FP8量化下，Skywork-MoE 可以实现2200tokens/s 的吞吐。

•模型权重下载:

￮https://huggingface.co/Skywork/Skywork-MoE-base

￮https://huggingface.co/Skywork/Skywork-MoE-Base-FP8

•模型开源仓库:https://github.com/SkyworkAI/Skywork-MoE

•模型技术报告:https://github.com/SkyworkAI/Skywork-MoE/blob/main/skywork-moe-tech-report.pdf

•模型推理代码:（支持8x4090服务器上8bit 量化加载推理） https://github.com/SkyworkAI/vllm

（举报）

相关推荐

关键词：

昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

中国科学技术大学张燕咏团队在昇腾算力支持下，成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略，有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题，显著提升推理性能。实验显示，该方案在多项指标上较主流方案提升超30%，为昇腾技术优化MoE模型推理提供了宝贵借鉴，将加速其在各领域的落地应用。

人工智能大模型 MoE稀疏大模型
亿万克服务器方案：助互联网企业搭建AI算力

文章探讨了AI大模型发展背景下，传统互联网企业在算力搭建中面临的三大困境：计算性能瓶颈、资源利用率低、运维成本高。亿万克通过定制化AI算力方案，从硬件性能、软件优化和运维服务三个维度提供解决方案，帮助企业提升算力效率、降低成本，实现AI业务创新加速。

人工智能 AI算力大模型训练
荐AI日报：B站测试AI视频工具花生AI；腾讯发布多模态模型Large-Vision；昆仑万维开源Skywork UniPic 2.0

【AI日报】主要内容： 1. B站测试"花生AI"视频工具，3分钟可成片，同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0，实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI，苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision，支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐，仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新：恢复GPT-4o默认模式，为GPT-5引入多模式选择，优化交互体验

AI视频创作花生AI B站AI工具
荣耀Magic V Flip2今日开售：售价5499元起

影像能力堪称荣耀Magic V Flip2的一大亮点。作为行业首款2亿像素主摄小折叠，它也是小折叠品类中首款采用“端云结合”影像方案的机型，支持最高AIGC30倍变焦，同时还搭配一颗1200万像素超广角镜头，满足用户多样化的拍摄需求。在耐用性上，荣耀Magic V Flip2升级超坚韧50m UTG玻璃，获得SGS高品质耐久折叠认证，可实现50万次耐久折叠，确保屏幕5年长效平整，让用户使用更安心�

荣耀Magic V Flip2
荣耀Magic V Flip2发布：售价5499元起

昨日晚间，Magic V Flip2正式发布，这款被荣耀视为最强小折叠的产品，凭借全方位的升级与出色的配置，一经亮相便吸引了众多消费者的目光。在售价方面，荣耀Magic V Flip2提供了多个版本供消费者选择。其中，12GB +256GB、12GB +512GB和12GB +1TB版本售价分别为5499元、5999元和6499元;高定款（16GB +1TB）售价为7499元。该机型提供钛空灰、月影白、晨曦紫等丰富配色，高定款则采用独特的�

荣耀Magic V Flip2
荐中国UP主成为不了MrBeast

影视飓风创始人Tim刚刚结束的“100小时荒岛直播挑战”，无疑是一次B站在这个夏天难得的现象级事件——B站累计超过四千万观众进入直播间，全平台总观看量超过两亿，弹幕数以百万计，甚至带动了直播带货的即时转化。从数据到热搜，此次直播堪称完美演绎了“爆款”的逻辑。质疑声同样随之而来:这场直播与其说是“荒岛生存”，不如说是“带电度假”;也评论认为，它

影视飓风荒岛直播 B站直播
一图读懂荣耀Magic V Flip2：荣耀最强小折叠 5499元起

今晚，荣耀Magic V Flip2正式发布，起售价是5499元。荣耀Magic V Flip2全系搭载精研雾面金属中框，机身展开状态下薄至6.9mm，折叠状态下薄至15.5mm，重约204g，一手可握。影像上，荣耀Magic V Flip2配备了竖折首款2亿超清写真镜头，拥有1/1.4超大底传感器和2.24m等效大像素，轻松放大高清真实美，搭配50

荣耀Magic V Flip2
MCP模型库全面指南：AI开发者如何利用超12万个服务构建多功能智能体应用？

MCP协议正成为AI智能体开发的关键标准，其核心价值在于标准化、安全性和模块化。当前MCP生态虽繁荣但存在资源碎片化、质量参差不齐等痛点。AIbase MCP模型库通过一站式整合全球超12万服务，提供高可靠、低延迟的技术方案，大幅降低开发复杂度。该平台为企业级应用提供从概念验证到部署的全流程支持，帮助开发者聚焦核心业务逻辑，释放MCP生态的全部潜力。

MCP协议 AI智能体开发 Model
荐百川开源最新医疗大模型，中国力量领跑医疗AI赛道

专注医疗后，百川智能交出第一份答卷! 8月11日，百川智能发布第二款开源医疗增强推理大模型Baichuan-M2，其以32B的参数量，在OpenAI的Healthbench评测集上，超越其刚刚发布5天的开源模型gpt-oss-120b。

百川智能医疗大模型开源模型
荐Anthropic天价赔款？大模型“盗版”的100000种花样

AI大模型的秘密配方是什么?答案可能很简单:海量的“盗版内容”。这几乎是行业内公开的秘密。2023年，《纽约时报》一纸诉状将OpenAI和微软告上法庭，正式拉开了这场战争的序幕。很快，战火烧遍了整个硅谷。Meta因其Llama模型涉嫌使用盗版书籍而面临集体诉讼;Anthropic同样因其模型Claude的训练数据而被告，一时间，几乎所有头部玩家都被推上了被告席。这场大模型与版权�

AI大模型版权争议训练数据

昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE

昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

亿万克服务器方案：助互联网企业搭建AI算力

荐AI日报：B站测试AI视频工具花生AI；腾讯发布多模态模型Large-Vision；昆仑万维开源Skywork UniPic 2.0

荣耀Magic V Flip2今日开售：售价5499元起

荣耀Magic V Flip2发布：售价5499元起

荐中国UP主成为不了MrBeast

一图读懂荣耀Magic V Flip2：荣耀最强小折叠 5499元起

MCP模型库全面指南：AI开发者如何利用超12万个服务构建多功能智能体应用？

荐百川开源最新医疗大模型，中国力量领跑医疗AI赛道

荐Anthropic天价赔款？大模型“盗版”的100000种花样

今日大家都在搜的词：

热文

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

华为MatePad Mini官宣9月4日发布

2025民营企业500强揭晓：京东第一

SpaceX第10次试飞成功马斯克：星舰这次没有空中爆炸

小米澎湃OS3发布会官宣首批Beta版招募机型公布

今日七夕节微信 520 元大额红包限时上线

AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”

AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯

realme真我15000mAh电池容量手机亮相

iPhone17标准版或上高刷苹果2025秋季发布会定档9月10日

华为三折叠屏手机Mate XTs非凡大师上架开启预约

站长商机