首页 > 业界 > 关键词  > 开源技术最新资讯  > 正文

昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE

2024-06-03 17:42 · 稿源:站长之家

站长之家(ChinaZ.com) 6月3日 消息:2024年6月3日,昆仑万维宣布开源了一个性能强劲的2千亿稀疏大模型,名为 Skywork-MoE。这个模型是在之前开源的 Skywork-13B 模型的基础上扩展而来的,是首个完整应用并落地 MoE Upcycling 技术的开源千亿级 MoE 大模型。同时,这也是全球首个支持在单台4090服务器上进行推理的开源千亿级 MoE 大模型。

Skywork-MoE 的模型权重、技术报告完全开源,可以免费商用,无需申请。模型的总参数量为146B,激活参数量为22B,共有16个 Expert,每次激活其中的2个 Expert。与其他主流模型相比,在相同的激活参数量下,Skywork-MoE 的性能接近70B 的 Dense 模型,推理成本下降了近3倍。

微信截图_20240603174240.png

为了解决 MoE 模型训练困难、泛化性能差等问题,Skywork-MoE 采用了两种训练优化算法:Gating Logits 归一化操作和自适应的 Aux Loss。此外,为了高效进行大规模分布式训练,Skywork-MoE 提出了两个并行优化设计:Expert Data Parallel 和非均匀切分流水并行。

在推理方面,Skywork-MoE 是目前能够在8台4090服务器上进行推理的最大开源 MoE 模型。通过首创的非均匀 Tensor Parallel 并行推理方式,在 FP8量化下,Skywork-MoE 可以实现2200tokens/s 的吞吐。

•模型权重下载:

○https://huggingface.co/Skywork/Skywork-MoE-base

○https://huggingface.co/Skywork/Skywork-MoE-Base-FP8

•模型开源仓库:https://github.com/SkyworkAI/Skywork-MoE

•模型技术报告:https://github.com/SkyworkAI/Skywork-MoE/blob/main/skywork-moe-tech-report.pdf

•模型推理代码:(支持8x4090服务器上8bit 量化加载推理) https://github.com/SkyworkAI/vllm

举报

  • 相关推荐
  • 昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

    中国科学技术大学张燕咏团队在昇腾算力支持下,成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略,有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题,显著提升推理性能。实验显示,该方案在多项指标上较主流方案提升超30%,为昇腾技术优化MoE模型推理提供了宝贵借鉴,将加速其在各领域的落地应用。

  • 亿万克服务器方案:助互联网企业搭建AI算力

    文章探讨了AI大模型发展背景下,传统互联网企业在算力搭建中面临的三大困境:计算性能瓶颈、资源利用率低、运维成本高。亿万克通过定制化AI算力方案,从硬件性能、软件优化和运维服务三个维度提供解决方案,帮助企业提升算力效率、降低成本,实现AI业务创新加速。

  • AI日报:B站测试AI视频工具花生AI;腾讯发布多模态模型Large-Vision;昆仑万维开源Skywork UniPic 2.0

    【AI日报】主要内容: 1. B站测试"花生AI"视频工具,3分钟可成片,同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0,实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI,苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐,仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新:恢复GPT-4o默认模式,为GPT-5引入多模式选择,优化交互体验

  • 荣耀Magic V Flip2今日开售:售价5499元起

    影像能力堪称荣耀Magic V Flip2的一大亮点。作为行业首款2亿像素主摄小折叠,它也是小折叠品类中首款采用“端云结合”影像方案的机型,支持最高AIGC30倍变焦,同时还搭配一颗1200万像素超广角镜头,满足用户多样化的拍摄需求。 在耐用性上,荣耀Magic V Flip2升级超坚韧50m UTG玻璃,获得SGS高品质耐久折叠认证,可实现50万次耐久折叠,确保屏幕5年长效平整,让用户使用更安心�

  • 荣耀Magic V Flip2发布:售价5499元起

    昨日晚间,Magic V Flip2正式发布,这款被荣耀视为最强小折叠的产品,凭借全方位的升级与出色的配置,一经亮相便吸引了众多消费者的目光。 在售价方面,荣耀Magic V Flip2提供了多个版本供消费者选择。其中,12GB +256GB、12GB +512GB和12GB +1TB版本售价分别为5499元、5999元和6499元;高定款(16GB +1TB)售价为7499元。该机型提供钛空灰、月影白、晨曦紫等丰富配色,高定款则采用独特的�

  • 中国UP主成为不了MrBeast

    影视飓风创始人Tim刚刚结束的“100小时荒岛直播挑战”,无疑是一次B站在这个夏天难得的现象级事件——B站累计超过四千万观众进入直播间,全平台总观看量超过两亿,弹幕数以百万计,甚至带动了直播带货的即时转化。 从数据到热搜,此次直播堪称完美演绎了“爆款”的逻辑。 质疑声同样随之而来:这场直播与其说是“荒岛生存”,不如说是“带电度假”;也评论认为,它

  • 一图读懂荣耀Magic V Flip2:荣耀最强小折叠 5499元起

    今晚,荣耀Magic V Flip2正式发布,起售价是5499元。 荣耀Magic V Flip2全系搭载精研雾面金属中框,机身展开状态下薄至6.9mm,折叠状态下薄至15.5mm,重约204g,一手可握。 影像上,荣耀Magic V Flip2配备了竖折首款2亿超清写真镜头,拥有1/1.4超大底传感器和2.24m等效大像素,轻松放大高清真实美,搭配50

  • MCP模型库全面指南:AI开发者如何利用超12万个服务构建多功能智能体应用?

    MCP协议正成为AI智能体开发的关键标准,其核心价值在于标准化、安全性和模块化。当前MCP生态虽繁荣但存在资源碎片化、质量参差不齐等痛点。AIbase MCP模型库通过一站式整合全球超12万服务,提供高可靠、低延迟的技术方案,大幅降低开发复杂度。该平台为企业级应用提供从概念验证到部署的全流程支持,帮助开发者聚焦核心业务逻辑,释放MCP生态的全部潜力。

  • 百川开源最新医疗大模型,中国力量领跑医疗AI赛道

    专注医疗后,百川智能交出第一份答卷! 8月11日,百川智能发布第二款开源医疗增强推理大模型Baichuan-M2,其以32B的参数量,在OpenAI的Healthbench评测集上,超越其刚刚发布5天的开源模型gpt-oss-120b。

  • Anthropic天价赔款?大模型“盗版”的100000种花样

    ​AI大模型的秘密配方是什么?答案可能很简单:海量的“盗版内容”。 这几乎是行业内公开的秘密。2023年,《纽约时报》一纸诉状将OpenAI和微软告上法庭,正式拉开了这场战争的序幕。很快,战火烧遍了整个硅谷。Meta因其Llama模型涉嫌使用盗版书籍而面临集体诉讼;Anthropic同样因其模型Claude的训练数据而被告,一时间,几乎所有头部玩家都被推上了被告席。 这场大模型与版权�

今日大家都在搜的词: