阿里通义千问开源Qwen1.5-MoE-A2.7B模型

2024-03-29 17:17 · 稿源：站长之家

站长之家(ChinaZ.com) 3月29日消息:通义千问团队推出了 Qwen 系列的首个 MoE 模型，命名为 Qwen1.5-MoE-A2.7B。这个模型只有27亿个激活参数，但性能却与当前最先进的70亿参数模型相媲美。与 Qwen1.5-7B 相比，Qwen1.5-MoE-A2.7B 只有20亿个非嵌入参数，大约是原模型大小的三分之一。此外，相较于 Qwen1.5-7B，Qwen1.5-MoE-A2.7B 的训练成本降低了75%，推理速度提升了1.74倍。

阿里云、通义千问

Qwen1.5-MoE 模型采用了特别设计的 MoE 架构。与传统 MoE 方法不同的是，Qwen1.5-MoE 使用了64个 finegrained experts，并引入了新的 routing 机制 DeepSeek-MoE 和 DBRX。这种 finegrained experts 设计的目的是在不增加参数数量的情况下生成更多 expert。Qwen1.5-MoE 模型在训练成本和推理效率方面表现出色，性能接近最先进的7B 模型。

Qwen1.5-MoE-A2.7B 模型拥有14.3亿激活参数和2亿非嵌入参数，训练成本降低了75%。在实验中，使用单个 NVIDIA A100-80G GPU 测试时，Qwen1.5-MoE-A2.7B 的推理速度提高了约1.74倍。Qwen1.5-MoE 模型已在 ModelScope 社区开源，可直接下载使用。

除了性能和效率，Qwen1.5-MoE 模型还将持续更新对第三方框架的支持，包括 llama.cpp、MLX 等。

总体来说，Qwen1.5-MoE 模型在性能、效率和推理速度方面取得了显著的优势，是推理训练的最佳实践之一。

Qwen1.5-MoE体验链接:

https://modelscope.cn/studios/qwen/qwen1.5-MoE-A2.7B-Chat-GPTQ-Int4-demo

（举报）

相关推荐

关键词：

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

本文汇总AI领域最新动态：OpenAI推出集成ChatGPT的Atlas浏览器，实现多任务自主处理；阿里通义千问新增2B/32B视觉语言模型，手机可流畅运行；谷歌AI Studio升级Vibe Coding功能，简化应用开发流程；百川发布医疗大模型M2Plus，通过循证推理降低误诊率；奇瑞墨甲机器人实现L3级技术突破，计划多行业应用；YouTube推出AI肖像识别工具，打击虚假内容；三星宣布2026年推出AI眼镜，融合AR与语音助手；Claude客户端更新，支持截图分析和语音交互功能。

AI OpenAI ChatGPT
苹果第四财季营收1024.7亿美元：净利润同比增长86%

苹果公司发布2025财年第四季度及全年财报，表现强劲。第四季度总净营收达1024.66亿美元，同比增长8%；净利润实现飞跃式增长，达274.66亿美元，增幅高达86%。iPhone作为核心产品，营收增长至490.25亿美元，有望创历史最佳成绩。服务业务营收大幅增长至287.50亿美元，成为新增长引擎。全球各大市场均呈积极态势，仅大中华区营收略有下降。CEO库克对12月季度营收创纪录充满信心。

苹果财报营收增长净利润
满头白发妈妈：宝宝生前27次进ICU 花费近200万元求医

近日，一则关于三岁宝宝橘宝与病魔顽强抗争的故事引发了广泛关注。橘宝出生时产检一切正常，然而出生后却立即被诊断出患有罕见病，具体病名未公开，从此踏上了与病魔斗争的艰难旅程。在橘宝短短三年的生命里，他累计27次进入ICU进行抢救，其中最严重的时候一天内就经历了三次生死攸关的抢救。为了挽救孩子的生命，全家不惜花费近200万元求医问药，妈妈更是停�

罕见病 ICU抢救医疗费用
淘宝京东双十一红包口令最新来了：2025淘宝和京东最新的双11统一红包口令是：天降红包8877 巅峰52小时

2025年双十一核心省钱时段为11月9日晚8点至11日24点，持续52小时。淘宝、京东两大平台集中释放全年最低价，所有红包、补贴、优惠券叠加使用。重点包括：平台满减、店铺券与“天降红包8877”通用红包组合；家电数码可叠加专属补贴，部分爆款直降40%-50%；30天价保机制兜底。建议按“国补→平台满减→店铺券→红包”顺序叠加优惠，通过搜索特定口令（如“家电补贴2000”）锁定补贴资格，实现最大化省钱目标。

双十一省钱攻略淘宝京东促销国补末班车
荐Qwen登顶AI赚钱大赛只是开始？“弃GPT投Qwen”已在硅谷蔓延开来

近期AI炒币大赛Alpha Arena引发关注，六款主流大模型用1万美元本金在币圈实战。戏剧性的是，被寄予厚望的GPT-5和Gemini因高杠杆操作亏损惨重，而中国开源模型表现亮眼——通义千问Qwen以53%回报率逆袭登顶，DeepSeek紧随其后。硅谷巨头Airbnb CEO公开表态依赖Qwen，投资人Chamath也承认将业务转向中国模型。市场用真金白银投票：预测平台押注Qwen胜率高达36%，远超OpenAI的3%。这场竞赛�

AI炒币大赛 Alpha Arena
荐AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功能；百度“文心”5.0重磅回归

本期AI日报聚焦多领域技术突破：美团发布全模态交互模型LongCat-Flash-Omni；阿里通义千问Qwen3-Max上线深度思考功能；百度文心5.0升级多模态生成能力；谷歌确认Gemini3年内发布并整合至苹果Siri；OpenAI向多国开放Sora2视频工具；云存储与AI开发工具持续优化，展现行业加速迭代态势。

AI 多模态实时交互
登榜LMArena！文心大模型5.0-Preview文本能力国内第一

11月8日，文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出，超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容；复杂长问题理解适用于学术问答、报告分析等任务；指令遵循能力支持智能助理、代码生成等场景，为多领域内容生产提供高效支撑。

文心模型 ERNIE-5.0 创意写作
重2.7公斤的实心不锈钢手机壳：就是故意的！要价1500元

近日在众筹平台上出现了可以说是世界上最重的手机壳6磅手机壳（6 Pound Phone Case）”。这款由实心不锈钢打造的保护壳重达2.7公斤，比许多游戏笔记本电脑还要沉重，其设计的目的只有一个：帮助用户减少使用智能手机的时间。如今智能手机都在朝着轻薄化

手机壳不锈钢减少使用
荐AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear模型；MiniMax Music 2.0 发布

本期AI日报聚焦多领域创新：昆仑万维推出SkyReels V3模型，整合顶尖视频生成能力；月之暗面Kimi Linear模型处理长文本速度提升2.9倍；MiniMax Music 2.0实现专业级音乐创作；字节跳动启动豆包股权激励计划吸引AI人才；苹果iOS 27将迎AI重大升级，Siri更个性化；Dia浏览器融合Arc设计理念与AI技术；文心魔法漫画工具实现一键生成连载作品；谷歌Gemini Canvas新增PPT自动生成功能，由Gemini 2.5 Pro驱动，提升职场效率。

AI视频生成 SkyReels V3
国补政策11月7日新消息：叠加2025双十一从11月9日晚8点持续到11日结束52小时内买最便宜，领取具体操作方法！

690亿元国家补贴最后窗口期11月7日开启！11月9日20:00至11日24:00的52小时为全年价格最低点，可享四重优惠叠加：政府补贴15-20%（家电最高2000元）、平台红包（最高11111元）、店铺优惠券及跨店满减。热门品类补贴额度以每小时3%速度消耗，部分爆款手机、空调预计12月中旬前断补。需通过京东/淘宝搜索指定口令领取资格，支付顺序必须为平台券→国补→红包→以旧换新，操作失误可能损失300-500元。建议提前完成实名认证、保存搜索记录，锁定库存确保享受最大优惠。

今日大家都在搜的词：

热文

3 天
7天

阿里通义千问开源Qwen1.5-MoE-A2.7B模型

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

苹果第四财季营收1024.7亿美元：净利润同比增长86%

满头白发妈妈：宝宝生前27次进ICU 花费近200万元求医

淘宝京东双十一红包口令最新来了：2025淘宝和京东最新的双11统一红包口令是：天降红包8877 巅峰52小时

荐Qwen登顶AI赚钱大赛只是开始？“弃GPT投Qwen”已在硅谷蔓延开来

荐AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功能；百度“文心”5.0重磅回归

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

重2.7公斤的实心不锈钢手机壳：就是故意的！要价1500元

荐AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear模型；MiniMax Music 2.0 发布

国补政策11月7日新消息：叠加2025双十一从11月9日晚8点持续到11日结束52小时内买最便宜，领取具体操作方法！

今日大家都在搜的词：

热文

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

华为Mate 70 Air维修备件价格公布：换主板2499元

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

华为路由X3 Pro今日开启预售：售价1299元起

站长商机