性能与效率的双赢:Qwen3横空出世，MoE架构大幅降低部署成本

2025-04-29 15:09 · 来源： AIbase基地

阿里云旗下通义千问（Qwen）团队正式发布Qwen3系列模型，共推出8款不同规格的模型，覆盖从移动设备到大型服务器的全部应用场景。这是国内首个全面超越DeepSeek R1的开源模型，也是首个配备混合思维模式的国产模型。

模型阵容丰富，满足各类部署需求

Qwen3系列包含6款Dense模型和2款MoE模型:

Dense模型:0.6B、1.7B、4B、8B、14B、32B
MoE模型:
- Qwen3-235B-A22B （总参数235B，激活参数22B）
- Qwen3-30B-A3B （总参数30B，激活参数3B）

所有模型均支持128K上下文窗口，并配备了可手动控制的"thinking"开关，实现混合思维模式。

性能与效率的突破

Qwen3系列在同尺寸开源模型中性能领先，尤其是旗舰模型Qwen3-235B-A22B:

在代码、数学、通用能力等基准测试中与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro相比表现极具竞争力
部署成本仅为DeepSeek R1的35%

小型MoE模型Qwen3-30B-A3B同样令人惊艳:

激活参数仅为QwQ-32B的10%，性能反而更优
可在消费级显卡上部署运行

最小的0.6B模型专为移动设备优化，进一步扩展了Qwen3的应用范围。

多平台部署支持

Qwen3发布后立即获得了众多平台的"0day级支持":

在线体验:

通过官网直接对话:https://chat.qwen.ai/

本地部署:

Ollama:ollama run qwen3（后接参数可选择不同尺寸）
LM Studio:https://lmstudio.ai/
vLLM:支持v0.8.4以上版本
SGLang:需升级至0.4.6.post1
llama.cpp:支持量化版和动态量化版

API接入:

OpenRouterAI:提供免费API

特殊部署:

CPU部署:KTransformer支持混合CPU+GPU部署
Mac设备:支持mlx-lm，覆盖从iPhone到M3Ultra的全线产品

技术亮点

Qwen3的核心优势包括:

首个全面超越DeepSeek R1的国产开源模型
国内首个混合推理模型，复杂问题深度思考，简单问题快速响应
大幅降低部署要求，旗舰模型仅需4张H20卡
原生支持MCP协议，代码能力显著提升
支持119种语言和方言，包含多种地方性语言
训练数据达36万亿token，较Qwen2.5翻倍，融合网络内容、PDF文档和合成代码片段

Qwen3的发布标志着中国开源大模型进入新阶段，在性能与部署效率方面实现了双重突破。有兴趣的开发者可通过官方技术博客（https://qwenlm.github.io/blog/qwen3/）了解更多技术细节。

相关推荐

荐A日报：月之暗面开源大模型Kimi K2；智源全面开源RoboBrain2.0；通义千问发布Qwen Chat桌面客户端

本期AI日报重点报道了多项AI领域突破性进展：1.月之暗面推出万亿参数开源大模型Kimi K2，展现强大智能能力；2.智源研究院开源RoboBrain2.0和RoboOS2.0机器人系统；3.通义千问发布桌面客户端Qwen Chat；4.IndexTTS2实现影视级语音合成；5.HuggingFace开源机器人Reachy Mini热销；6.Meta推出实时视频生成模型StreamDiT；7.PixVerse新增多关键帧视频生成功能；8.特斯拉推出仅支持AMD处理器的Grok AI助手；9.OpenAI推迟开源大模型发布以加强安全测试；10.Liquid AI开源边缘AI模型LFM2；11.AI"时间穿越"特效在社交媒体走红。

人工智能开源大模型技术趋势
YY 直播首部 AIGC 真人短剧上线！实现了制作效率与成本控制的双重突破

YY直播旗下短剧厂牌麦芬推出首部AIGC真人短剧《权谋之帝王心术》，取材于平台主播真实故事，联合百度AIGC技术实现剧本创作与视觉制作的智能化。该剧制作成本较传统模式降低58%，周期缩短53%，通过多平台分发扩大传播范围。作为"生态短剧"创新尝试，既展现YY在内容领域的深耕，也验证了AIGC技术在影视制作中的降本增效能力，为行业探索"真实生态+智能技术"的内容生产新模式提供了实践样本。

YY直播短剧产业 AIGC技术
增量计算掀架构革命：云器定义新标准，Flink高成本遇挑战

云器科技提出"通用增量计算"技术，解决大数据处理痛点。相比传统流计算框架Flink，该技术采用"按需增量"模式，仅计算数据变化部分，在保证分钟级时效的同时大幅降低资源消耗。云器还制定了行业首个增量计算标准SPOT，推动技术生态发展。该技术已在小红书等企业应用，实现流批一体化开发，支持标准SQL语法，开发效率提升显著。增量计算代表数据处理第四范式革命，为中小企业数字化转型提供新可能。

通用增量计算大数据处理实时计算
快递面单打印新时代：汉印如何撑起“千亿件”物流效率？

2025年我国快递业务量突破1000亿件，提前35天达成目标，连续5年突破千亿大关。这既展现出内需潜力与电商渗透率的提升，也体现了中国数字物流体系的高效运转。快递面单作为物流系统的关键接口，汉印品牌凭借技术实力突破外资垄断，占据30%市场份额。2024年汉印获得"快递面单打印机全国销量第一"认证，并构建了覆盖全产业链的产品矩阵。其自主研发的热敏打印芯片全球市占率领先，10万平米智能制造基地确保产能稳定。汉印还参与制定国内首个电子面单打印机行业标准，推动物流数字化生态协同发展，助力中国快递产业高效、安全、智能化发展。
京东取消外卖超时20分钟免单服务官方回应：准时率已大幅提升

近日，社交平台上多位网友发帖称，京东外卖对原有的“超时20分钟免单”服务进行了调整，改为“超时20分钟赔付4元优惠券”。这一变动引发了消费者的广泛关注和讨论。针对这一疑问，京东方面迅速作出回应。京东表示，自推出超时保障服务以来，平台一直致力于优化配送体验，目前京东外卖订单的准时率已得到显著提升。为了进一步提供更全面的保障，覆盖更多常见场�
微星PAG 系列电源上市！ATX 3.1 金牌全模组助力暑假高性能装机

微星科技推出全新PAG G850/750/650LS PCIE5系列电源，专为高性能平台打造，符合ATX3.1规范，支持PCIe5.1原生接口，售价349元起。关键亮点：1）采用ATX3.1标准设计，可承受2倍整机功耗和3倍显卡功耗的瞬时峰值；2）配备16-Pin PCIe5.1接口，最高单接口输出600W；3）创新异色设计接口，便于判断插头是否插牢；4）通过80PLUS金牌认证，转换效率达90%；5）提供六重保护机制，确保安全稳定。该系列电源为新一代CPU和显卡提供强劲动力支持，是暑期装机的高性价比之选。
荐AI日报：阿里通义推Qwen-TTS模型；Cursor已支持网页和手机端；字节发布图像合成技术XVerse

【AI日报】今日AI领域7大突破：1）阿里通义Qwen-TTS实现方言语音合成重大突破；2）Cursor发布Web版AI编程工具；3）字节XVerse技术实现多对象精准图像生成；4）NoteGen跨平台AI笔记工具革新知识管理；5）ManimML动画库可视化Transformer架构；6）TEN+Agent开源语音交互技术降低延迟；7）Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

人工智能语音合成 Qwen-TTS
麒麟软件破解CVE修复困局：智能补丁管理实现十倍效率跃升

文章介绍了银河麒麟迁移运维平台提供的一站式CVE漏洞修复解决方案。该平台基于"预防-检测-响应-优化"闭环模型，覆盖漏洞全生命周期管理，具有补丁生命周期管理、智能漏洞分析、官方补丁高效分发等核心优势。平台支持热补丁技术实现内核漏洞"秒修"，保障业务连续性达99.99%，并适配混合云环境。某大型银行案例显示，该方案将高危漏洞修复时效从72小时缩短至4小时。平台基于国产银河麒麟操作系统开发，提供可视化运维界面，支持配置管理、漏洞修复、监控告警等核心运维场景，已广泛应用于金融、电信、政府等行业，助力企业提升安全防护能力。
还在为文献和写作头秃？这款“科研搭子”让你效率飙升！

OpenPaper是一款AI科研助手，旨在重塑从文献阅读到代码复现的全流程科研体验。它能快速提炼论文核心内容，通过思维导图呈现研究背景、方法、结论等关键信息；支持多篇文献横向对比，自动识别研究缺口；提供创新实验室功能，帮助生成研究假设和实验方案；还能辅助论文写作，从大纲构建到初稿润色。其代码实验室可解析复杂代码逻辑，指导环境配置和调试。OpenPaper坚持
谭章熹博士出席 RISC-V 中国峰会详解开源架构全球征程与中国机遇

2025年7月16日，第五届RISC-V中国峰会在上海张江科学会堂举行。作为中国大陆规格最高、规模最大的RISC-V专业会展，峰会吸引了全球专家与产业领袖参与。RISC-V国际基金会董事谭章熹博士发表主题演讲，回顾了RISC-V从伯克利起步到全球发展的历程，强调其开源、免费、无专利限制的特性推动了技术创新和生态繁荣。他指出，RISC-V基础指令集仅40余条，结构简洁但高度模块化，适用于从嵌入式设备到高性能计算领域。中国正积极建设RISC-V生态，预计2030年中国高性能RISC-V芯片市场规模将达2000-3000亿元，占全球20%-30%。谭博士表示，RISC-V发展重心正向AI加速、数据中心等高性能场景迈进，将与x86、ARM展开竞争，成为数字时代承载国家技术主权与产业升级的重要基础。

今日大家都在搜的词：

热文

3 天
7天

性能与效率的双赢:Qwen3横空出世，MoE架构大幅降低部署成本

模型阵容丰富，满足各类部署需求

性能与效率的突破

多平台部署支持

技术亮点

荐A日报：月之暗面开源大模型Kimi K2；智源全面开源RoboBrain2.0；通义千问发布Qwen Chat桌面客户端

YY 直播首部 AIGC 真人短剧上线！实现了制作效率与成本控制的双重突破

增量计算掀架构革命：云器定义新标准，Flink高成本遇挑战

快递面单打印新时代：汉印如何撑起“千亿件”物流效率？

京东取消外卖超时20分钟免单服务官方回应：准时率已大幅提升

微星PAG 系列电源上市！ATX 3.1 金牌全模组助力暑假高性能装机

荐AI日报：阿里通义推Qwen-TTS模型；Cursor已支持网页和手机端；字节发布图像合成技术XVerse

麒麟软件破解CVE修复困局：智能补丁管理实现十倍效率跃升

还在为文献和写作头秃？这款“科研搭子”让你效率飙升！

谭章熹博士出席 RISC-V 中国峰会详解开源架构全球征程与中国机遇

今日大家都在搜的词：

热文

华为 MatePad Pro 12.2 英寸 2025 官宣 7 月 24 日发布

A日报：Stability AI发布实时重建模型SPAR3D；火山引擎“奇美拉

黄仁勋：总感觉公司快倒闭了任CEO没有趣味每一秒都有压力

苹果iOS 26公测版本周发布：预计7月23日亮相

小米REDMI首部短剧《时空合伙人》收官雷军“声音”亮相成惊喜

华为Pura 80标准版7月23日开启预售

特斯拉Model3全球销量达300万辆夏日福利大放送

京东首家自营外卖门店开业宣布 3 年内建设 1 万家七鲜小厨

雷军称特斯拉保值率非常不错但小米SU7保值率领先特斯拉

小红书支持发布语音评论官方回应：内测中

A日报：Kimi开放平台上线Kimi Playground；OpenAI重磅发布Chat

理想小米同一个地方开发布会：理想i8发布会定于首都国际会议中

华为鸿蒙智行：尊界S800上市50天大定破8000台

华为 MatePad Pro 12.2 英寸 2025 官宣 7 月 24 日发布

贾跃亭旗下FF获1.05亿美元融资将加速FX Super One生产交付

华为MatePad Pro 12.2开启预约预计7月24日正式发布

小米骨传导耳机2发布：699元 7月21日开售

小米深圳大厦开园：卢伟冰现场喝小米粥

A日报：Stability AI发布实时重建模型SPAR3D；火山引擎“奇美拉

理想i8开启预定：7月29日上市预售价35-40万元

站长商机