首页 > AI头条  > 正文

性能与效率的双赢:Qwen3横空出世,MoE架构大幅降低部署成本

2025-04-29 15:09 · 来源: AIbase基地

阿里云旗下通义千问(Qwen)团队正式发布Qwen3系列模型,共推出8款不同规格的模型,覆盖从移动设备到大型服务器的全部应用场景。这是国内首个全面超越DeepSeek R1的开源模型,也是首个配备混合思维模式的国产模型。

模型阵容丰富,满足各类部署需求

Qwen3系列包含6款Dense模型和2款MoE模型:

  • Dense模型:0.6B、1.7B、4B、8B、14B、32B
  • MoE模型:
    • Qwen3-235B-A22B (总参数235B,激活参数22B)
    • Qwen3-30B-A3B (总参数30B,激活参数3B)

所有模型均支持128K上下文窗口,并配备了可手动控制的"thinking"开关,实现混合思维模式。

QQ20250429-150719.png

性能与效率的突破

Qwen3系列在同尺寸开源模型中性能领先,尤其是旗舰模型Qwen3-235B-A22B:

  • 在代码、数学、通用能力等基准测试中与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro相比表现极具竞争力
  • 部署成本仅为DeepSeek R1的35%

小型MoE模型Qwen3-30B-A3B同样令人惊艳:

  • 激活参数仅为QwQ-32B的10%,性能反而更优
  • 可在消费级显卡上部署运行

最小的0.6B模型专为移动设备优化,进一步扩展了Qwen3的应用范围。

QQ20250429-150730.png

多平台部署支持

Qwen3发布后立即获得了众多平台的"0day级支持":

在线体验:

  • 通过官网直接对话:https://chat.qwen.ai/

本地部署:

  • Ollama:ollama run qwen3(后接参数可选择不同尺寸)
  • LM Studio:https://lmstudio.ai/
  • vLLM:支持v0.8.4以上版本
  • SGLang:需升级至0.4.6.post1
  • llama.cpp:支持量化版和动态量化版

API接入:

  • OpenRouterAI:提供免费API

特殊部署:

  • CPU部署:KTransformer支持混合CPU+GPU部署
  • Mac设备:支持mlx-lm,覆盖从iPhone到M3Ultra的全线产品

技术亮点

Qwen3的核心优势包括:

  • 首个全面超越DeepSeek R1的国产开源模型
  • 国内首个混合推理模型,复杂问题深度思考,简单问题快速响应
  • 大幅降低部署要求,旗舰模型仅需4张H20卡
  • 原生支持MCP协议,代码能力显著提升
  • 支持119种语言和方言,包含多种地方性语言
  • 训练数据达36万亿token,较Qwen2.5翻倍,融合网络内容、PDF文档和合成代码片段

Qwen3的发布标志着中国开源大模型进入新阶段,在性能与部署效率方面实现了双重突破。有兴趣的开发者可通过官方技术博客(https://qwenlm.github.io/blog/qwen3/)了解更多技术细节。

  • 相关推荐
  • 联发科:天玑9400已率先完成阿里Qwen3端侧部署

    阿里巴巴通义千问团队开源发布新一代Qwen3系列混合推理模型,包含2个MoE模型和6个dense模型,参数规模从0.6B到235B。该系列采用前沿的混合专家架构,预训练数据量达36T tokens,在推理、指令遵循、多语言能力等方面显著提升。联发科宣布天玑9400芯片率先完成Qwen3端侧部署,其搭载的第八代AI处理器NPU+890在ETHZ AI Benchmark测试中表现优异。天玑9400凭借强大AI算力,可让用户在手机等终端设备上高效使用Qwen3模型。旗舰模型Qwen3-235B-A22B在编码、数学等基准测试中展现出与DeepSeek、Grok-3等模型的竞争优势,同时部署成本大幅降低,显存占用仅为性能相近模型的三分之一。

  • Qwen3深夜正式开源,小尺寸也能大力出奇迹。

    阿里发布通义千问Qwen3大模型系列,包含8个不同规模的模型,从0.6B到235B参数全覆盖。亮点包括:1)全球顶尖模型能力;2)首个开源的混合推理模型;3)支持119种语言;4)部署成本仅为DeepSeek+R1的三分之一;5)支持MCP协议。其中235B旗舰模型性能对标顶级闭源模型,30B-MoE模型激活参数仅3B。所有模型均采用Apache2.0协议开源,支持商用。实测显示Qwen3在代码和写作方面优于DeepSeek

  • 阿里Qwen3发布后 马斯克立刻官宣:下周推出Grok 3.5

    快科技4月29日消息,马斯克刚刚在社交平台X上称,下周将向SuperGrok订阅者推出Grok 3.5,并将该条信息顶置。据马斯克称,Grok 3.5是第一个能够准确回答有关火箭发动机或电化学技术问题的人工智能。同时,Grok可以从第一原理推理并得出互联网上根本不存在的答案。Grok 3.5被马斯克旗下的xAI宣传为全球首个人工智能能从第一性原理推理,生成网络上不存在的答案”。而今年2月18日,xAI正式发布Grok 3,并在两天后把Grok 3免费向所有公众开放,超越ChatGPT,登顶苹果应用商店免费应用下载排行榜第一名。马斯克曾称Grok 3为地球上最聪明的人工智

  • AI日报:通义千问Qwen3重磅发布;抖音AI搜索能力开放;ChatGPT 搜索新增网购功能;Suno V4.5版本将发布

    本期AI日报重点内容: 1. 通义千问发布Qwen3大模型,在代码、数学和通用能力方面表现突出,支持两种思考模式并开源多个模型权重 2. 抖音开放AI搜索能力接口,为第三方应用提供丰富内容资源 3. ChatGPT新增网购功能,通过对话获取个性化商品推荐 4. Suno AI即将推出V4.5版本,提升音乐生成真实度 5. Simular AI登陆macOS,打造本地化智能助手 6. 暗月之面开源Kimi-VL模型,可处理文本、图像和视频 7. UCLA与Meta推出d1框架,提升大语言模型推理速度 8. 通义灵码上线Qwen3编程智能体 9. Gen-4References图像生成技术惊艳亮相 10. Hugging Face推出可编程机械臂SO-101 11. Windsurf推出全新品牌标志 12. Ollama全面支持Qwen3模型本地部署

  • 魅族Flyme AIOS 2宣布接入阿里云端到端大模型Qwen Omni

    Flyme AIOS2系统引入全新设计的智能助手Aicy,其界面设计更具呼吸感与动态效果,同时搭载升级后的思考引擎,可实现更精准的语义理解和场景响应。值得关注的是,该系统成为业内首家接入阿里云自主研发的Qwen Omni云端到端大模型的操作系统,支持超低延迟的自然语音交互,并覆盖多地

  • AI日报:阿里通义千问Qwen3问鼎全球开源模型;Kimi长思考模型API发布;OpenAI发布新一代GPT-4.1模型

    【AI日报】汇总了近期AI领域重要动态:1)阿里通义千问3开源模型上线7天即登顶全球开源模型榜首,在指令遵循和推理能力上超越闭源模型;2)月之暗面推出Kimi长思考模型API,可解决复杂代码和数学问题;3)OpenAI发布GPT-4.1模型,性能提升显著;4)Google推出Gemini2.5Pro模型,提升开发者编码能力;5)联想发布"天禧超级智能体",具备多模态感知能力;6)腾讯元宝上线"对话分

  • 微美全息(WIMI.US)开发混合并行架构量子计算仿真框架,提升量子计算模拟效率

    量子计算作为前沿技术备受关注,有望解决传统计算难以企及的复杂问题。其独特计算能力引发全球广泛研究,已从理论层面发展为现实需求。虽然量子计算机仍处发展早期,需要昂贵基础设施,但通过经典计算机模拟量子计算来开发测试算法成为重要途径。微美全息(WIMI.US)致力于突破传统模拟方法的瓶颈,其研发的混合并行架构量子计算仿真模型,通过整合CPU和GPU资源,运用投影技术减少计算量,优化分布式计算分配,显著提升模拟效率和性能。该技术为量子算法开发提供强大工具,将加速量子计算技术突破,推动其在各领域的实际应用。

  • 易能时代98%+转换效率:技术突围下的效率革命

    2025年新能源充电市场竞争激烈,各品牌在功率、桩数、价格等方面展开激烈比拼。易能时代独辟蹊径,专注提升充电效率至98%+,为桩企创造实际运营价值。相比传统95%效率的充电桩,98%+模块每天可减少600度电损,按0.6元电价计算,单站年省13万元。该技术通过一级拓朴架构、高频开关器件优化、轻载自动调度等创新,实现系统级效率提升。在行业普遍追求大功率快充时,易能时代强调"效率为先"的实用主义,为运营商提供可持续的盈利方案,推动行业回归商业本质。

  • 快手电商2025商家大会:抓住全域经营新商机 利用AI能力降低商家经营成本

    5月8日,快手电商在杭州召开"破壁2025"商家大会,宣布618购物节招商启动。会上,快手电商提出全域经营年度战略,强调信任社区生态是发展基石,计划到2025年实现跨场域满足用户多元化消费需求。平台将利用AI技术赋能商家全链路经营,重点在AIGC内容生产、精准投放、智能客服等场景降低经营成本。数据显示,2024年快手电商多领域买家数同比增长近20%,短视频GMV增长超50%。针对618大促,平台将投入千亿流量和20亿补贴,推出新锐商家扶持计划,分阶段助力商家成长。货架场域表现亮眼,Q4商品卡交易额同比增长超68%。快手电商还宣布投入10亿预算扶持达人分销业务,推动"外贸优品"向"国货爆品"升级转型。

  • 酒店机器人3年亏了8个亿:机器人实际配送效率低下

    酒店机器人近年成为行业标配产品,但市场表现不尽如人意。某酒店管理人员坦言,实际运营中发现机器人配送效率低下,无法真正节约人工成本,最终选择弃用。与此同时,市场竞争格局正发生变化,九号机器人、擎朗智能等新兴企业通过多场景适配和人机协同等差异化策略,逐步蚕食市场份额。数据显示,2023年全球市场前五名企业份额差距已不足8个百分点。

今日大家都在搜的词: