首页 > AI头条  > 正文

性能与效率的双赢:Qwen3横空出世,MoE架构大幅降低部署成本

2025-04-29 15:09 · 来源: AIbase基地

阿里云旗下通义千问(Qwen)团队正式发布Qwen3系列模型,共推出8款不同规格的模型,覆盖从移动设备到大型服务器的全部应用场景。这是国内首个全面超越DeepSeek R1的开源模型,也是首个配备混合思维模式的国产模型。

模型阵容丰富,满足各类部署需求

Qwen3系列包含6款Dense模型和2款MoE模型:

  • Dense模型:0.6B、1.7B、4B、8B、14B、32B
  • MoE模型:
    • Qwen3-235B-A22B (总参数235B,激活参数22B)
    • Qwen3-30B-A3B (总参数30B,激活参数3B)

所有模型均支持128K上下文窗口,并配备了可手动控制的"thinking"开关,实现混合思维模式。

QQ20250429-150719.png

性能与效率的突破

Qwen3系列在同尺寸开源模型中性能领先,尤其是旗舰模型Qwen3-235B-A22B:

  • 在代码、数学、通用能力等基准测试中与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro相比表现极具竞争力
  • 部署成本仅为DeepSeek R1的35%

小型MoE模型Qwen3-30B-A3B同样令人惊艳:

  • 激活参数仅为QwQ-32B的10%,性能反而更优
  • 可在消费级显卡上部署运行

最小的0.6B模型专为移动设备优化,进一步扩展了Qwen3的应用范围。

QQ20250429-150730.png

多平台部署支持

Qwen3发布后立即获得了众多平台的"0day级支持":

在线体验:

  • 通过官网直接对话:https://chat.qwen.ai/

本地部署:

  • Ollama:ollama run qwen3(后接参数可选择不同尺寸)
  • LM Studio:https://lmstudio.ai/
  • vLLM:支持v0.8.4以上版本
  • SGLang:需升级至0.4.6.post1
  • llama.cpp:支持量化版和动态量化版

API接入:

  • OpenRouterAI:提供免费API

特殊部署:

  • CPU部署:KTransformer支持混合CPU+GPU部署
  • Mac设备:支持mlx-lm,覆盖从iPhone到M3Ultra的全线产品

技术亮点

Qwen3的核心优势包括:

  • 首个全面超越DeepSeek R1的国产开源模型
  • 国内首个混合推理模型,复杂问题深度思考,简单问题快速响应
  • 大幅降低部署要求,旗舰模型仅需4张H20卡
  • 原生支持MCP协议,代码能力显著提升
  • 支持119种语言和方言,包含多种地方性语言
  • 训练数据达36万亿token,较Qwen2.5翻倍,融合网络内容、PDF文档和合成代码片段

Qwen3的发布标志着中国开源大模型进入新阶段,在性能与部署效率方面实现了双重突破。有兴趣的开发者可通过官方技术博客(https://qwenlm.github.io/blog/qwen3/)了解更多技术细节。

  • 相关推荐
  • A日报:月之暗面开源大模型Kimi K2;智源全面开源RoboBrain2.0;通义千问发布Qwen Chat桌面客户端

    本期AI日报重点报道了多项AI领域突破性进展:1.月之暗面推出万亿参数开源大模型Kimi K2,展现强大智能能力;2.智源研究院开源RoboBrain2.0和RoboOS2.0机器人系统;3.通义千问发布桌面客户端Qwen Chat;4.IndexTTS2实现影视级语音合成;5.HuggingFace开源机器人Reachy Mini热销;6.Meta推出实时视频生成模型StreamDiT;7.PixVerse新增多关键帧视频生成功能;8.特斯拉推出仅支持AMD处理器的Grok AI助手;9.OpenAI推迟开源大模型发布以加强安全测试;10.Liquid AI开源边缘AI模型LFM2;11.AI"时间穿越"特效在社交媒体走红。

  • YY 直播首部 AIGC 真人短剧上线!实现了制作效率与成本控制的双重突破

    YY直播旗下短剧厂牌麦芬推出首部AIGC真人短剧《权谋之帝王心术》,取材于平台主播真实故事,联合百度AIGC技术实现剧本创作与视觉制作的智能化。该剧制作成本较传统模式降低58%,周期缩短53%,通过多平台分发扩大传播范围。作为"生态短剧"创新尝试,既展现YY在内容领域的深耕,也验证了AIGC技术在影视制作中的降本增效能力,为行业探索"真实生态+智能技术"的内容生产新模式提供了实践样本。

  • 增量计算掀架构革命:云器定义新标准,Flink高成本遇挑战

    云器科技提出"通用增量计算"技术,解决大数据处理痛点。相比传统流计算框架Flink,该技术采用"按需增量"模式,仅计算数据变化部分,在保证分钟级时效的同时大幅降低资源消耗。云器还制定了行业首个增量计算标准SPOT,推动技术生态发展。该技术已在小红书等企业应用,实现流批一体化开发,支持标准SQL语法,开发效率提升显著。增量计算代表数据处理第四范式革命,为中小企业数字化转型提供新可能。

  • 快递面单打印新时代:汉印如何撑起“千亿件”物流效率?

    2025年我国快递业务量突破1000亿件,提前35天达成目标,连续5年突破千亿大关。这既展现出内需潜力与电商渗透率的提升,也体现了中国数字物流体系的高效运转。快递面单作为物流系统的关键接口,汉印品牌凭借技术实力突破外资垄断,占据30%市场份额。2024年汉印获得"快递面单打印机全国销量第一"认证,并构建了覆盖全产业链的产品矩阵。其自主研发的热敏打印芯片全球市占率领先,10万平米智能制造基地确保产能稳定。汉印还参与制定国内首个电子面单打印机行业标准,推动物流数字化生态协同发展,助力中国快递产业高效、安全、智能化发展。

  • 京东取消外卖超时20分钟免单服务 官方回应:准时率已大幅提升

    近日,社交平台上多位网友发帖称,京东外卖对原有的“超时20分钟免单”服务进行了调整,改为“超时20分钟赔付4元优惠券”。这一变动引发了消费者的广泛关注和讨论。 针对这一疑问,京东方面迅速作出回应。京东表示,自推出超时保障服务以来,平台一直致力于优化配送体验,目前京东外卖订单的准时率已得到显著提升。为了进一步提供更全面的保障,覆盖更多常见场�

  • 微星PAG 系列电源上市!ATX 3.1 金牌全模组 助力暑假高性能装机

    微星科技推出全新PAG G850/750/650LS PCIE5系列电源,专为高性能平台打造,符合ATX3.1规范,支持PCIe5.1原生接口,售价349元起。关键亮点:1)采用ATX3.1标准设计,可承受2倍整机功耗和3倍显卡功耗的瞬时峰值;2)配备16-Pin PCIe5.1接口,最高单接口输出600W;3)创新异色设计接口,便于判断插头是否插牢;4)通过80PLUS金牌认证,转换效率达90%;5)提供六重保护机制,确保安全稳定。该系列电源为新一代CPU和显卡提供强劲动力支持,是暑期装机的高性价比之选。

  • AI日报:阿里通义推Qwen-TTS模型;Cursor已支持网页和手机端;字节发布图像合成技术XVerse

    【AI日报】今日AI领域7大突破:1)阿里通义Qwen-TTS实现方言语音合成重大突破;2)Cursor发布Web版AI编程工具;3)字节XVerse技术实现多对象精准图像生成;4)NoteGen跨平台AI笔记工具革新知识管理;5)ManimML动画库可视化Transformer架构;6)TEN+Agent开源语音交互技术降低延迟;7)Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

  • 麒麟软件破解CVE修复困局:智能补丁管理实现十倍效率跃升

    文章介绍了银河麒麟迁移运维平台提供的一站式CVE漏洞修复解决方案。该平台基于"预防-检测-响应-优化"闭环模型,覆盖漏洞全生命周期管理,具有补丁生命周期管理、智能漏洞分析、官方补丁高效分发等核心优势。平台支持热补丁技术实现内核漏洞"秒修",保障业务连续性达99.99%,并适配混合云环境。某大型银行案例显示,该方案将高危漏洞修复时效从72小时缩短至4小时。平台基于国产银河麒麟操作系统开发,提供可视化运维界面,支持配置管理、漏洞修复、监控告警等核心运维场景,已广泛应用于金融、电信、政府等行业,助力企业提升安全防护能力。

  • 还在为文献和写作头秃?这款“科研搭子”让你效率飙升!

    OpenPaper是一款AI科研助手,旨在重塑从文献阅读到代码复现的全流程科研体验。它能快速提炼论文核心内容,通过思维导图呈现研究背景、方法、结论等关键信息;支持多篇文献横向对比,自动识别研究缺口;提供创新实验室功能,帮助生成研究假设和实验方案;还能辅助论文写作,从大纲构建到初稿润色。其代码实验室可解析复杂代码逻辑,指导环境配置和调试。OpenPaper坚持

  • 谭章熹博士出席 RISC-V 中国峰会 详解开源架构全球征程与中国机遇

    2025年7月16日,第五届RISC-V中国峰会在上海张江科学会堂举行。作为中国大陆规格最高、规模最大的RISC-V专业会展,峰会吸引了全球专家与产业领袖参与。RISC-V国际基金会董事谭章熹博士发表主题演讲,回顾了RISC-V从伯克利起步到全球发展的历程,强调其开源、免费、无专利限制的特性推动了技术创新和生态繁荣。他指出,RISC-V基础指令集仅40余条,结构简洁但高度模块化,适用于从嵌入式设备到高性能计算领域。中国正积极建设RISC-V生态,预计2030年中国高性能RISC-V芯片市场规模将达2000-3000亿元,占全球20%-30%。谭博士表示,RISC-V发展重心正向AI加速、数据中心等高性能场景迈进,将与x86、ARM展开竞争,成为数字时代承载国家技术主权与产业升级的重要基础。

今日大家都在搜的词: