7月23日的清晨,阿里巴巴正式推出了其全新的开源 AI 编程模型 ——Qwen3-Coder。这款模型标志着千问系列中的一次重大突破,采用了混合专家(MoE)架构,拥有高达480亿的参数量,其中可激活的参数达到35亿。Qwen3-Coder 不仅在开源编程模型中脱颖而出,其性能也与全球顶尖的 Claude4相媲美。
Qwen3-Coder 在一个包含7.5TB 数据、代码占比达到70% 的数据集上进行了预训练。它的设计支持256K token 的上下文,甚至可扩展到1M token,为开发者提供更广泛的编程场景适应能力。在后期的强化学习阶段,该模型针对编程任务及智能体任务进行了深度优化,显著提升了通用能力、代码能力以及 Agent 能力。
在多项评测中,Qwen3-Coder 表现优异。在 WebArena 等平台的 Agent 能力评测中,它超越了 GPT4.1,而在考察自主规划解决编程任务的 SWE-Bench 评测中,Qwen3-Coder 更是取得了开源模型的最佳成绩。它的出色 Agent 能力使其特别擅长处理复杂的多步骤任务,能够自主安排工作内容,灵活调用各种工具,从而高效解决复杂编程任务。
此外,Qwen3-Coder 还极大地降低了编程的入门门槛,普通人也能轻松实现编程愿望。开发者们只需一句简单的指令,就能生成复杂的3D 物理模拟过程。这不仅提高了编程工作的效率,将原本需要数小时的任务缩短到几分钟,还助力网页开发、AI 搜索等多个智能应用领域的提升。
Qwen3-Coder 已在魔搭社区、HuggingFace 等平台开源,全球开发者可以免费下载使用。此外,它还将接入阿里的 AI 编程产品通义灵码,并上线阿里云百炼 API,便于开发者使用。为了提升用户体验,通义团队还推出了一款命令行工具 Qwen Code,助力开发者更好地利用这一强大工具。