首页 > 业界 > 关键词  > 云栖大会最新资讯  > 正文

Qwen3-Max成阿里通义“地表”:性能超GPT5 数学推理直接满分

2025-09-24 13:45 · 稿源: 快科技

阿里云栖大会发布新一代人工智能模型 技术指标全球领先

9月24日 杭州电

在今日开幕的2025云栖大会上,阿里巴巴集团正式发布了其最新研发的Qwen3-Max人工智能模型。根据官方公布的数据显示,该模型在多项国际权威测试中表现优异,技术指标已进入全球领先行列。

据了解,Qwen3-Max分为指令优化和推理增强两个版本。目前其预览版本已在国际知名的人工智能基准测试平台Chatbot Arena中排名第三,正式版本有望实现进一步突破。

作为通义千问系列的最新旗舰产品,Qwen3-Max采用了36万亿token的超大规模预训练数据,模型参数量突破万亿级别。特别值得注意的是,该模型在编程代码生成和智能工具调用方面展现出显著优势。

在SWE-Bench Verified测试中,Qwen3-Max指令版本以69.6分的成绩位居全球前列;而在Tau2-Bench工具调用能力测试中,该模型更是以74.8分的成绩超越了多个国际知名产品。

Qwen3-Max模型性能展示

Qwen3-Max模型在多项测试中表现优异

特别值得关注的是,Qwen3-Max的推理增强版本在数学推理能力测试中取得突破性进展。在AIME 25和HMMT两项专业数学测试中均获得满分,这在国内人工智能领域尚属首次。

技术专家介绍,该模型之所以能在数学推理方面取得优异成绩,主要得益于其创新的工具调用机制和并行计算技术。模型能够通过编写代码来求解数学问题,同时优化的计算资源分配也显著提升了整体表现。

Qwen3-Max数学推理能力展示

Qwen3-Max在数学推理测试中获得满分

目前,通义千问系列已经形成了从基础版到高端版的完整产品矩阵,包含300余个不同规模的模型,能够满足各类应用场景的需求。

即日起,用户可以通过通义千问官方平台免费体验Qwen3-Max模型,企业用户也可以通过阿里云服务平台获取专业的API接口服务。

举报

  • 相关推荐

今日大家都在搜的词: