阿里云栖大会发布新一代人工智能模型技术指标全球领先

9月24日杭州电

在今日开幕的2025云栖大会上，阿里巴巴集团正式发布了其最新研发的Qwen3-Max人工智能模型。根据官方公布的数据显示，该模型在多项国际权威测试中表现优异，技术指标已进入全球领先行列。

据了解，Qwen3-Max分为指令优化和推理增强两个版本。目前其预览版本已在国际知名的人工智能基准测试平台Chatbot Arena中排名第三，正式版本有望实现进一步突破。

作为通义千问系列的最新旗舰产品，Qwen3-Max采用了36万亿token的超大规模预训练数据，模型参数量突破万亿级别。特别值得注意的是，该模型在编程代码生成和智能工具调用方面展现出显著优势。

在SWE-Bench Verified测试中，Qwen3-Max指令版本以69.6分的成绩位居全球前列；而在Tau2-Bench工具调用能力测试中，该模型更是以74.8分的成绩超越了多个国际知名产品。

Qwen3-Max模型在多项测试中表现优异

特别值得关注的是，Qwen3-Max的推理增强版本在数学推理能力测试中取得突破性进展。在AIME 25和HMMT两项专业数学测试中均获得满分，这在国内人工智能领域尚属首次。

技术专家介绍，该模型之所以能在数学推理方面取得优异成绩，主要得益于其创新的工具调用机制和并行计算技术。模型能够通过编写代码来求解数学问题，同时优化的计算资源分配也显著提升了整体表现。

Qwen3-Max在数学推理测试中获得满分

目前，通义千问系列已经形成了从基础版到高端版的完整产品矩阵，包含300余个不同规模的模型，能够满足各类应用场景的需求。

即日起，用户可以通过通义千问官方平台免费体验Qwen3-Max模型，企业用户也可以通过阿里云服务平台获取专业的API接口服务。

（举报）

相关推荐

关键词：

荐AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功能；百度“文心”5.0重磅回归

本期AI日报聚焦多领域技术突破：美团发布全模态交互模型LongCat-Flash-Omni；阿里通义千问Qwen3-Max上线深度思考功能；百度文心5.0升级多模态生成能力；谷歌确认Gemini3年内发布并整合至苹果Siri；OpenAI向多国开放Sora2视频工具；云存储与AI开发工具持续优化，展现行业加速迭代态势。

AI 多模态实时交互
国内大模型GEO优化全攻略:免费工具教你监测品牌在文心一言、通义千问等AI平台的可见度

AI搜索时代，品牌若未出现在AI回答中就等于"不存在"。GEO（生成引擎优化）成为新战场，核心是让AI在回答用户问题时优先引用企业内容。文章详解国内主流AI模型特点：文心一言整合百度生态、通义千问依托阿里电商数据、小众模型在垂直领域更易被引用。提出三大优化策略：内容结构化呈现、建立行业权威背书、布局高权重平台。推荐使用AIBase免费工具实时监测品牌在各大AI平台的曝光情况，通过数据驱动优化策略。
AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

本文汇总AI领域最新动态：OpenAI推出集成ChatGPT的Atlas浏览器，实现多任务自主处理；阿里通义千问新增2B/32B视觉语言模型，手机可流畅运行；谷歌AI Studio升级Vibe Coding功能，简化应用开发流程；百川发布医疗大模型M2Plus，通过循证推理降低误诊率；奇瑞墨甲机器人实现L3级技术突破，计划多行业应用；YouTube推出AI肖像识别工具，打击虚假内容；三星宣布2026年推出AI眼镜，融合AR与语音助手；Claude客户端更新，支持截图分析和语音交互功能。

AI OpenAI ChatGPT
GEO排名查询工具怎么用？手把手教你监测品牌在通义千问、Kimi等AI平台的推荐情况

AI时代催生GEO（生成引擎优化）新范式，正逐步取代传统SEO。GEO关注品牌在AI问答中的提及率、推荐频次与排名，通过优化内容结构提升AI引擎推荐权重。AIBase平台推出专业GEO监测工具，支持五大主流AI平台实时检测，提供竞品对比与优化建议，帮助企业量化品牌在AI生态中的可见度，已成为数字资产评估新标准。

GEO 生成引擎优化 AI搜索优化
荐Qwen登顶AI赚钱大赛只是开始？“弃GPT投Qwen”已在硅谷蔓延开来

近期AI炒币大赛Alpha Arena引发关注，六款主流大模型用1万美元本金在币圈实战。戏剧性的是，被寄予厚望的GPT-5和Gemini因高杠杆操作亏损惨重，而中国开源模型表现亮眼——通义千问Qwen以53%回报率逆袭登顶，DeepSeek紧随其后。硅谷巨头Airbnb CEO公开表态依赖Qwen，投资人Chamath也承认将业务转向中国模型。市场用真金白银投票：预测平台押注Qwen胜率高达36%，远超OpenAI的3%。这场竞赛�

AI炒币大赛 Alpha Arena
荐AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear模型；MiniMax Music 2.0 发布

本期AI日报聚焦多领域创新：昆仑万维推出SkyReels V3模型，整合顶尖视频生成能力；月之暗面Kimi Linear模型处理长文本速度提升2.9倍；MiniMax Music 2.0实现专业级音乐创作；字节跳动启动豆包股权激励计划吸引AI人才；苹果iOS 27将迎AI重大升级，Siri更个性化；Dia浏览器融合Arc设计理念与AI技术；文心魔法漫画工具实现一键生成连载作品；谷歌Gemini Canvas新增PPT自动生成功能，由Gemini 2.5 Pro驱动，提升职场效率。

AI视频生成 SkyReels V3
最强Mate旗舰！华为Mate 80本月下旬亮相

华为Mate 80系列会在11月25日前后发布，这将是史上最强Mate旗舰。据悉，本次发布会将会推出Mate 80、Mate 80 Pro、Mate 80 Pro 和Mate 80 RS四款旗舰，其中标准版代号Voyager，支持66W有线快充；Pro、Pro 及RS版统一采用Sagittarius代号，支持100W有线充电。

华为Mate 80 麒麟9030芯片
荐AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；Sora2免费用户可生成15秒视频

本期AI日报聚焦多项技术更新：谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能；通义千问推出记忆功能提升对话连贯性；Sora2免费用户可生成15秒视频，Pro版支持25秒；百度文心助手升级8种创作模式；谷歌Flow工具增强视频光影编辑与音频合成能力；Anthropic发布高性价比Claude Haiku 4.5；北京查处首例AI虚假广告案，涉伪造主持人带货；阿里推出响应仅200毫秒的编程工具Qoder CLI。

AI 视频生成谷歌
登榜LMArena！文心大模型5.0-Preview文本能力国内第一

11月8日，文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出，超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容；复杂长问题理解适用于学术问答、报告分析等任务；指令遵循能力支持智能助理、代码生成等场景，为多领域内容生产提供高效支撑。

文心模型 ERNIE-5.0 创意写作
双十一钜惠来袭，让AOC小Q MAX阅读器8R1成为最温暖的冬日礼物！

AOC小Q+MAX阅读器8R1双十一钜惠来袭！8.2英寸E-ink墨水瓶如纸质书般舒适，292PPI高清显示搭配冷暖双光调节，四核处理器保障流畅运行。限时享国家补贴15%，到手价低至1529元，PLUS会员可叠加优惠券，前100名晒单再得50元E卡。这款阅读器以纤薄机身、长效续航和AI朗读功能，成为秋冬阅读的理想伴侣，助你开启深度阅读新篇章。

今日大家都在搜的词：

热文

3 天
7天

Qwen3-Max成阿里通义“地表”：性能超GPT5 数学推理直接满分

阿里云栖大会发布新一代人工智能模型技术指标全球领先

荐AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功能；百度“文心”5.0重磅回归

国内大模型GEO优化全攻略:免费工具教你监测品牌在文心一言、通义千问等AI平台的可见度

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

GEO排名查询工具怎么用？手把手教你监测品牌在通义千问、Kimi等AI平台的推荐情况

荐Qwen登顶AI赚钱大赛只是开始？“弃GPT投Qwen”已在硅谷蔓延开来

荐AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear模型；MiniMax Music 2.0 发布

最强Mate旗舰！华为Mate 80本月下旬亮相

荐AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；Sora2免费用户可生成15秒视频

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

双十一钜惠来袭，让AOC小Q MAX阅读器8R1成为最温暖的冬日礼物！

今日大家都在搜的词：

热文

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

何小鹏回应机器人IRON里是真人质疑：感谢认可

站长商机

Qwen3-Max成阿里通义“地表”：性能超GPT5 数学推理直接满分

阿里云栖大会发布新一代人工智能模型 技术指标全球领先

今日大家都在搜的词：

热文

站长商机

阿里云栖大会发布新一代人工智能模型技术指标全球领先