阿里云栖大会发布新一代人工智能模型 技术指标全球领先
9月24日 杭州电
在今日开幕的2025云栖大会上,阿里巴巴集团正式发布了其最新研发的Qwen3-Max人工智能模型。根据官方公布的数据显示,该模型在多项国际权威测试中表现优异,技术指标已进入全球领先行列。
据了解,Qwen3-Max分为指令优化和推理增强两个版本。目前其预览版本已在国际知名的人工智能基准测试平台Chatbot Arena中排名第三,正式版本有望实现进一步突破。
作为通义千问系列的最新旗舰产品,Qwen3-Max采用了36万亿token的超大规模预训练数据,模型参数量突破万亿级别。特别值得注意的是,该模型在编程代码生成和智能工具调用方面展现出显著优势。
在SWE-Bench Verified测试中,Qwen3-Max指令版本以69.6分的成绩位居全球前列;而在Tau2-Bench工具调用能力测试中,该模型更是以74.8分的成绩超越了多个国际知名产品。
Qwen3-Max模型在多项测试中表现优异
特别值得关注的是,Qwen3-Max的推理增强版本在数学推理能力测试中取得突破性进展。在AIME 25和HMMT两项专业数学测试中均获得满分,这在国内人工智能领域尚属首次。
技术专家介绍,该模型之所以能在数学推理方面取得优异成绩,主要得益于其创新的工具调用机制和并行计算技术。模型能够通过编写代码来求解数学问题,同时优化的计算资源分配也显著提升了整体表现。
Qwen3-Max在数学推理测试中获得满分
目前,通义千问系列已经形成了从基础版到高端版的完整产品矩阵,包含300余个不同规模的模型,能够满足各类应用场景的需求。
即日起,用户可以通过通义千问官方平台免费体验Qwen3-Max模型,企业用户也可以通过阿里云服务平台获取专业的API接口服务。
(举报)
- 相关推荐
-
荐AI日报:美团LongCat-Flash-Omni发布;Qwen3-Max上线深度思考功能;百度“文心”5.0重磅回归
本期AI日报聚焦多领域技术突破:美团发布全模态交互模型LongCat-Flash-Omni;阿里通义千问Qwen3-Max上线深度思考功能;百度文心5.0升级多模态生成能力;谷歌确认Gemini3年内发布并整合至苹果Siri;OpenAI向多国开放Sora2视频工具;云存储与AI开发工具持续优化,展现行业加速迭代态势。
-
国内大模型GEO优化全攻略:免费工具教你监测品牌在文心一言、通义千问等AI平台的可见度
AI搜索时代,品牌若未出现在AI回答中就等于"不存在"。GEO(生成引擎优化)成为新战场,核心是让AI在回答用户问题时优先引用企业内容。文章详解国内主流AI模型特点:文心一言整合百度生态、通义千问依托阿里电商数据、小众模型在垂直领域更易被引用。提出三大优化策略:内容结构化呈现、建立行业权威背书、布局高权重平台。推荐使用AIBase免费工具实时监测品牌在各大AI平台的曝光情况,通过数据驱动优化策略。
-
AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型
本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。
-
GEO排名查询工具怎么用?手把手教你监测品牌在通义千问、Kimi等AI平台的推荐情况
AI时代催生GEO(生成引擎优化)新范式,正逐步取代传统SEO。GEO关注品牌在AI问答中的提及率、推荐频次与排名,通过优化内容结构提升AI引擎推荐权重。AIBase平台推出专业GEO监测工具,支持五大主流AI平台实时检测,提供竞品对比与优化建议,帮助企业量化品牌在AI生态中的可见度,已成为数字资产评估新标准。
-
荐Qwen登顶AI赚钱大赛只是开始?“弃GPT投Qwen”已在硅谷蔓延开来
近期AI炒币大赛Alpha Arena引发关注,六款主流大模型用1万美元本金在币圈实战。戏剧性的是,被寄予厚望的GPT-5和Gemini因高杠杆操作亏损惨重,而中国开源模型表现亮眼——通义千问Qwen以53%回报率逆袭登顶,DeepSeek紧随其后。硅谷巨头Airbnb CEO公开表态依赖Qwen,投资人Chamath也承认将业务转向中国模型。市场用真金白银投票:预测平台押注Qwen胜率高达36%,远超OpenAI的3%。这场竞赛�
-
荐AI日报:昆仑万维SkyReels V3模型上线;月之暗面推Kimi Linear模型;MiniMax Music 2.0 发布
本期AI日报聚焦多领域创新:昆仑万维推出SkyReels V3模型,整合顶尖视频生成能力;月之暗面Kimi Linear模型处理长文本速度提升2.9倍;MiniMax Music 2.0实现专业级音乐创作;字节跳动启动豆包股权激励计划吸引AI人才;苹果iOS 27将迎AI重大升级,Siri更个性化;Dia浏览器融合Arc设计理念与AI技术;文心魔法漫画工具实现一键生成连载作品;谷歌Gemini Canvas新增PPT自动生成功能,由Gemini 2.5 Pro驱动,提升职场效率。
-
最强Mate旗舰!华为Mate 80本月下旬亮相
华为Mate 80系列会在11月25日前后发布,这将是史上最强Mate旗舰。 据悉,本次发布会将会推出Mate 80、Mate 80 Pro、Mate 80 Pro 和Mate 80 RS四款旗舰,其中标准版代号Voyager,支持66W有线快充;Pro、Pro 及RS版统一采用Sagittarius代号,支持100W有线充电。
-
荐AI日报:谷歌发布Veo 3.1;通义千问推Qwen Chat Memory功能;Sora2免费用户可生成15秒视频
本期AI日报聚焦多项技术更新:谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能;通义千问推出记忆功能提升对话连贯性;Sora2免费用户可生成15秒视频,Pro版支持25秒;百度文心助手升级8种创作模式;谷歌Flow工具增强视频光影编辑与音频合成能力;Anthropic发布高性价比Claude Haiku 4.5;北京查处首例AI虚假广告案,涉伪造主持人带货;阿里推出响应仅200毫秒的编程工具Qoder CLI。
-
登榜LMArena!文心大模型5.0-Preview文本能力国内第一
11月8日,文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出,超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容;复杂长问题理解适用于学术问答、报告分析等任务;指令遵循能力支持智能助理、代码生成等场景,为多领域内容生产提供高效支撑。
-
双十一钜惠来袭,让AOC小Q MAX阅读器8R1成为最温暖的冬日礼物!
AOC小Q+MAX阅读器8R1双十一钜惠来袭!8.2英寸E-ink墨水瓶如纸质书般舒适,292PPI高清显示搭配冷暖双光调节,四核处理器保障流畅运行。限时享国家补贴15%,到手价低至1529元,PLUS会员可叠加优惠券,前100名晒单再得50元E卡。这款阅读器以纤薄机身、长效续航和AI朗读功能,成为秋冬阅读的理想伴侣,助你开启深度阅读新篇章。
