阿里Qwen3-Max-Thinking在全球数学竞赛中拔得头筹，挑战 OpenAI 的领先地位

2025-11-10 09:30 · 来源： AIbase基地

近日，中国科技巨头阿里巴巴集团发布了升级版的人工智能推理模型 ——Qwen3-Max-Thinking。该模型在两项全球顶级数学竞赛中取得了满分，展示了其在推理和问题解决方面的强大能力。这使得 Qwen3-Max-Thinking 成为首个在美国邀请数学考试（AIME）和哈佛 - 麻省理工数学锦标赛(HMMT)中取得100% 准确率的中国 AI 推理模型。

通义 Qwen (1)

图源备注：图片由AI生成

AIME 和 HMMT 是全球最具挑战性的数学竞赛之一，考察选手在算术、代数、数论和概率等领域的解题能力。根据位于圣荷西的 AI 软件公司 Intuition Labs 的说法，高分的数学推理测试对于评估 AI 模型的推理和问题解决技能至关重要。这些竞赛代表了 AI 进步的一个重要前沿，显示了开发更强推理模型的竞争。

Qwen3-Max-Thinking 模型是阿里巴巴 AI 与云计算部门推出的 Qwen3-Max 系列中的最新版本，具备超过1万亿个参数。Qwen3-Max 于9月底发布，而原始的 Qwen3则在4月推出。阿里云在发布会上表示，Qwen3-Max 在国内外的竞争对手中表现突出，包括 Anthropic 的 Claude Opus4、DeepSeek 的 V3.1、xAI 的 Grok4以及 OpenAI 的 GPT-5Pro。

值得一提的是，Qwen3-Max 还在一项涉及真实市场的实验中表现出色，与五个美国和中国的领先 AI 系统在加密货币交易中对决。在两周的时间内，Qwen3-Max 实现了22.3% 的投资回报，而其他模型的表现则不尽人意，OpenAI 的 GPT-5更是遭遇了62.7% 的损失。

目前，Qwen3-Max-Thinking 已通过 Qwen 聊天机器人的网页版本和阿里云的 API 平台向个人用户开放。Qwen 团队的研究员林俊扬在社交媒体上透露，他们仍在继续改进这一新推理模型，表示工作尚未完成。

划重点:
- 📊 阿里巴巴的 Qwen3-Max-Thinking 在国际数学竞赛中获得满分，挑战 OpenAI。
- 🏆 该模型具备超过1万亿个参数，是首个在 AIME 和 HMMT 中取得100% 准确率的中国 AI。
- 📈 Qwen3-Max 在真实市场的加密货币交易中表现优异，获得22.3% 的投资回报。

相关推荐

荐AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发布；中文图像编辑新王UniWorld-V2发布

今日AI领域动态：上海首例AI提示词著作权案宣判，法院认定提示词不具独创性；月之暗面发布Kimi K2思考模型，实现自主多轮工具调用；UniWorld-V2图像编辑模型支持中文框选即改，性能超越GPT-Image；谷歌推出AI文件检测工具Magika 1.0，支持超200种格式；Sora安卓版首日下载量达47万次；我国发布全球首个AI海洋大模型“瞰海”，可精准预测10天内海洋变化；宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控；谷歌Gemini API推出文件搜索工具，简化私有RAG系统集成。

AI 著作权提示词
荐AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功能；百度“文心”5.0重磅回归

本期AI日报聚焦多领域技术突破：美团发布全模态交互模型LongCat-Flash-Omni；阿里通义千问Qwen3-Max上线深度思考功能；百度文心5.0升级多模态生成能力；谷歌确认Gemini3年内发布并整合至苹果Siri；OpenAI向多国开放Sora2视频工具；云存储与AI开发工具持续优化，展现行业加速迭代态势。

AI 多模态实时交互
AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

本文汇总AI领域最新动态：OpenAI推出集成ChatGPT的Atlas浏览器，实现多任务自主处理；阿里通义千问新增2B/32B视觉语言模型，手机可流畅运行；谷歌AI Studio升级Vibe Coding功能，简化应用开发流程；百川发布医疗大模型M2Plus，通过循证推理降低误诊率；奇瑞墨甲机器人实现L3级技术突破，计划多行业应用；YouTube推出AI肖像识别工具，打击虚假内容；三星宣布2026年推出AI眼镜，融合AR与语音助手；Claude客户端更新，支持截图分析和语音交互功能。

AI OpenAI ChatGPT
微星银色战斧降临！X870E TOMAHAWK MAX WIFI PZ背插主板上线

微星于11月7日推出MAG X870E TOMAHAWK MAX WIFI PZ战斧导弹主板，首发价3299元。该主板专为AMD AM5平台设计，支持Ryzen 9000系列处理器，采用纯银白色外观与背插式设计，将所有接口移至背面，实现正面简洁视觉效果。配备14+2+1相供电、4个M.2插槽（含2个PCIe 5.0）、双USB4接口及Wi-Fi 7，结合EZ快拆与Debug侦错灯等便捷功能，兼顾高性能与装机便利性，精准切入白色主题细分市场。

微星主板 AM5平台背插式设计
OpenAI和微软的关系没那么糟，跟英伟达也没那么好

OpenAI的动作比所有人想象的都要快。上周二，OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议，结束了Azure长达六年的云服务独占模式。此前，OpenAI所有模型的训练、推理与部署都必须优先选择Azure，微软还享有优先购买权。宣布与Azure“分手”后不到一周，OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议，OpenAI将全面接入

OpenAI 云计算战略合作
荐Qwen登顶AI赚钱大赛只是开始？“弃GPT投Qwen”已在硅谷蔓延开来

近期AI炒币大赛Alpha Arena引发关注，六款主流大模型用1万美元本金在币圈实战。戏剧性的是，被寄予厚望的GPT-5和Gemini因高杠杆操作亏损惨重，而中国开源模型表现亮眼——通义千问Qwen以53%回报率逆袭登顶，DeepSeek紧随其后。硅谷巨头Airbnb CEO公开表态依赖Qwen，投资人Chamath也承认将业务转向中国模型。市场用真金白银投票：预测平台押注Qwen胜率高达36%，远超OpenAI的3%。这场竞赛�

AI炒币大赛 Alpha Arena
没有Pro Max！一加Ace 6T命名敲定：首发骁龙8 Gen5

此前有网友在机场拍到一加Ace 6 Pro Max包装盒，不少网友认为这就是一加即将推出的骁龙8 Gen5新机。博主数码闲聊站表示，一加骁龙8 Gen5新机不叫Ace 6 Pro Max，而是命名为Ace 6T，这里的T不是Turbo，是一加纯正的性能基因，一加的Turbo系列也已在路上了。对比一加Ace 6，一加Ace 6T处理器由骁龙8 Elite换成了骁龙8 Gen5，电池容量突破8000mAh，还将带来炫酷的联名。该博主还爆料，高通

一加Ace 6T 骁龙8
中免健康：全球供应链+跨界联动，让“轻滋养”走进全民生活

在12部门联合印发《促进健康消费专项行动方案》指引下，中免集团加速从旅游零售向健康生活服务商转型，打造自有健康品牌“中免健康”。通过“产品+场景+传播”三位一体布局，精准对接银发族、年轻群体等多元需求，推出覆盖燕窝、参类等全场景健康产品矩阵，以普惠价格打破消费门槛。跨界携手张伟丽等健康榜样开展营销活动，通过沉浸式体验传递“轻滋养，乐生活”理念，深化“免税+健康”战略，为旅游零售行业注入新动能，推动健康消费从“选择性”向“刚需”转变。

健康消费中免健康旅游零售
从全球充电技术领先者到苏超赞助商：酷态科的跨界“赋能”之路

2025年10月31日，南京举办体育产业高质量发展大会，主题为“青奥赋能，文旅融合”。大会聚焦释放高质量户外运动潜力，推动“苏超”联赛带来的文体商旅融合发展。本土科技企业酷态科技作为苏超赞助商亮相，其凭借创新产品实现爆发式增长，在国内外市场表现亮眼。此次合作是科技与体育的跨界融合，共同服务人民美好生活需求，助力南京建设世界体育名城和全国足球重点城市，展现本土企业支持家乡体育事业的担当。

青奥赋能文旅融合体育产业
荐OpenAI也来了，巨头为何决战AI浏览器？

AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas，这是OpenAI推出的首款人工智能驱动的网页浏览器。这也被外界认为OpenAI要向谷歌宣战，挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天，谷歌母公司Alphabet股价应声下挫，盘中最大跌幅接近5%，足见市场对这一新品的敏感度。近一年来，AI浏览器的战略价值成为行业共识，从业者更是将其与智能代理（Agent）、搜索引�

AI浏览器 ChatGPT Atlas

今日大家都在搜的词：

热文

3 天
7天

阿里Qwen3-Max-Thinking在全球数学竞赛中拔得头筹，挑战 OpenAI 的领先地位

荐AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发布；中文图像编辑新王UniWorld-V2发布

荐AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功能；百度“文心”5.0重磅回归

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

微星银色战斧降临！X870E TOMAHAWK MAX WIFI PZ背插主板上线

OpenAI和微软的关系没那么糟，跟英伟达也没那么好

荐Qwen登顶AI赚钱大赛只是开始？“弃GPT投Qwen”已在硅谷蔓延开来

没有Pro Max！一加Ace 6T命名敲定：首发骁龙8 Gen5

中免健康：全球供应链+跨界联动，让“轻滋养”走进全民生活

从全球充电技术领先者到苏超赞助商：酷态科的跨界“赋能”之路

荐OpenAI也来了，巨头为何决战AI浏览器？

今日大家都在搜的词：

热文

焕新享界S9开卖72小时预订突破8000台

OPPO Reno15系列定档11月17日发布

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

华为Mate 70 Air维修备件价格公布：换主板2499元

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

小米手表S4 eSIM/Sport宣布支持开通中国移动一号双终端

真我GT8 Pro阿斯顿马丁F1限量版正式开售售价5499元

鸿蒙智行：智界R7累计交付量破10万台

特斯拉Model Y L上线外放电功能最高可输出2200瓦功率

华为Mate 70 Air今日开售：处理器双版本可选售价4199元起

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

华为Mate70 Air官宣今日开启预售

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

华为路由X3 Pro今日开启预售：售价1299元起

何小鹏回应机器人IRON里是真人质疑：感谢认可

iPhone Air 2或新增1颗镜头：继续沿用6.5英寸高刷中屏

俞敏洪发文确认孙东旭离职：保持着良好的沟通

站长商机

​阿里Qwen3-Max-Thinking在全球数学竞赛中拔得头筹，挑战 OpenAI 的领先地位

今日大家都在搜的词：

热文

站长商机

阿里Qwen3-Max-Thinking在全球数学竞赛中拔得头筹，挑战 OpenAI 的领先地位