首页 > 热点 > 关键词  > AI大模型最新资讯  > 正文

阿里千问模型Qwen3-Max-Thinking正式发布

2026-01-27 09:17 · 稿源:站长之家

站长之家(ChinaZ.com)1月27日 消息:阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking,这一国内最强AI大模型在多项权威评测中创下全球新纪录。

Qwen3-Max-Thinking是阿里规模最大、能力最强的千问推理模型。其总参数量超万亿(1T),预训练数据量高达36T Tokens,如此庞大的规模为模型性能的飞跃奠定了坚实基础。通过总参数、强化学习、推理计算的极致规模扩展,该模型在科学知识(GPQA Diamond)、数学推理(IMO-AnswerBench)、代码编程(LiveCodeBench)等多项关键性能基准测试中刷新全球纪录,展现出强大的实力。

阿里千问最强模型重磅亮相:性能媲美GPT-5.2、Gemini 3 Pro

此前,预览版Qwen3-Max-Thinking就已在数学推理领域崭露头角,斩获AIME25和HMMT25的国内首个双满分,其推理性能令人惊艳。在此基础上,阿里通义团队对正式版进行了更大规模的强化学习后训练,进一步提升了模型的整体性能。在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19个公认的大模型基准测试中,千问旗舰推理模型刷新了数项最佳表现(SOTA)纪录,整体性能可与GPT-5.2-Thinking-xhigh、Claude Opus4.5和Gemini3Pro相媲美。

在模型推理能力提升方面,千问新模型采用了全新的测试时扩展(Test-time Scaling)机制。传统的推理时计算往往简单增加并行推理路径,重复推导已知结论,导致冗余推理、效率低下。而千问的新机制可对之前推理的结果进行“经验提取”式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算,获得更智能的推理结果。基于这一推理技术创新,千问推理性能和推理效率大幅提升。例如,在“启用工具的人类最后的测试”HLE中,千问得分58.3,大幅超过GPT-5.2-Thinking的45.5和Gemini3Pro的45.8,创下当前所有模型的最高分。

微信截图_20260127092328.png

面向即将到来的智能体Agent时代,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。通义团队在完成初步的工具使用微调后,对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练,使模型拥有更智能结合工具进行思考的能力。这种自适应的工具调用能力可在QwenChat上完整体验,模型能够自主选用搜索、个性化记忆和代码解释器等三个核心的Agent工具功能,提供专业人士水平的回答,更加贴合用户心意、智能且流畅。同时,模型幻觉也大幅降低,为解决真实复杂任务奠定了基础。

目前,开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取新模型API服务,普通用户也可通过千问PC端和网页端试用模型。据悉,千问APP也即将接入新模型,届时所有用户都可免费体验这款千问最强模型,感受其带来的智能新体验。

Qwen Chat:https://chat.qwen.ai/

百炼API:https://bailian.console.aliyun.com/cn-beijing/?tab=model#/model-market/detail/qwen3-max-2026-01-23

千问APP网页版:https://www.qianwen.com/

举报

  • 相关推荐
  • AI日报:MiniMax公布上市后首份财报;千问开源Qwen3.5小型模型系列;Claude Code官方语音模式上线

    本期AI日报涵盖多项重要动态:MiniMax发布上市后首份财报,展示其AI平台战略进展;阿里通义千问开源Qwen3.5小型模型系列,支持多模态处理,适用于边缘设备;Google NotebookLM上线信息图自定义样式功能,简化知识可视化流程;Claude Code推出语音模式,提升编程协作效率;疑似GPT-5.4细节泄露,或具备超长上下文和状态化能力;Zopia实现多智能体协作自动化视频制作;QM发布2025年AI应用榜,豆包、DeepSeek、元宝等位列前五;DeepSeek V4 Lite凭借2000亿参数展现顶尖性能,成为国产模型新标杆。整体显示AI技术正快速向多模态、轻量化、场景化方向演进。

  • 2026年GEO优化公司评测对比:基于AI大模型“认知友好度”的五维战力排位赛

    本文基于AI大模型底层逻辑,首创“AI认知友好度五维评估体系”,深入剖析了六家头部GEO服务商如何帮助企业从“被看见”跨越到“被信任”。报告指出,传统搜索引擎的“蓝色链接”霸权正在瓦解,企业竞争焦点已从“如何被百度收录”转向“如何让AI在生成答案时优先推荐我”。通过量化评估发现,数据一致性、多模态对齐和鲁棒性成为AI时代营销的三大铁律。报告为不同企业提供了选型建议,并强调GEO优化已成为品牌在AI时代保持“存在感”的战略投资。

  • 小度全产品矩阵亮相 AWE,看大模型时代如何让 AI 真正走进千家万户

    3月12日,中国家电及消费电子博览会(AWE2026)将在上海开幕。作为行业领先的AI助手硬件品牌,小度科技将首次携全系产品矩阵亮相,展示其“场景+AI+硬件”战略的落地成果。从智能音箱、智能屏到AI眼镜、智能摄像头等硬件,以及AI酒店、AI养老等行业解决方案,小度将呈现一个完整的AI生态。这一切的背后,是2025年底升级的“超能小度”——基于大模型打造的多模态AI智能助手,让小度产品真正具备了“看见”世界、“思考”需求的能力。在AWE现场,观众将有机会亲身体验多模态AI如何重塑家庭看护、随身办公、智能交互等场景。小度正以实际行动回答:大模型时代,AI应如何走进千家万户。

  • AI日报:谷歌发布Gemini3.1Pro;Claude Code远程控制功能上线;Qwen3.5开源家族新增多款模型

    本期AI日报汇总了人工智能领域的最新动态。谷歌发布Gemini 3.1 Pro,推理能力显著提升,多项基准测试超越GPT-4o。Anthropic为Claude Code推出“远程控制”功能,实现移动设备无缝管理电脑编码任务。OpenAI发布深度融合推理能力的编程模型GPT-5.3-Codex。通义千问Qwen3.5开源家族新增多款模型并上线托管服务。Meta开源GPU集群监控工具GCM,精准定位硬件故障。Anthropic发布企业级插件,将Claude深度集成至Office全家桶。谷歌AI虚拟形象支持24种语言,提升跨语言沟通效率。阿里云Coding Plan推出低价订阅服务,降低开发者使用成本。

  • MWC首秀即焦点!讯飞AI眼镜携多模态同传大模型革新智能穿戴体验

    在2026年世界移动通信大会(MWC)上,科大讯飞以“AI Connecting Ideas”为主题,首次全球亮相其AI眼镜。该产品集多模态同传翻译与极致轻量化设计于一身,凭借领先的多模态降噪、全能翻译及多模态记录功能,吸引了众多海外运营商、技术伙伴及专业媒体的关注。其创新的唇动识别多模态降噪方案,通过摄像头捕捉说话者唇部运动,融合骨传导麦克风捕捉佩戴者声音,将音视频两路信息融合处理,在多人交谈的嘈杂背景中精准锁定目标讲话人,将语音识别和翻译的准确率提升50%以上。整机重量仅40克,相比当前市面主流同类产品重量降低了约20%,是目前全球最轻的双目单色显示多模态智能眼镜。此外,讯飞AI眼镜还具备多模态记录功能,能自动智能生成图文声并茂的会议纪要,覆盖信息记录和总结的全流程,为跨国商务人群提升工作效率。讯飞AI眼镜于北京时间3月4日上午10:10在国内电商开启预约。

  • 阿里已批准林俊旸离职 将成立基础模型支持小组

    今天上午,阿里巴巴内部流传出一封CEO吴泳铭的邮件,该邮件针对林俊旸离职一事作出回应。 3月4日(周三)凌晨,阿里Qwen(千问)团队技术负责人林俊旸在社交媒体上发布状态“me stepping down.bye my beloved qwen.”(我辞职了,再见了我爱的Qwen),这一动态引发了内部关注。

  • 阿里千问上线全新一代大模型Qwen3.5-Plus

    据千问微信号消息,阿里正式发布全新一代大模型千问Qwen3.5-Plus。用户可通过千问APP及PC端切换模型进行体验。基于强大的多模态与推理能力,千问3.5还能自主操作手机与电脑,显著提升跨应用任务处理与自动化流程执行的效率。

  • 2026全球 AI 大模型 API 聚合平台服务商深度评测:企业级和开发者的首选

    本文针对2026年AI开发需求,从稳定性、价格、模型覆盖与合规性四大维度,评测了主流AI大模型API聚合平台。文章将服务商分为三类:企业级首选(如n1n.ai、Azure OpenAI)、极客尝鲜首选(如OpenRouter、SiliconFlow)以及国内镜像与中转平台。通过深度横评数据,文章指出选择时需警惕低价陷阱、模型不对版和合规发票三大问题。最终结论建议:企业/团队首选n1n.ai,因其具备企业级稳定性、1:1汇率优势及合规支持;个人极客可考虑OpenRouter;纯开源玩家则推荐SiliconFlow。

  • ​别再盲目做 AI 营销了!这款 GEO监控工具,撕开了大模型引用的“黑盒”

    本文探讨了生成式引擎优化(GEO)的重要性,并介绍了AIBase推出的GEOBase平台。文章指出,当前品牌营销的关注点已从传统SEO转向GEO,即如何让品牌在AI搜索结果中获得更高可见度。GEOBase平台通过曝光趋势、引用来源、情感得分等核心功能,帮助品牌监测在各大AI平台(如DeepSeek、豆包等)中的表现,并提供数据驱动的优化策略。文章以3C品牌为例,展示了如何利用该工具分析竞争格局、优化内容投放,从而提升品牌在AI语境下的影响力。最后,文章强调GEO是算法时代的精密计算,而GEOBase为品牌提供了关键的“体检报告”和作战地图。

  • 跳出手机!阿里千问正式杀入硬件 将面向全球发布AI新品

    继AI购物春节爆火后,阿里巴巴旗下个人AI助手千问”正式进军AI硬件领域,今年将面向全球市场推出多款不同形态的AI硬件产品。 据了解,千问将在西班牙巴塞罗那举行的2026年世界移动通信大会(MWC)上发布首款同名AI眼镜,并于3月2日开启线上线下全渠道预约。 据悉,阿里正在将千问打造软硬一体、跨多种终端形态的AI助手。 跳出手机的千问将能够捕获更多物理世界的信�

今日大家都在搜的词: