首页 > AI头条  > 正文

阿里通义千问推出Qwen3-30B-A3B-Thinking-2507推理模型

2025-07-31 08:28 · 来源: AIbase基地

Qwen3-30B-A3B模型迎来了重大更新,推出了新版本Qwen3-30B-A3B-Thinking-2507。这一新版本在推理能力、通用能力及上下文长度上实现了显著提升,标志着该模型不仅更加轻巧,还具备了更强的思考能力。

与4月29日开源的Qwen3-30-A3B模型相比,新模型在多个关键领域取得了进步。在数学能力方面,Qwen3-30B-A3B-Thinking-2507在AIME25评测中获得了85.0的高分,这一成绩超越了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking)。在代码能力测试LiveCodeBench v6中,新模型也取得了66.0的高分,显示出其在编程领域的强大能力。此外,新模型在知识水平(GPQA、MMLU-Pro)方面也较上一版本有了显著提升。

微信截图_20250731082733.png

除了数学和代码能力的增强,Qwen3-30B-A3B-Thinking-2507在通用能力上也实现了全面升级。在写作(WritingBench)、Agent能力(BFCL-v3)、多轮对话和多语言指令遵循(MultiIF)等通用能力评测中,新模型均超越了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking),显示出其在理解和生成自然语言方面的卓越能力。

新模型的上下文理解能力也得到了显著增强,原生支持256K tokens,并可扩展至1M tokens。这一改进使得Qwen3-30B-A3B-Thinking-2507能够处理更长的文本输入,从而更好地理解和生成复杂的文本内容。此外,新模型的思考长度(thinking length)也有所增加,开发团队推荐在高度复杂的推理任务中设置更长的思考预算,以充分发挥其潜力。

为了方便开发者和研究人员使用和测试这一新版本,Qwen3-30B-A3B-Thinking-2507已经在魔搭社区和HuggingFace上开源。其轻量体积使得该模型可以轻松实现消费级硬件的本地部署。同时,开发团队也在Qwen Chat上同步上线了新模型,欢迎开发者们前往体验其强大的推理和生成能力。

  • 相关推荐
  • 全球 AI 大模型排行榜 2025:GLM‑4.5 vs Qwen3‑235B‑A22B 深度对比

    2025年AI大模型技术进入竞争白热化阶段,中国厂商智谱AI与阿里通义在全球舞台持续发力。GLM-4.5系列和Qwen3系列成为最具代表性的开源模型:GLM-4.5采用MoE架构,综合性能全球第三,在编码任务中胜率超80%,工具调用成功率90.6%;Qwen3-235B采用动态专家路由机制,在长文本处理和中英文任务表现突出。文章通过架构、参数规模、基准测试等维度对比分析,推荐开发者使用AIbase模型广场一站式掌握全球大模型动态。最终结论:追求全面性能选GLM-4.5-X,注重部署效率选Qwen3-235B,轻量场景选Qwen332B。

  • AI日报:混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布

    【AI日报】汇总了最新AI领域动态:1)腾讯开源混元系列小尺寸模型,适用于消费级显卡;2)昆仑万维发布推理大模型MindLink,提升回答透明度;3)B站推出AI原声翻译功能,保留UP主音色;4)谷歌Gemini 2.5在数学奥赛夺金,展现强大推理能力;5)OpenAI展示GPT-5网络信息整合特性;6)苹果组建AI团队挑战ChatGPT;7)高德地图推出全球首个AI原生地图应用;8)Adobe推出AI图像合成工具Harmonize;9)NVIDIA发布革命性视频渲染技术;10)谷歌推出Android Studio免费AI编程助手;11)开源结构化信息提取工具LangExtract;12)Figma开发者模式升级提升设计转代码效率。

  • AI日报:阿里新发布Qwen3-4B模型;小红书发布开源模型dots.vlm1;MiniMax Speech 2.5语音生成模型上线

    AI日报栏目聚焦人工智能领域最新动态:1)阿里发布Qwen3-4B轻量级模型,手机端可运行;2)小红书开源多模态大模型dots.vlm1,在图表推理方面表现突出;3)MiniMax推出语音生成模型Speech2.5,多语种表现提升;4)Midjourney推出HD视频模式,提升专业影像质量;5)Cursor1.4版本增强异步任务处理能力;6)谷歌否认AI搜索影响网站流量,但数据显示用户行为改变;7)MiniCPM-V4.0开源发布,号称"手机上的GPT-4V";8)AMD与高通宣布支持OpenAI的gpt-oss系列模型;9)腾讯开源WeKnora文档智能解析工具;11)疑似GPT-5信息在GitHub泄露;12)FlowSpeech实现书面语转口语的TTS技术突破。

  • AI日报:火山引擎发布豆包3.0;通义开源Qwen3非思考模型;谷歌偷偷升级Imagen 4

    【AI日报】栏目聚焦人工智能领域最新动态:1)火山引擎发布豆包系列AI模型升级,包括图像编辑3.0、同声传译2.0等;2)通义千问开源Qwen3-30B模型,支持多语言处理;3)OpenAI推出ChatGPT Study学习助手;4)中国发布HYPIR图像复原大模型;5)谷歌NotebookLM新增视频概览功能;6)谷歌Imagen4图像生成模型升级,性能媲美GPT-4o;7)昆仑万维开源多模态模型Skywork UniPic;8)理想汽车发布首搭VLA大模型的i8纯电SUV;9)谷歌在英国推出AI搜索模式;10)OWL团队开源多智能体协作工具;11)2025年用户增速最快APP榜单显示DeepSeek等AIGC应用表现突出。

  • AI 大模型选型指导:一文实测 Kimi‑K2‑Turbo‑Preview 与 Qwen3‑Coder‑Flash

    本文对比分析了Kimi-K2-Turbo-Preview和Qwen3-Coder-Flash两款AI大模型在开发者选型中的表现。K2-Turbo采用MoE架构,激活参数32B,支持128K上下文,在代码调试和自动化流程方面表现突出;Qwen3-Coder为480B参数的MoE模型,原生支持256K上下文,擅长大规模代码库理解和API集成。二者在中级任务表现接近,但K2在复杂可视化任务更优,Qwen3在多轮Agent调用更稳定。建议根据需求选择:注重调试自动化选K2,需要长上下文支持选Qwen3。推荐使用AIbase模型广场进行高效选型对比。

  • 正式上线升级版Qwen3模型!霍涛带领白山云持续赋能AI体验

    白山云在CEO霍涛带领下上线阿里千问Qwen3-235B大模型,该模型在指令遵循、逻辑推理、编程等能力显著提升,在多项评测中超越主流开源和闭源模型。基于全球边缘云架构优势,白山云提供低延迟、稳定的API服务,支持多语言长文本处理。平台已集成DeepSeek、通义千问等多款大模型,部分免费开放。霍涛表示,边缘计算正从"流量节点"向"智能计算单元"进化,白山云依托覆盖60多国的边缘网络,构建日均万亿Token级推理平台,通过"本地推理+云端协同"架构,已渗透工业质检、智能驾驶等20多个垂直场景。

  • A日报:Trae 2.0 正式升级 SOLO 模式;通义发布Qwen3新模型;智谱AI重磅推出Zread

    本期AI日报聚焦多项AI领域突破:1)Trae 2.0推出SOLO模式,实现AI全流程自主开发;2)阿里通义发布Qwen3-235B大模型,支持256K文本处理;3)智谱AI推出Zread工具,一键转换GitHub项目为使用手册;4)零一万物发布万智企业大模型平台2.0及定制Agent方案;5)字节跳动推出通用机器人模型GR-3,具备高精度操作能力;6)Pika推出AI视频特效APP,降低创作门槛;7)Dia浏览器将上线AI驱动的"分身鼠标&

  • AI日报:阿里推全新图片模型Qwen-Image;小米全量开源MiDashengLM-7B;智谱Zread.ai搭载 GLM-4.5

    本文汇总了AI领域最新动态:1)阿里开源文生图模型Qwen-Image,中文文本渲染领先;2)ChatGPT周活用户达7亿,OpenAI年收入120亿美元;3)Anthropic测试Claude Opus 4.1,推理能力升级;4)智谱推出开发工具Zread.ai提升代码理解效率;5)xAI发布Grok Imagine4支持文生视频及NSFW内容;6)Character.AI推出首个AI原生社交功能;7)阿里与南开合作视频压缩技术LLaVA-Scissor;8)北京团队突破人形机器人3D视觉系统�

  • 大模型对比评测:Qwen2.5 VS Gemini 2.0谁更能打?

    本文对比分析了四款AI大模型:Gemini2.0Flash-Lite(Preview)、Gemini2.0Flash(Experimental)、Gemini2.0Pro Experimental(Feb25)和Qwen2.5Coder Instruct32B。Gemini2.0Flash-Lite适合高并发低延迟应用,Gemini2.0Flash擅长实时多模态推理,Gemini2.0Pro适合复杂编程任务,Qwen2.5Coder在代码任务上性价比突出。建议使用AIbase模型广场进行高效筛选,该平台覆盖上万款AI模型,提供性能、价格等多维度直观对比,支持按任务类型、语言等精准筛选,并持续更新最新模型。

  • 大厂盯上AI玩具,你的下一个LABUBU可能出自阿里

    在2025年下半年,大厂的AI争夺战已经卷到了玩具上。 前有OpenAI宣布与玩具巨头美泰合作,后有马斯克推出AI伴侣,如今,京东更是大张旗鼓地要涉足AI玩具赛道。

今日大家都在搜的词: