首页 > 业界 > 关键词  > 阿里云最新资讯  > 正文

仅仅2小时:摩尔线程GPU火速支持阿里通义千问QwQ-32B开源模型

2025-03-06 22:25 · 稿源: 快科技

快科技3月6日消息,3月6日一早,阿里云正式发布并开源全新推理模型通义千问QwQ-32B”,而在仅仅2个小时后,摩尔线程就迅速、高效地完成了适配,实现了Day0级支持!

基于大语言模型高速推理框架vLLM、MT Transformer推理引擎部署的QwQ-32B,在摩尔线程GPU上的实际运行中,展现出了卓越的推理性能与稳定性,再次印证了摩尔线程MUSA架构的强大生态兼容性。

值得一提的是,在此之前,摩尔线程仅用一周时间,就火速支持了DeepSeek开源周全家桶”。

目前,摩尔线程已将这一成果开放上线至模型广场夸娥工场”。

夸娥工场是摩尔线程倾力打造的模型展示中心,可为用户提供基于摩尔线程夸娥(KUAE)智算集群支持的模型能力体验。

夸娥工场体验地址:

https://playground.mthreads.com

QwQ-32B体验地址:

https://playground.mthreads.com:12019

仅仅2小时:摩尔线程GPU火速支持阿里通义千问QwQ-32B开源模型 摩尔线程模型广场夸娥工场”体验界面

在一系列权威基准测试中,千问QwQ-32B模型表现异常出色,几乎完全超越了OpenAI-o1-mini,比肩最强开源推理模型DeepSeek-R1。

尽管它只有32B参数,但通过大规模强化学习训练,其在数学、编程、通用能力等领域实现了显著突破,展现了卓越的智能化水平。

从官方发布的benchmark测试对比图中可以清晰地看到,QwQ-32B在各项测试中成绩显著高于OpenAI-o1-mini、Deepseek的各个蒸馏版本,在LiveBench、BFCL测试中甚至击败了满血版的Deepseek-R1-671B。

仅仅2小时:摩尔线程GPU火速支持阿里通义千问QwQ-32B开源模型

举报

  • 相关推荐
  • AI日报:智谱AI发布AutoGLM 2.0;腾讯元宝接入腾讯视频;字节发布开源大语言模型 Seed-OSS

    本期AI日报聚焦多项AI技术突破:智谱发布革命性语音代理AutoGLM 2.0,实现全平台语音操控;腾讯元宝接入视频平台提升观影便捷性;字节跳动开源大模型Seed-OSS专注长文本处理;速卖通AI代理助力新品推广效率翻倍;微软测试Copilot智能文件搜索功能;Liquid AI推出低延迟视觉语言模型LFM2-VL;OpenAI月收入首破10亿美元;谷歌Pixel 10系列全面升级AI功能,包括情感识别和实时翻译;Pixel Buds Pro 2引入AI手势控制;ElevenLabs发布支持70+语言的文本转语音API。

  • 昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

    中国科学技术大学张燕咏团队在昇腾算力支持下,成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略,有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题,显著提升推理性能。实验显示,该方案在多项指标上较主流方案提升超30%,为昇腾技术优化MoE模型推理提供了宝贵借鉴,将加速其在各领域的落地应用。

  • 阿里云百炼平台首个停车MCP服务上线,捷停车提供全维数据和场景支持

    8月初,捷停车-停车信息MCP服务正式上线阿里云百炼平台,成为该平台首个停车行业MCP服务,为开发者和用户提供高效停车信息查询能力。该服务覆盖全国400城、超5.9万停车场,注册用户突破1.4亿,支持车位查询、快速进出场及便捷缴费等全流程智慧停车体验。通过MCP服务,捷停车打破停车数据“信息孤岛”,实现专业停车能力“开箱即用”,助力出行服务体验升级,并推动停车行业与AI技术深度融合,加速智慧经济落地。

  • AI日报:Wan 2.2-S2V模型即将发布;​字节跳动内测3D Model Generator;微软开源 VibeVoice-1.5B 模型

    本期AI日报聚焦多项技术突破:阿里通义万相发布Wan 2.2-S2V模型,实现视频音频同步生成;字节跳动研发3D模型生成工具,降低建模门槛;面壁智能推出MiniCPM-V4.5端侧多模态模型;苹果提出RLCF训练法提升模型性能;微软开源VibeVoice-1.5B支持超长语音合成;谷歌Imagen 4正式上线;英伟达发布Jetson Thor机器人计算平台;Genspark推出AI Designer一键生成品牌方案;豆包上线未成年人保护模式。

  • AI模型库哪个好?2025年主流AI模型选型指南与API成本对比推荐

    AI时代企业核心挑战已从“能否做AI”转向“如何高效集成AI能力”。AI模型库通过聚合全球主流模型,提供透明化成本与能力信息,帮助企业实现快速原型验证、精准选型和成本优化。这种基础设施降低技术门槛,使非技术背景决策者也能深度参与技术选型,加速创新迭代并降低试错成本。

  • 阿里云AI火花大会:规模化前夜,AI务实派靠场景破局

    阿里云在深圳成功举办AI创新应用大会,提出要将"云+AI"技术转化为千行百业的商业动能。大会吸引了近千家企业参与,探讨AI技术从理论走向商业实践的路径。阿里云智能集团副总裁刘湘雯指出,AI不仅是技术演进,更是生产力革命。会议聚焦大模型与AI Agent的融合机遇,提出企业智能化转型需把握四大趋势:技术迭代加速、开源填补鸿沟、智能体从"工具人"变为"决策者"、交互革命重构人机触点。阿里云通过三层落地逻辑(模型API Server、Agent对接层、行业解决方案)助力企业穿透技术迷雾,并发布AI应用先锋计划,联合生态伙伴加速AI应用从概念验证到规模化落地。

  • AI日报:智谱视觉推理模型GLM-4.5V开源;达摩院开源三项具身智能核心技术;360智脑推出Light-IF系列模型

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱GLM-4.5V开源发布:全球100B级最佳视觉推理模型智谱宣布推出并开源了全球100B级效果最佳的开源视觉推理模型GLM-4.5V,这是该公司在通向通用人工智能(AGI)道路上的又一重要探

  • 真补贴、真落地!阿里云发布AI应用先锋计划,助力企业跑通AI第一程

    阿里云AI应用先锋计划通过“云+AI+行业适配”模式,助力企业突破AI落地瓶颈。该计划提供云资源补贴、POC服务、专家咨询及联合品牌推广等支持,降低企业AI应用门槛。结合端云协同架构,解决算力成本高、模型部署难等问题,已在智能硬件、教育、政务等领域实现案例落地,推动AI从技术尝鲜走向常态化应用。

  • 容联云「大模型金融质检」重磅升级:懂业务、全场景、高精度

    金融强监管下,质检是运营关键但效率低。传统人工质检覆盖不足5%,成本高且漏检率高。容联云推出大模型质检方案,实现100%全量覆盖,准确率达96%,成本降40%。覆盖客服、营销、合同、反欺诈四大场景,将风险从被动补救转向主动预防,助力企业实现精准、高效、可溯源的智能合规管理。

  • OpenAI的开源模型现已在IBM watsonx.ai上提供

    OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B,允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台,采用专家混合架构,支持本地或云端部署,不受商业用途限制。模型具备高透明度,输出完整推理链,在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态,IBM强调其开放战略,为企业提供灵活、安全的AI开发选择。

今日大家都在搜的词: