首页 > 业界 > 关键词  > 阿里云最新资讯  > 正文

仅仅2小时:摩尔线程GPU火速支持阿里通义千问QwQ-32B开源模型

2025-03-06 22:25 · 稿源: 快科技

快科技3月6日消息,3月6日一早,阿里云正式发布并开源全新推理模型通义千问QwQ-32B”,而在仅仅2个小时后,摩尔线程就迅速、高效地完成了适配,实现了Day0级支持!

基于大语言模型高速推理框架vLLM、MT Transformer推理引擎部署的QwQ-32B,在摩尔线程GPU上的实际运行中,展现出了卓越的推理性能与稳定性,再次印证了摩尔线程MUSA架构的强大生态兼容性。

值得一提的是,在此之前,摩尔线程仅用一周时间,就火速支持了DeepSeek开源周全家桶”。

目前,摩尔线程已将这一成果开放上线至模型广场夸娥工场”。

夸娥工场是摩尔线程倾力打造的模型展示中心,可为用户提供基于摩尔线程夸娥(KUAE)智算集群支持的模型能力体验。

夸娥工场体验地址:

https://playground.mthreads.com

QwQ-32B体验地址:

https://playground.mthreads.com:12019

仅仅2小时:摩尔线程GPU火速支持阿里通义千问QwQ-32B开源模型 摩尔线程模型广场夸娥工场”体验界面

在一系列权威基准测试中,千问QwQ-32B模型表现异常出色,几乎完全超越了OpenAI-o1-mini,比肩最强开源推理模型DeepSeek-R1。

尽管它只有32B参数,但通过大规模强化学习训练,其在数学、编程、通用能力等领域实现了显著突破,展现了卓越的智能化水平。

从官方发布的benchmark测试对比图中可以清晰地看到,QwQ-32B在各项测试中成绩显著高于OpenAI-o1-mini、Deepseek的各个蒸馏版本,在LiveBench、BFCL测试中甚至击败了满血版的Deepseek-R1-671B。

仅仅2小时:摩尔线程GPU火速支持阿里通义千问QwQ-32B开源模型

举报

  • 相关推荐
  • 阿里云上线团队版Token Plan:支持多坐席分配和管理

    阿里云上线团队版Token Plan,内置Qwen3.6、Kimi-K2.6等十余款多模态模型,支持多席位分配与管理,提供三档套餐,解决团队规模化使用订阅服务的管理难题。该计划兼容Qoder、Cursor等主流Agent工具,可一键调用。聚焦员工日常办公场景,提供企业席位管理、成本管控、用量统计等功能,管理员可一键完成成员管理与席位分配。内置多租户隔离能力,保障高峰期稳定运行,并提供企业级数据隐私保护。订阅后可灵活切换多款模型,完成代码生成、商品组图生成等多样化创作任务。

  • 模型即审美:生图模型们正建起自己的“视觉方言”

    ​最近在测试各种AI生图模型的时候,我们发现了一个现象:同样一个提示词,丢给不同的模型,出来的图片风格差异大到像是出自不同摄影流派。 Image-2生成的图就像我昨天随手拍的,但Nano Banana生成的图感觉像某个家居品牌的广告大片。有些模型执着于捕捉现实的每一丝瑕疵,有些则痴迷于把日常场景变成精致的艺术品。这背后反映的不是能力差别,而是每个模型对"什么

  • 小米自动驾驶模型Xiaomi OneVL开源:业内率先统一VLA、世界模型路线

    今日,小米正式发布并开源Xiaomi OneVL自动驾驶模型。 该模型在业内率先实现VLA、世界模型、潜空间推理等多个技术路线的统一,在具备XLA模型强悍推理能力的基础上,大幅提升了推理的速度和精度,是行业内具备开创性的方案。 其在精度上超越显式CoT、在速度上对齐仅答案”预测的潜空间CoT方案。过去,VLA和世界模型是自动驾驶领域两条相对独立的技术路线:VLA专注于理解�

  • 高通发布第五代骁龙4:GPU性能暴增77% 千元机也能90帧游戏

    高通正式推出第五代骁龙4移动平台,主打入门级智能手机,让千元机也能用上更流畅的性能和更好的游戏体验。 这代骁龙4最大的提升就是日常使用更跟手。它搭载了全新的流畅界面技术,应用启动速度比上一代直接提升43%,屏幕卡顿减少25%,平时刷页面、切软件都更顺滑。 游戏方面进步特别明显,GPU性能提升高达77%,并且支持90FPS高帧游戏。以前千元机玩游戏只能开低帧率

  • 告别价格战,大模型共迎通胀时代

    眼下,涨价成为大模型的关键词。 迈入2026年,大模型不再是优惠缩水,而是毫不掩饰地开启了涨价模式,大大小小的厂商纷纷入局,智普甚至在短短三个月之内两次提价。 以至于,国产大模型定价首次与海外头部厂商对齐。 大模型涨价,是昙花一现还是旷日持久?降价争夺市场的打法,是否走到了尽头?价值战会成为未来竞争的核心叙事吗?

  • 百度文心大模型5.1正式发布

    百度正式发布了新一代基础大模型——文心大模型5.1。该模型采用了自主研发的“多维弹性预训练”技术,仅以业界同规模模型约6%的预训练成本,便达到了基础效果领先的水平,并登上LMArena搜索榜国内第一的位置。 在多项行业权威基准测试中,文心5.1在智能体、知识理解、逻辑推理以及深度搜索等核心能力上表现突出。其中,智能体能力提升显著,已超越DeepSeek-V4-Pro;创意�

  • 2026破解PPT制作痛点:文多多AIPPT全链路赋能模型重构高效办公!

    传统PPT制作存在耗时漫长、风格杂乱、数据安全三大痛点。文多多AIPPT推出的AI-PPT全链路赋能模型,基于大语言模型实现需求解析、内容生成、视觉呈现、演讲辅助、企业适配五大环节智能化。用户输入标题或上传文档,20秒生成结构化大纲,30秒完成排版美化,自动匹配商务、教学等场景模板。该模型支持个人一键生成与企业私有化部署,某高校教师备课时间从1个月缩至2周,某央企通过API对接CRM系统实现PPT标准化制作,将重复劳动交给AI,让用户专注核心创意。

  • 改写语音交互行规,豆包大模型更稳了

    豆包大模型,又上新了。 2026年4月9日,原生全双工语音大模型Seeduplex正式发布,相比上一代半双工豆包端到端语音模型,新模型基于“边听边说”的全新框架设计,交互体验的自然感、顺畅度大幅提升,目前已在豆包App全量上线。 这意味着,前沿的全双工语音技术,第一次实现商业规模化落地。 而依托全双工语音技术,豆包的语音交互不再是机械式的一问一答,而是收放�

  • 小米自研AI大模型!Xiaomi MiMo再次登顶全球第一

    小米官方今天发文宣布,小米技术官方宣布,在OpenRouter平台最新数据中,Hermes Agent登顶全球调用量榜首,日Token调用量达2910亿,周调用量超1.75万亿。 小米自研MiMo模型成为第一大贡献模型,近一个月累计贡献1.45万亿Token调用量。

  • 普渡机器人正式发布具身智能大模型PuduFM 1.0

    2026年5月11日,普渡机器人发布具身智能大模型PuduFM1.0,构建三维空间深度感知、物理状态预测和持续进化学习三大技术维度,实现从“简单执行”向“物理认知”的跨越。该模型通过分层架构和虚实双数据闭环,解决行业在协作、操作和异构数据复用上的困境,支持超长程任务和异构机器统一运行,推动具身智能规模化落地。

今日大家都在搜的词: