首页 > 业界 > 关键词  > 阿里Qwen最新资讯  > 正文

阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1

2025-03-06 07:13 · 稿源: 快科技

快科技3月6日消息,阿里Qwen团队正式发布他们最新的研究成果QwQ-32B大语言模型

这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。

QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下,用强化学习实现了性能上的跨越。

此外,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。

阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1

QwQ-32B 在一系列基准测试中进行了评估,测试了数学推理、编程能力和通用能力。

其中,在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型。

同时,在由Meta首席科学家杨立昆领衔的最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek- R1。

目前,QwQ-32B已在Hugging Face和ModelScope开源,大家也可通过Qwen Chat直接进行体验!

举报

  • 相关推荐
  • 网红Coser“若童”因肠癌去世:年仅32岁

    网红Coser若童因肠癌不幸病逝,年仅32岁,抖音账号艾米尔的抹茶拿铁”发布了相关讣告。 讣告中表示,若童于8月27日因病逝世,若童老师待人真诚友善,他非常珍惜这每一段和大家一起度过的时光,非常感谢大家的喜爱和关心,他自始至终心存感激,愿来世还能再相见。 资料显示,肠癌是一种常见的消化道恶性肿瘤,绝大多数由结肠息肉逐渐演变而来,其诱发因素通常包括

  • 2025年大模型选型核心指南:Beyond GPT-4,如何理性评估Qwen、DeepSeek等强者?

    大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架,强调需超越单一指标崇拜,基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析,展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程,采用专业工具进行多维度评估,通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型,而非盲目追求流行模型。

  • 小米公布最新8折换电池手机:79.2元起、支持小米13等32款机型

    今日,小米服务公布9月服务周8折换电池机型,活动时间从即日开始至9月7日24:00结束。 据了解,9月折扣换电池服务支持32款手机,价格79.2元起,具体支持机型如下: REDMI手机 REDMI Note 11 4G、REDMI Note 11 Pro、REDMI Note 11 Pro 、REDMI Note 11E、REDMI Note 11T Pro、REDMI Note 11T Pro 、REDMI Note 11 SE、REDMI K40、REDMI K40 Pro、REDMIK40 Pro 、REDMIK40游戏增强版、REDMI K40S、REDMI K50、REDMI K50 Pro、REDMI K50电竞�

  • 让天下没有难查的故障:2025 阿里云 AI 原生编程挑战赛正式启动

    阿里云主办的2025 AI原生编程挑战赛聚焦智能运维(AIOps)赛道,旨在通过AI技术解决云原生环境下的系统故障定位问题。比赛提供真实云原生环境及多模态可观测数据,鼓励开发者借助大语言模型(LLM)打造低成本、高效率的故障诊断智能体。冠军可获得3万元奖金,并有机会与行业专家交流。赛事致力于推动AI在运维领域的创新应用,提升系统稳定性与可用性。

  • 华为小平板MatePad Mini发布:售价3299元起 支持插卡打电话

    今日,华为正式推出全新品类产品MatePad Mini小平板,以“小平板 大手机”为口号,主打便携性与通信能力融合。该产品提供六种存储版本,售价区间为3299元至6499元,其中12+256GB悦读版起售价3299元,16GB+1TB典藏版(含手写笔及皮套)顶配6499元,智能皮套单独售价199元。 核心配置上,MatePad Mini采用8.8英寸2560×1600分辨率OLED屏,通过2.99mm四等边挖孔设计实现92%屏占比,支持120Hz高�

  • 全球首发2亿新主摄!vivo X300影像参数出炉

    vivo X300后置2亿像素主摄、5000万超广角以及5000万潜望长焦,支持3倍光学变焦。 其中主摄是三星HPB,由vivo和三星联合打造,拥有1/1.4英寸超大底,支持23mm 2亿像素和50mm 5000万像素,支持CIPA 4.5防抖,还有蔡司T*镀膜。

  • OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

    OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。 官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、�

  • AI日报:Wan 2.2-S2V模型即将发布;​字节跳动内测3D Model Generator;微软开源 VibeVoice-1.5B 模型

    本期AI日报聚焦多项技术突破:阿里通义万相发布Wan 2.2-S2V模型,实现视频音频同步生成;字节跳动研发3D模型生成工具,降低建模门槛;面壁智能推出MiniCPM-V4.5端侧多模态模型;苹果提出RLCF训练法提升模型性能;微软开源VibeVoice-1.5B支持超长语音合成;谷歌Imagen 4正式上线;英伟达发布Jetson Thor机器人计算平台;Genspark推出AI Designer一键生成品牌方案;豆包上线未成年人保护模式。

  • AI日报:智谱AI发布AutoGLM 2.0;腾讯元宝接入腾讯视频;字节发布开源大语言模型 Seed-OSS

    本期AI日报聚焦多项AI技术突破:智谱发布革命性语音代理AutoGLM 2.0,实现全平台语音操控;腾讯元宝接入视频平台提升观影便捷性;字节跳动开源大模型Seed-OSS专注长文本处理;速卖通AI代理助力新品推广效率翻倍;微软测试Copilot智能文件搜索功能;Liquid AI推出低延迟视觉语言模型LFM2-VL;OpenAI月收入首破10亿美元;谷歌Pixel 10系列全面升级AI功能,包括情感识别和实时翻译;Pixel Buds Pro 2引入AI手势控制;ElevenLabs发布支持70+语言的文本转语音API。

  • 小米澎湃OS 3首批Beta版更新“3.0.0.24”发布

    今日,小米正式向旗下8款机型推送了澎湃OS3的首批Beta版升级,涵盖小米15、小米15Pro、小米15S Pro、小米15Ultra、REDMI K80Pro、REDMI K80至尊版、小米平板7Pro以及小米平板7S Pro12.5。此次更新不仅修复了用户反馈的多项系统问题,还新增了实用功能,并对相机稳定性进行了优化。 在系统层面,小米澎湃OS3解决了部分场景下多应用音量调节异常、应用双开时无法切换输入法、点击消息�

今日大家都在搜的词: