首页 > 业界 > 关键词  > 正文

全球开源模型!阿里通义千问登顶国内:超越一众开闭源模型

2024-07-10 12:27 · 稿源: 快科技

根据 SuperCLUE 发布的中文大模型基准测评报告,阿里巴巴的通义千问开源模型 Qwen2-72B-Instruct 在国内通用能力上排名第一,并在全球范围内成为最强大的开源模型。

报告显示,Qwen2-72B 在综合测评中获得了 77 分的高分,仅次于 OpenAI 的 GPT-4o,与 Claude-3.5-Sonnet 并列第二。它超越了百度文心一言 4.0、讯飞星火 V4.0、Llama-3-70B 等开闭源大模型。

在具体测评中,Qwen2-72B 在理科、文科和 Hard 三个维度的表现全面均衡。它在理科任务上的得分与 GPT-4o 仅相差 5 分,显示出其在计算、逻辑推理和代码测评方面的优势。

值得注意的是,在端侧小模型测评中,Qwen2-7B 以 70 亿参数的模型规模超越了上一代 320 亿参数的 Qwen1.5-32B 和 130 亿参数的 Llama-3-8B-Instruct,夺得排名第一。这证明了 Qwen2-7B 在小尺寸模型中的卓越性能,为端侧小模型的落地提供了更多可能。

截至目前,Qwen 系列模型的下载量已突破 2000 万次,其应用场景覆盖了工业、金融、医疗、汽车等多个垂直领域。

举报

  • 相关推荐
  • Qwen3-Max成阿里通义“地表最强”:性能超GPT5 数学推理直接满分

    9月24日,2025云栖大会开幕,阿里通义千问旗舰模型Qwen3-Max重磅亮相,性能超越GPT-5、Claude+Opus 4等,跻身全球前三。该模型包含指令和推理两大版本,预训练数据量达36T tokens,总参数超万亿,具备极强编程和工具调用能力。在SWE-Bench测试中,指令版斩获69.6分全球第一;Tau2-Bench工具调用测试达74.8分,超越同类模型。推理增强版Qwen3-Max-Thinking在数学推理测试中获满分,国内首次突破。通义千问系列已实现全尺寸覆盖,包含三百多个模型。即日起,用户可在QwenChat免费体验Qwen3-Max,或通过阿里云百炼平台调用API服务。

  • AI日报:阿里云开源通义DeepResearch;夸克推医师考试大模型

    本期AI日报聚焦多项前沿动态:阿里云开源轻量级AI代理DeepResearch,性能媲美OpenAI;夸克推出国内首个全阶段医师考试大模型测试集;微软Copilot将上线类ChatGPT记忆管理功能;迪士尼等巨头起诉MiniMax侵犯版权;OpenAI提升ChatGPT搜索准确性;Notion推出个性化AI助手;谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5;Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�

  • 全球第一!腾讯混元翻译模型Hunyuan-MT-7B登顶开源热榜

    腾讯混元翻译模型Hunyuan-MT-7B登顶Hugging Face趋势榜首位,并在ACL WMT2025比赛中以30项第一的成绩领先。该模型支持33种语言,包括5种汉语言方言互译,在Flores200评测中表现卓越,超越同尺寸模型,与超大模型效果相当。腾讯提出完整训练范式,覆盖预训练到强化学习全链条,实现业界最优翻译效果。

  • 海尔智能制造:先夺中国第一,又夺全球第一

    9月,海尔智家在智能制造领域迎来两大突破:两座工厂入选2025年度卓越级智能工厂,累计5座居国内行业第一;另有两座工厂跻身最新一批全球灯塔工厂名单,累计12座居行业榜首,成为全球最大灯塔工厂集群。这展现了海尔在智能制造领域的双重引领优势:国内以卓越级工厂代表最高水平,全球以灯塔工厂体现数字化制造标杆。其工厂覆盖冰箱、洗衣机等多品类,通过数字孪生、人工智能等技术实现柔性化、智能化生产,并在绿色可持续与人才培养领域全面领先,为全球制造业转型提供中国方案。

  • AI日报:美团发布推理大模型LongCat-Flash-Thinking;阿里Wan-Animate开源;字节推豆包翻译大模型

    AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking;阿里开源Wan-Animate模型革新AI视频生成;字节跳动发布豆包翻译模型,支持28种语言互译;华为与浙大联合推出安全大模型DeepSeek-R1-Safe;阿里云即将发布跨模态模型Qwen3-Omni;xAI推出计算成本降低98%的Grok4Fast模型;YouTube发布多项AI创作辅助功能;IBM推出轻量级文档处理模型Granite-Docling-258M;中科院发布类脑大模型SpikingBrain实现百倍速度突破;OpenAI将推出仅限Pro用户的计算密集型新功能。

  • 性能超越GPT-4o及Qwen2.5-VL,百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

    百度发布超轻量级文字识别模型PP-OCRv5,仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型,尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别,适用于教育、医疗、法律等多行业数字化需求,累计下载量超900万,是GitHub上唯一Star数超5万的中国OCR项目。

  • AI日报:小米开源首个原生端到端语音大模型;通义万相Wan2.2-Animate正式开源;Suno v5即将上线

    AI日报今日聚焦多项技术突破:小米开源首个端到端语音大模型Xiaomi-MiMo-Audio;通义万相推出全新动作生成模型Wan2.2-Animate;Suno即将发布革命性音乐模型v5;生数科技获数亿融资,视频生成技术商业化加速。同时关注OpenAI修复ChatGPT安全漏洞,谷歌将Gemini集成至Chrome浏览器,Luma AI发布支持16位色的Ray3视频生成模型,法国Mistral推出开源推理模型Magistral Small 1.2,Notion发布AI智能体,腾讯混元3D Studio提升3D创作效率。

  • 推荐国内优势智驾:Momenta凭借飞轮大模型,带来极致流畅的驾驶体验

    Momenta作为国内智能驾驶领域的领先者,凭借其创新的飞轮大模型技术,实现了端到端的自动驾驶解决方案。该技术将感知与规划整合,有效解决长尾问题,提升系统可靠性和稳定性。其R6飞轮大模型采用强化学习,具备持续进化能力,适应复杂路况。Momenta与宝马、奥迪等全球主流车企深度合作,方案已成功应用于广汽丰田、东风日产等车型,并在欧洲、澳大利亚等市场落地,展现出强大的全球适应性和技术优势。选择Momenta,即选择了经过验证的可靠技术和持续升级的智能驾驶体验。

  • AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型

    本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。

  • 百度智能云Qianfan-VL系列模型开源!全尺寸领域增强效果优异,全自研芯片计算

    百度智能云千帆正式推出全新视觉理解模型Qianfan-VL并全面开源。该系列模型包含3B、8B和70B三个版本,面向企业级多模态应用场景,具备出色的基础通用能力,并针对OCR、教育等高频需求进行专项强化。模型基于昆仑芯P800芯片实现高效计算,支持5000卡并行,在通用和垂直任务评测中达到SOTA水平。Qianfan-VL具备多尺寸模型、思维链推理和OCR增强三大特点,可广泛应用于文档识别、数学解题、图表分析等场景,为企业提供高精度视觉理解解决方案。

今日大家都在搜的词: