首页 > 业界 > 关键词  > 正文

全球开源模型!阿里通义千问登顶国内:超越一众开闭源模型

2024-07-10 12:27 · 稿源: 快科技

根据 SuperCLUE 发布的中文大模型基准测评报告,阿里巴巴的通义千问开源模型 Qwen2-72B-Instruct 在国内通用能力上排名第一,并在全球范围内成为最强大的开源模型。

报告显示,Qwen2-72B 在综合测评中获得了 77 分的高分,仅次于 OpenAI 的 GPT-4o,与 Claude-3.5-Sonnet 并列第二。它超越了百度文心一言 4.0、讯飞星火 V4.0、Llama-3-70B 等开闭源大模型。

在具体测评中,Qwen2-72B 在理科、文科和 Hard 三个维度的表现全面均衡。它在理科任务上的得分与 GPT-4o 仅相差 5 分,显示出其在计算、逻辑推理和代码测评方面的优势。

值得注意的是,在端侧小模型测评中,Qwen2-7B 以 70 亿参数的模型规模超越了上一代 320 亿参数的 Qwen1.5-32B 和 130 亿参数的 Llama-3-8B-Instruct,夺得排名第一。这证明了 Qwen2-7B 在小尺寸模型中的卓越性能,为端侧小模型的落地提供了更多可能。

截至目前,Qwen 系列模型的下载量已突破 2000 万次,其应用场景覆盖了工业、金融、医疗、汽车等多个垂直领域。

举报

  • 相关推荐
  • 国内大模型GEO优化全攻略:免费工具教你监测品牌在文心一言、通义千问等AI平台的可见度

    AI搜索时代,品牌若未出现在AI回答中就等于"不存在"。GEO(生成引擎优化)成为新战场,核心是让AI在回答用户问题时优先引用企业内容。文章详解国内主流AI模型特点:文心一言整合百度生态、通义千问依托阿里电商数据、小众模型在垂直领域更易被引用。提出三大优化策略:内容结构化呈现、建立行业权威背书、布局高权重平台。推荐使用AIBase免费工具实时监测品牌在各大AI平台的曝光情况,通过数据驱动优化策略。

  • GEO排名查询工具怎么用?手把手教你监测品牌在通义千问、Kimi等AI平台的推荐情况

    AI时代催生GEO(生成引擎优化)新范式,正逐步取代传统SEO。GEO关注品牌在AI问答中的提及率、推荐频次与排名,通过优化内容结构提升AI引擎推荐权重。AIBase平台推出专业GEO监测工具,支持五大主流AI平台实时检测,提供竞品对比与优化建议,帮助企业量化品牌在AI生态中的可见度,已成为数字资产评估新标准。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • AI日报:LiblibAI 2.0正式上线;通义千问、豆包开启记忆功能;Sora已登陆Google Play

    本期AI日报聚焦多项重要进展:LiblibAI 2.0上线,内置多模型并提供限时免费算力;通义千问和豆包开启记忆功能内测;OpenAI视频生成应用Sora登陆Google Play并开放北美预注册;Qoder推出提示词增强功能提升开发效率;Cherry Studio集成主流AI模型并推出优惠活动;港中文团队推出首个结构化图像生成系统;DeepSeek入选2025全球十大工程成就。这些突破展示了AI技术快速迭代与多领域应用�

  • AI日报:谷歌发布Veo 3.1;通义千问推Qwen Chat Memory功能;Sora2免费用户可生成15秒视频

    本期AI日报聚焦多项技术更新:谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能;通义千问推出记忆功能提升对话连贯性;Sora2免费用户可生成15秒视频,Pro版支持25秒;百度文心助手升级8种创作模式;谷歌Flow工具增强视频光影编辑与音频合成能力;Anthropic发布高性价比Claude Haiku 4.5;北京查处首例AI虚假广告案,涉伪造主持人带货;阿里推出响应仅200毫秒的编程工具Qoder CLI。

  • 全球跨境第三方收款服务市场快速增长,万里汇市占率第一

    全球跨境电商市场持续扩大,货物贸易占比稳步提升,中国稳居全球主力地位,出口导向格局强化。跨境支付进入实时支付、稳定 币与数字货币时代,小额高频场景推动结构重塑。第三方支付服务价值凸显,中国出口收款市场快速扩容。头部服务商优势扩大,万里汇市占率领先。行业集中化趋势明显,未来服务商将通过深化场景理解、拓展服务边界赋能跨境商家增长。

  • 全新开源的DeepSeek-OCR,可能是最近最惊喜的模型。

    ​AI圈虽然天天卷,但是很多的模型,真的越来越无聊了。 每天就是跑分又多了几个点。 直到昨天,DeepSeek久违的发了一个新模型。 DeepSeek-OCR。 这玩意,是真的有点酷。

  • 秋季为何越来越短了 全球变暖或是主因

    ​近期,不少人感受到今年的秋天格外短暂,仿佛从炎热的夏季直接过渡到了寒冷的冬季,这一现象引发了广泛关注。据气象专家分析,秋季变短的根本原因在于全球变暖导致的大气环流调整。 气象数据显示,我国多地的秋季不仅来得越来越晚,而且停留时间也越来越短,呈现出明显的“迟到早退”特征。与1991年至2020年的平均入秋日期相比,郑州、宁波、深圳、杭州等地的�

  • 连续14年全球第一!海尔冷柜亮相广交会加速出口

    第138届广交会10月15日开幕,作为中国外贸风向标,助力企业向“新、智、绿”高质量发展。海尔冷柜凭借硬核产品与方案吸引全球目光,外商直言“想带回国”。其通过双翼驭风鲜冻、HCF鲜冻保湿等科技精准解决存储痛点,以“需求洞察-技术转化-产品落地”闭环快速适配不同市场需求,如推出榴莲专属冷冻方案。海尔冷柜连续14年全球销量第一,服务超10亿用户,此次借广交会平台进一步释放全球品牌影响力,展现中国创新力量。

  • 只有0.9B的PaddleOCR-VL,却是现在最强的OCR模型。

    ​这几天,OCR这个词,绝对是整个AI圈最火的词。因为DeepSeek-OCR,甚至让OCR这个赛道文艺复兴,又给直接带火了。 整个Hugging Face的趋势版里,前4有3个OCR,甚至Qwen3-VL-8B也能干OCR的活,说一句全员OCR真的不过分。 然后在我上一篇讲DeepSeek-OCR文章的评论区里,有很多朋友都在把DeepSeek-OCR跟PaddleOCR-VL做对比,也有很多人都在问,能不能再解读一下百度那个OCR模型(也就是PaddleOCR-VL

今日大家都在搜的词: