首页 > 业界 > 关键词  > 正文

全球开源模型!阿里通义千问登顶国内:超越一众开闭源模型

2024-07-10 12:27 · 稿源: 快科技

根据 SuperCLUE 发布的中文大模型基准测评报告,阿里巴巴的通义千问开源模型 Qwen2-72B-Instruct 在国内通用能力上排名第一,并在全球范围内成为最强大的开源模型。

报告显示,Qwen2-72B 在综合测评中获得了 77 分的高分,仅次于 OpenAI 的 GPT-4o,与 Claude-3.5-Sonnet 并列第二。它超越了百度文心一言 4.0、讯飞星火 V4.0、Llama-3-70B 等开闭源大模型。

在具体测评中,Qwen2-72B 在理科、文科和 Hard 三个维度的表现全面均衡。它在理科任务上的得分与 GPT-4o 仅相差 5 分,显示出其在计算、逻辑推理和代码测评方面的优势。

值得注意的是,在端侧小模型测评中,Qwen2-7B 以 70 亿参数的模型规模超越了上一代 320 亿参数的 Qwen1.5-32B 和 130 亿参数的 Llama-3-8B-Instruct,夺得排名第一。这证明了 Qwen2-7B 在小尺寸模型中的卓越性能,为端侧小模型的落地提供了更多可能。

截至目前,Qwen 系列模型的下载量已突破 2000 万次,其应用场景覆盖了工业、金融、医疗、汽车等多个垂直领域。

举报

  • 相关推荐
  • 国内大模型GEO优化全攻略:免费工具教你监测品牌在文心一言、通义千问等AI平台的可见度

    AI搜索时代,品牌若未出现在AI回答中就等于"不存在"。GEO(生成引擎优化)成为新战场,核心是让AI在回答用户问题时优先引用企业内容。文章详解国内主流AI模型特点:文心一言整合百度生态、通义千问依托阿里电商数据、小众模型在垂直领域更易被引用。提出三大优化策略:内容结构化呈现、建立行业权威背书、布局高权重平台。推荐使用AIBase免费工具实时监测品牌在各大AI平台的曝光情况,通过数据驱动优化策略。

  • GEO排名查询工具怎么用?手把手教你监测品牌在通义千问、Kimi等AI平台的推荐情况

    AI时代催生GEO(生成引擎优化)新范式,正逐步取代传统SEO。GEO关注品牌在AI问答中的提及率、推荐频次与排名,通过优化内容结构提升AI引擎推荐权重。AIBase平台推出专业GEO监测工具,支持五大主流AI平台实时检测,提供竞品对比与优化建议,帮助企业量化品牌在AI生态中的可见度,已成为数字资产评估新标准。

  • AI日报:Lovart AI上线“元素拆分”功能;Xcode 26.1.1发布;阿里云通义模型首次大规模赋能双11

    本期AI日报涵盖八大热点:Lovart AI推出"元素拆分"功能,实现海报智能分层编辑;苹果Xcode 26.1.1优化AI编码性能;阿里云通义模型双11单日翻译调用量突破14亿次;Gemini 3在历史手稿破译中展现专家级能力;德国法院裁定OpenAI使用歌词训练构成侵权;开源语音模型Maya1实现富有表现力的实时文本转语音;Meta首席AI科学家LeCun计划离职创办世界模型公司;AI专家罗福莉加入小米,将致力于构建物理世界智能。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • 登榜LMArena!文心大模型5.0-Preview文本能力国内第一

    11月8日,文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出,超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容;复杂长问题理解适用于学术问答、报告分析等任务;指令遵循能力支持智能助理、代码生成等场景,为多领域内容生产提供高效支撑。

  • T1六度登顶LOL全球总决赛冠军,三星玄龙骑士以冠军级装备点亮竞技梦想

    T1战队在英雄联盟全球总决赛中历经五局鏖战,斩获队史第六座冠军奖杯。Faker凭借顶尖竞技实力与心理素质,诠释电竞精神。三星电竞显示器作为官方合作伙伴,以OLED技术为核心推出多款新品:OLED G6/G8具备防眩光、高刷新率与精准色彩,玄龙骑士3D显示器G90XF创新搭载眼球追踪与AI视频转换功能,打破传统3D局限。系列产品通过技术升级,为职业选手与玩家提供专业装备支持,持续推动电竞产业发展。

  • 「1024 | 科大讯飞全球红人中国行」:共见中国品牌全球营销新征程

    科大讯飞在2024全球1024开发者节期间举办"全球红人中国行"活动,邀请六位总粉丝超1200万的海外红人来华,通过AI技术赋能红人营销,探索中国品牌全球化新路径。活动结合产品体验与跨文化对话,借助iFLYTalent平台实现红人营销全链路智能化,助力品牌精准触达欧美、东南亚等市场,推动从"产品出海"到"品牌出海"的升级,以"AI+红人"生态突破文化壁垒,重塑全球营销新范式。

  • 全球开源技术峰会GOTC 2025 圆满落幕

    11月2日,为期两天的全球开源技术峰会GOT C2025在北京圆满落幕。本届峰会聚焦开源与人工智能深度融合,汇聚全球顶尖专家、行业领袖与数千开发者,共同探讨开源驱动的AI未来蓝图。现场吸引超3000人次参与,线上直播观看量突破500万,全网曝光超6亿次。大会设立十二大专题论坛,覆盖大模型应用、AI编程、云原生AI等前沿领域,并发布Open AgentKit等关键项目。通过“论坛+市集�

  • 贝昂智能科技:以“无耗材”技术重构全球空气净化市场

    中国科技企业贝昂智能以独创“无耗材”空气净化技术改变行业竞争逻辑。其TPA双极猎尘技术通过高压电场直接吸附分解污染物,精度达0.0146微米,核心收集极可水洗重复使用,突破传统HEPA滤网持续耗材等痛点。目前产品已进入日本超1.5万家医疗机构、德国7000余所学校,业务覆盖全球96个国家。企业从空气净化延伸至台式净饮机、新风系统等品类,向“舒适健康全方案提供者”进化,并计划2025年申报北交所上市。

  • AI日报:月之暗面开源AI新框架Kosong;百度发布新模型ERNIE-4.5-VL;GPT-5.1“隐身”登场

    本期AI日报聚焦多项技术突破:月之暗面开源AI代理框架Kosong,支持异步编排与插件化设计;Replit推出AI集成功能,可一键调用300+模型;商汤发布空间智能模型SenseNova-SI,性能超越GPT-5;百度推出多模态模型ERNIE-4.5-VL,新增图像思考能力;谷歌地图全面AI化,集成Gemini实现智能交互;ChatTutor上线可视化教学系统,覆盖多学科实时推演;新版Google Finance引入AI深度搜索与财报追踪;OpenAI低调上线Polaris Alpha模型,支持256K上下文并更新知识库至2024年10月。

今日大家都在搜的词: