首页 > 业界 > 关键词  > Hugging最新资讯  > 正文

!阿里Qwen-2成全球开源大模型排行榜

2024-06-27 12:00 · 稿源: 快科技

Hugging Face联合创始人兼首席执行官Clem在社交媒体上宣布,阿里巴巴最新开源的Qwen2-72B指令微调版本已登上开源模型排行榜榜首。

为了确保排行榜的公正性和准确性,Hugging Face团队利用300块H100高性能硬件,对100多个主流开源大模型进行了严格评估,包括BBH、MUSR、MMLU-PRO、GPQA等基准测试集。

此次重新评估旨在解决开发者过度依赖评估集数据和过去评估标准过于简单的弊端。通过提高难度标准,本次评估检验了模型在更复杂任务下的性能。

值得注意的是,阿里巴巴开源的Qwen-2 72B模型在竞争中脱颖而出,超越了Meta的Llama-3和Mistralai的Mixtral,成为行业领先者。此举表明了中国在开源大模型领域的领导地位。

Stability AI研究总监Tanishq表示,他此前预测中国在开源大模型领域具有强劲实力。除了Qwen2,零一万物、InternLM、Deepsseek等中国开源模型也在国际舞台上表现出色。

Tanishq强调,任何认为中国在开源大模型领域落后的观点都是站不住脚的。相反,中国正在引领这一领域的发展,展现出领导者的姿态。

举报

  • 相关推荐
  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • Hugging Face创始人x小红书技术副总裁对谈:开源、AI与技术人的成长

    小红书科技与Red++ Academy在1024程序员节举办直播,技术副总裁凯奇、语音模型负责人风龙与Hugging Face联合创始人Thomas Wolf围绕三大核心观点展开AMA对话:AI编程正成为基础能力;开源是技术发展的核心引擎;实现有"人味"的AGI路径清晰但仍需攻克创造力、复杂环境感知等难题。讨论覆盖开源价值、AGI发展瓶颈、AI人味化实践,强调技术人需提升问题定义与框架性解决能力,并分享了AI编码提效、学习新技术的方法。直播展现小红书从文本模型到语音模型的开源布局,旨在降低技术使用门槛,推动社区共进。

  • 跳绳是减重排行榜第一名的运动上热搜 专家:有多项好处

    美国运动理学会最新减重运动排行榜显示,跳绳高居榜首,远超跑步、游泳等传统项目。以每分钟120次的速度跳绳,每小时可燃烧667-990千卡热量。跳绳不仅能高效减脂,还能提升身体协调性、增强心肺功能、改善骨骼健康。专家建议初学者从慢速开始,选择软硬适中的场地,避免关节损伤。这份榜单颠覆了大众对减重运动的认知,凸显跳绳的卓越效果。

  • 2025新手Vlog相机排行榜:这5款相机,让你告别复杂后期

    本文针对视频创作新手,推荐了五款Vlog相机,强调设备应操作简便、画质出色、色彩讨喜,让用户专注于内容创作。重点介绍了佳能PowerShot V1,其具备优秀直出能力、多种滤镜和美肤模式,支持5.7K超采和4K视频,自动对焦稳定,重量轻便,适合旅行、直播等场景。其他推荐包括索尼ZV-1II、富士X-S20、松下G100D和大疆Pocket 3,各有特色,如智能化、胶片模拟或稳定性能,助新手轻松开启创作之旅。

  • AI日报:月之暗面开源AI新框架Kosong;百度发布新模型ERNIE-4.5-VL;GPT-5.1“隐身”登场

    本期AI日报聚焦多项技术突破:月之暗面开源AI代理框架Kosong,支持异步编排与插件化设计;Replit推出AI集成功能,可一键调用300+模型;商汤发布空间智能模型SenseNova-SI,性能超越GPT-5;百度推出多模态模型ERNIE-4.5-VL,新增图像思考能力;谷歌地图全面AI化,集成Gemini实现智能交互;ChatTutor上线可视化教学系统,覆盖多学科实时推演;新版Google Finance引入AI深度搜索与财报追踪;OpenAI低调上线Polaris Alpha模型,支持256K上下文并更新知识库至2024年10月。

  • 微单相机排行榜:佳能R50V领衔,十款机型对比测评

    随着视频创作普及,微单相机凭借轻便机身与强大功能成为用户首选。佳能R50V以卓越视频性能及用户友好设计脱颖而出,支持6K超采4K视频与智能追焦,兼顾便携性与专业创作需求。索尼A7IV搭载全画幅传感器,富士X-T5融合经典外观与现代科技,松下S5II首次加入相位对焦系统。本文通过对比十款微单的关键参数,为读者选购提供参考,其中佳能R50V以超高性价比成为视频创作者的首选机型。

  • 2025年微单相机排行榜:十大机型深度推荐与全面解析

    本文针对微单相机选购难题,结合市场热度与性能参数,推荐十款各具特色的机型并细致对比。佳能R50V以9.9分居首,主打视频创作,支持6K超采4K录制与智能追焦,轻巧机身适合Vlog及直播;索尼A7IV(9.7分)凭借全画幅传感器与快速对焦满足专业需求;富士X-T5(9.5分)融合经典设计与胶片模拟功能。文章强调,若侧重日常记录、旅行拍摄与直播,佳能R50V以6000元价位整合便携性、专业视频规格与直出优化,是降低创作门槛的理想选择。

  • 2025高画质拍照相机排行榜:佳能领跑,轻量化与直出色彩成焦点

    本文推荐五款画质卓越的相机:佳能R50V以专业画质与创意滤镜结合,支持14种色彩模式直出;佳能R50轻便智能,适合入门用户;富士X-S20具备经典胶片模拟模式;尼康Z50操控扎实,兼容丰富镜头群;索尼ZV-E10优化人像拍摄,平衡拍照与视频功能。消费者可根据画质、色彩、便携性等需求选择最适合机型。

  • Soul App开源播客语音合成模型SoulX-Podcast,支持流畅自然多轮语音对话

    Soul App近日开源其播客语音合成模型SoulX-Podcast,专为多人多轮对话场景设计。该模型支持中、英、川、粤等多语言及方言,可生成超60分钟流畅自然、角色切换准确、韵律丰富的语音对话。除播客场景外,在通用语音合成及克隆任务中表现优异,能灵活调节节奏与副语言元素(如笑声),提升语音真实感与表现力。此次开源旨在携手开发者探索AI语音在内容创作与社交生态中的更多可能。

  • 登榜LMArena!文心大模型5.0-Preview文本能力国内第一

    11月8日,文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出,超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容;复杂长问题理解适用于学术问答、报告分析等任务;指令遵循能力支持智能助理、代码生成等场景,为多领域内容生产提供高效支撑。

今日大家都在搜的词: