实锤了，Llama 4重测排名掉至32名！远不及DeepSeek和Qwen

2025-04-13 09:26 · 稿源： TechWeb.com.cn

4月13日消息，LMArena 更新了Meta最新发布的开源大模型 Llama-4-Maverick的排名，从此前的第2名，直线掉到了第32名！

这也实锤了此前开发者对Meta为刷榜排名向LMArena提供了“特供版”的Llama 4大模型的质疑。（详情：Llama 4大模型跌落神坛：作弊刷榜、代码能力极差、和DeepSeek比就是伪开源）

4月6日，Meta发布了最新的大模型Llama 4，包含Scout、Maverick和Behemoth三个版本。其中，Llama-4-Maverick在LMArena公布的Chatbot Arena LLM 排行榜中的排名第二，仅次于Gemini 2.5 Pro。

然而，随着开发者实际使用Llama 4大模型开源版的效果陆续曝出，Llama 4口碑急转直下。有开发者发现Meta提供给LMArena的Llama 4版本与提交给社区的开源版本不同，因而Meta被质疑为刷榜作弊。

4月8日，Chatbot Arena官方发文确认了用户的上述质疑，公开表示Meta提供给他们的是“特供版”，并考虑更新排行榜。

根据Chatbot Arena官方消息，Meta首次提交LMArena的Llama-4-Maverick-03-26-Experimental是一个实验性聊天优化版本，当时该版本的排名为第二。修正后的模型为HuggingFace开源版同款Llama-4-Maverick-17B-128E-Instruct，是17B激活参数、128个MoE专家的指令微调模型。

目前，开源版同款Llama-4-Maverick-17B-128E-Instruct在LMArena的排名为32名，远低于Gemini 2.5 Pro（1）、GPT4o（2）、DeepSeek-V3-0324（5）、DeepSeek-R1（7）、Qwen2.5-Max（11），甚至连英伟达基于上一代Llama 3.3改造的Llama-3.3-Nemotron-Super-49B-v1（17）都不如。

LMArena详细排名如下：

（举报）

相关推荐

关键词：

15天快装开业，Lamett乐迈石晶地墙品类投资模式解析

贝壳研究院数据显示，2025年中国存量房装修市场规模将达3.34万亿元，消费者对健康环保、便捷高效的家装需求持续攀升。乐迈石晶作为全球石晶品类开创者，推出"100㎡开店、10余万投资、15天极速开业"轻资产模式，携手经销商掘金"新房整装+旧房改造"市场。其首创的石晶地板和石晶柜板技术，实现从地面材料向墙面、柜体等全屋空间应用的跨越，构建"地墙柜一体化"健康整装系统。凭借"零醛添加、防水防潮"等核心性能优势，石晶材料正加速替代传统建材。目前乐迈石晶在全球拥有10余家工厂及销售机构，业务遍及80多个国家和地区，为高端住宅及商业空间提供整体解决方案。

存量房装修市场健康环保家装乐迈石晶招商
荐AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-banana发布；字节开源Agent专用模型 M3-Agent-Control

本文介绍了AI领域最新动态：1)腾讯开源Hunyuan-GameCraft框架，可快速生成高质量游戏视频；2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext；3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型；4)Kimi将推出PPT生成功能；5)阿里1688将上线"诚信通AI版"会员服务；6)苹果智能家居中心推迟至2026年发布；7)万兴科技接入GPT-5；8)全球AI独角兽达498家，总估值2.7万亿美元；9)谷歌为Slides和

AI 游戏视频生成腾讯混元
八年深耕铸就“即刻精彩”，HOLLYLAND猛玛2025秋季新品发布会前瞻

猛玛将于2025年8月26日举办品牌战略暨秋季新品发布会，系统呈现其全球战略布局与技术成果。深耕无线音视频领域八年，猛玛致力于打造全球创作者信赖的“创作底座”，通过技术创新降低专业设备门槛，推动创作工具智能化与普惠化。发布会将首次系统阐释品牌使命“科技助力轻松表达，丰富人类精神世界”，并带来秋季重磅新品，展现对创作全流程需求的深入覆盖。

内容创作数字经济文化强国
荐AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测试；小红书发布DynamicFace人脸生成技术

本期AI日报聚焦多项AI领域创新：1）阿里开源Qwen-Image-Edit图像编辑模型，支持中文渲染与精准文本编辑；2）淘宝测试"AI万能搜"功能，重构电商搜索体验；3）小红书发布DynamicFace人脸生成技术，实现高质量图像视频换脸；4）Gemini API新增URL Context功能，简化网页内容获取流程；5）Nvidia推出小型开放模型Nemotron-Nano-9B-v2，支持智能推理开关；6）马斯克发布Grok Imagine 0.1测试版，进军AI图像生成领域；7）Vercel推出iOS版AI开发工具v0；8）理想汽车发布MindGPT 3.1模型，处理速度提升5倍；9）ToonComposer工具简化动画制作流程；10）ElevenLabs推出视频到音乐生成流程。

AI 开源图像编辑
Lamett乐迈石晶携手肖战共筑品牌势能，经销商信心倍增抢滩市场

欧洲高端建材品牌Lamett乐迈石晶宣布肖战成为首位全球品牌代言人，双方将共同推动"健康、安全"理念。Lamett创立于1985年，专注新型建材研发，2016年首创全球首款石晶地板，2024年又推出石晶柜板，实现从地面到全屋空间的应用突破。此次合作将助力品牌从专业领域走向大众视野，通过"全域营销+供应链布局+数字化管理"赋能经销商。目前品牌在中国设有七大直营体验中心，未来将通过"东西南北中"五大生产基地实现全链路自主把控。

肖战代言 Lamett乐迈石晶石晶全屋整装
2025年大模型选型核心指南：Beyond GPT-4，如何理性评估Qwen、DeepSeek等强者？

大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架，强调需超越单一指标崇拜，基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析，展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程，采用专业工具进行多维度评估，通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型，而非盲目追求流行模型。
OpenAI的开源模型现已在IBM watsonx.ai上提供

OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B，允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台，采用专家混合架构，支持本地或云端部署，不受商业用途限制。模型具备高透明度，输出完整推理链，在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态，IBM强调其开放战略，为企业提供灵活、安全的AI开发选择。

OpenAI模型 IBM watsonx.ai
铭凡推出N5 Pro高性能NAS主机：搭载AMD AI 9 HX 370处理器、支持144TB容量

知名迷你PC厂商MINISFORUM推出首款高性能NAS主机N5系列，包含N5和N5 Pro两款型号。N5 Pro搭载AMD锐龙AI9 HX370处理器（12核24线程/5.1GHz）和Radeon 890M核显；N5采用锐龙7H255处理器（8核16线程/4.9GHz）和780M核显。主机支持5个HDD+3个M.2硬盘（含2个U.2企业级接口），最高144TB存储容量，配备双通道DDR5内存（最高96GB）并支持ECC校验。接口方面配备2个USB4、多个USB3.2/2.0、10G/5G网口及HDMI2.1，支持PCIe4.0扩展和OCulink外接显卡。该系列兼具NAS存储与高性能计算能力，适合虚拟化、娱乐等多场景使用，N5售价3749元起，N5 Pro售价6239元起。

铭凡N5 高性能NAS 迷你PC
华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

华为在深圳以“大Mate大不同”为主题举办智慧屏新品技术发布会，正式推出旗舰新品——华为智慧屏 MateTV。这款搭载HarmonyOS5系统的智慧屏，首次配备鸿鹄Vivid独立画质芯片，并创新引入灵犀悬浮触控技术，支持双指悬浮多指操控，传输延迟低至8ms，重新定义了电视交互体验。设计方面，华为智慧屏 MateTV采用超薄机身设计，厚度仅36.9mm，配合99%屏占比实现“零贴墙”安装效

华为智慧屏 HarmonyOS5 鸿鹄Vivid芯片
从“手动挡”进入“AI智能挡”：亚数TrustAsia 开启证书管理「服务化」CaaS 新时代

随着TLS/SSL证书有效期缩短至47天，企业面临信任中断风险加剧、内部系统协同困难及预警监测缺失三大挑战。亚数TrustAsia推出新一代智能证书管理体系TrustAsia CaaS，通过自动化流程实现证书全生命周期管理，提供六大核心能力：资产发现与管理、多CA自动化签发、自动化分发部署、实时监测告警、无缝集成定制及全流程自动化，有效应对加密敏捷性需求，助力企业构建安全可信�

数字化转型 TLS/SSL证书网络安全

今日大家都在搜的词：

热文

3 天
7天

实锤了，Llama 4重测排名掉至32名！远不及DeepSeek和Qwen

15天快装开业，Lamett乐迈石晶地墙品类投资模式解析

荐AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-banana发布；字节开源Agent专用模型 M3-Agent-Control

八年深耕铸就“即刻精彩”，HOLLYLAND猛玛2025秋季新品发布会前瞻

荐AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测试；小红书发布DynamicFace人脸生成技术

Lamett乐迈石晶携手肖战共筑品牌势能，经销商信心倍增抢滩市场

2025年大模型选型核心指南：Beyond GPT-4，如何理性评估Qwen、DeepSeek等强者？

OpenAI的开源模型现已在IBM watsonx.ai上提供

铭凡推出N5 Pro高性能NAS主机：搭载AMD AI 9 HX 370处理器、支持144TB容量

华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

从“手动挡”进入“AI智能挡”：亚数TrustAsia 开启证书管理「服务化」CaaS 新时代

今日大家都在搜的词：

热文

iPhone17Pro爆料汇总：橙色版本成最大亮点或迎12项升级

vivo Y500定档9月1日发布配备8200mAh巨无霸电池

20周年版iPhone或成苹果首款曲面机：一体环绕玻璃+曲面机身

美团回应网友质疑退款未到账：已修复信息滞后每笔退款可追溯

华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

罗永浩官宣明日将公布TBT项目号称九年磨一面

《黑神话:钟馗》先导预告公布游戏科学宣布《黑神话:钟馗》官网

REDMI Note 15 Pro+首搭自研澎湃T1S芯片

AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；

罗永浩泡面1小时销售额超280万 2小时售罄：一桶近10元

黑神话官号更名系列游戏将开启宏大篇章

AI日报：智谱AI发布AutoGLM 2.0；腾讯元宝接入腾讯视频；字节发

AI日报：即梦上线智能多帧功能；可灵2.1首尾帧升级；钉钉推语音

华为nova 14系列宣布限时降价至高优惠500元

站长商机