首页 > AI头条  > 正文

指标惊艳却遭社区声讨?MiniMax新旗舰模型M3 引发两极分化争议

2026-06-03 08:57 · 来源: AIbase基地

大模型赛道再掀波澜。AI初创公司MiniMax日前正式发布了全新旗舰大模型M3。从技术报告披露的各项基准测试(Benchmark)来看,该模型的性能表现堪称惊艳:在公认接近真实软件工程场景的测试中,M3取得了59%的优异成绩,不仅超越了GPT-5.5,更是直逼Opus4.7。此外,它还具备百万级上下文处理能力和原生多模态特性。然而,与强劲技术指标形成鲜明对比的是,该模型发布后引发了开发者社区的剧烈反弹,中文社区更是骂声一片。

引发业内质疑的第一个核心焦点在于评测数据背后的“心机”。技术细则显示,M3在 Coding(代码)能力的相关测试中,使用了竞争对手的Claude Code作为评测脚手架。尽管在当前行业中,利用现成工具链跑智能体(Agent)评测属于常见操作,但MiniMax用他人的框架测自己的能力,并直接拿高分与对方比肩进行对外宣传,这种做法被不少程序员吐槽“不够坦荡”。用户难以分辨最终的亮眼成绩中,究竟有多少成分是模型的原生能力,有多少是脚手架的加成。

image.png

其次,关于“开源”的诚意问题也让开源社区充满困惑。与其他厂商发布开源模型不同,MiniMax此次不仅没有公开M3的模型大小,更没有同步释出模型“权重”,仅表示将在发布后10天内开源,目前用户只能通过API进行访问。由于开源社区的核心价值在于“可复现与可验证”,这种先宣传开源却不给权重、让所有人无法在本地环境独立摸清模型底细的做法,在商业逻辑上虽可理解,却严重伤害了追求务实与坦诚的开发者群体。

image.png

最让重度老用户感到“背刺”的,则是计费规则(Coding Plan)的无预告调整。此前,MiniMax因按请求次数限制速率、不设月度Token总量上限而被称为“量大管饱”。但随着M3的发布,官方同步推出了全新的Token Plan,将规则改为了总量计费。尽管官方宣称Plus套餐的Token用量极具性价比,但在百万上下文的重度使用场景下,单次调用往往消耗巨大,新规则会导致套餐额度迅速见底,从而引发了老用户的集体声讨。

抛开这些运营上的争议,M3在底层架构上的创新依然不乏亮点。它自研了名为MSA(MiniMax Sparse Attention)的稀疏注意力机制,通过对KV(Key-Value)进行高精度分块和稀疏化处理,突破了传统Transformer在长上下文计算中计算量暴涨的魔咒。在底层算子层面,该模型首创了全新的计算聚合方式,内存访问更加连续,速度比开源的Flash-Sparse-Attention快4倍以上。这使得M3在百万上下文下的前向传播和解码速度分别提升了9倍和15倍,单Token计算量骤降至上一代的二分之一。

从纯技术路线来看,M3在长上下文、多模态和智能体能力上的均衡度在国内厂商中较为突出。然而,本次由于发布和运营方式上的一系列“骚操作”,让技术本身的闪光点被社区的争议声所掩盖。市场对M3的密切关注与情绪反弹,表明开发者对该产品仍抱有期待,而MiniMax能否重新赢回社区的信任,答案或许要在10天后模型权重正式放出来、接受独立评测后才能揭晓。

  • 相关推荐
  • 京东云率先上线MiniMax M3:显著提升模型推理吞吐

    MiniMax M3正式上线,京东云JoyBuilder模型开发平台已第一时间接入MiniMax M3模型并同步开放服务。 依托京东云自研推理框架,JoyBuilder采用了PD分离部署、KV Cache缓存、投机采样等先进推理优化技术,显著提升了模型推理吞吐量与响应效率。 MiniMax M3在编程、智能体等专业任务上达到了前沿水平。其采用全新的MiniMax稀疏注意力架构(MSA),最高支持100万token的超长上下文。作为一款�

  • AI日报:MiniMax发布M3 大模型;英伟达物理大模型Cosmos3发布;小红书已治理超120万个AI托管账号

    今日AI领域动态丰富:MiniMax发布M3+大模型,首创MSA架构并支持1M上下文,全面开源对标海外旗舰;英伟达联合行业巨头发布全球首款全开源全模态物理AI大模型Cosmos3,成立宇宙联盟;千问APP六一期间礼品选购咨询量增长260%,展现AI购物潜力;小红书治理超120万AI托管账号,处置18万篇AI造假笔记;抖音4月新增AI短剧超4.4万部,但爆款率仅0.6%;胡彦斌上线粉丝社区应用“彦火”,展示Vibe Coding潜力;LobsterAI推出图片视频大模型矩阵,整合四大主流模型;OpenAI重启机器人业务,奥特曼公开招募工程师,拓展具身智能布局。

  • Anthropic正式发布两款Mythos级旗舰模型:可将药物研发效率提升十倍!

    日前,Anthropic正式发布了两款旗舰级大模型Claude Fable 5与Claude Mythos 5。二者定位分野明确:前者面向公众开放,后者定向服务于网络安全、生物科研等专业领域。 其中,Mythos 5聚焦生命科学突破。该模型可将药物研发流程的效率提升十倍,并能独立完成蛋白质设计工作,在多个靶点研究中均输出优质候选方案。 在分子生物学与基因组学领域,Mythos 5可自主执行长时间科研任务�

  • 谷歌推出Gemini Go:2GB内存手机也能跑大模型

    谷歌为Android Go系统推出全新Gemini Go AI助手,专为内存超2GB的低配设备设计。该精简版大模型取代Google Assistant Go,用户无需下载独立应用,长按Home键或电源键即可唤醒。它支持拨打电话、发短信、查询地图、搜索餐厅、设置闹钟等日常功能,还能上传文档和照片以提供更自然的对话体验。目前,Gemini Go已开始分阶段向符合条件的设备推送。

  • 2026世界杯上演科技对决,海信RGB-Mini LED成赛场亮眼名片

    2026年美加墨世界杯开幕,官方将智能传感、AI转播、高清传输等前沿科技全面应用,打造名副其实的“科技世界杯”。海信作为官方电视及VAR显示技术合作伙伴,以RGB-Mini LED技术深度嵌入赛事核心系统,在IBC国际转播中心与VAR裁判中心成为专用显示设备。该技术采用三原色直出光源,配合精细分区控光与AI画质算法,实现像素级光色同控,突破光晕、偏色等行业难题,带来色彩准、层次多、亮度高的原生真彩体验。同时,硬件级低蓝光降低42%有害蓝光,节能30%以上,为用户提供舒适护眼、绿色节能的观赛体验。海信凭借全产业链自主优势,率先实现RGB-Mini LED规模化量产,技术代际领先日韩品牌一代,并将专业级显示能力落地全系终端,满足全球用户全场景需求,让亿万球迷在家也能享受赛场同款真彩盛宴。

  • 苹果MacBook Ultra首发全新OLED:Mini-LED落幕

    苹果即将推出品牌史上定位最高端的笔记本新品MacBook Ultra,这款全新设备将首发搭载定制的双层OLED屏幕。 现在市面上在售的MacBook Pro采用的还是Mini-LED屏幕,这类屏幕依然需要配套独立的背光模组,对比度、黑色纯净度始终存在物理层面的上限。 这次应用的双层串联OLED拥有完全自发光的核心特性,它在传统单层OLED面板基础上额外添加了一层独立的有机发光层,原本单层OLED�

  • 开发者、AIGC工作室的AI生产力神器?智微AI Mini工作站W638深度解析

    随着AI Agent和Agentic AI发展,大模型推理向端侧迁移,但云端部署面临算力成本高、实时性差、数据隐私安全等挑战。智微智能推出AI Mini工作站W638,搭载NVIDIA Jetson AGX Thor模组,提供高达2070 TFLOPS算力、128GB统一内存和2TB NVMe SSD存储,支持本地大模型部署。W638面向AI开发者、AIGC创意工作者和企业智能体用户,实现低延迟、零Token成本、高隐私的AI应用,具备工业级散热和低噪音设计。

  • 618百吋电视怎么选?海信稳居第一,RGB-Mini LED成选购风向标

    随着家装和影音需求升级,百吋大屏电视正从高端走向大众,成为618家电换新热门。海信凭借RGB-Mini LED技术领先市场,其98吋及以上电视销售额占比达27.4%,位居行业第一。技术下放产品小墨E5S Pro实现100% BT.2020色域覆盖、低蓝光护眼和节能30%,并搭载AI智能观赛功能,支持多屏同看和直播回看。物流方面,海信联合菜鸟、京东提供送装一体服务,入户成功率超95%,实现次日即可使用。618期间,海信百吋电视以技术普惠和优质体验,重新定义大屏消费标准。

  • 看世界杯首选裁判级画质!马宁、傅明成为海信RGB-Mini LED电视超级用户

    2026年美加墨世界杯临近,海信RGB-Mini LED电视获专业认可:主裁判马宁和VAR裁判傅明成为其超级用户。作为VAR显示技术官方合作伙伴,海信凭借原生色彩、高亮度和AI画质芯片,为裁判提供精准判罚支持。其电视实现110% BT.2020色域、低功耗和护眼功能,并将“裁判级画质”从赛场带入家庭,让球迷以专业视角见证每个精彩瞬间。

  • 懂行的玩家怎么选?RGB Mini LED 电视推荐之东芝 R700 核心技术拆解

    东芝REGZA R700电视搭载原色RGB Mini LED技术,通过专芯调校实现100% BT.2020色域和潘通双认证,解决画面发灰问题。其音画双芯架构配备BRα AI音质芯片和火箭炮SOUND系统,实现113W峰值功率的5.1.2立体声场。支持4K 180Hz原生高刷(最高HSR 330Hz)、AI场景感知和本地影音管理功能,配合黑曜屏抗反光设计,为影音游戏用户提供一步到位的旗舰选择。

今日大家都在搜的词: