首页 > 业界 > 关键词  > Mamba最新资讯  > 正文

Mamba架构遭同行评审质疑,LeCun自曝类似经历

2024-01-26 16:27 · 稿源:站长之家

要点:

  • Mamba架构论文,去年底发布,挑战Transformer,但在ICLR2024同行评审中得到低分,可能被拒收。

  • LeCun自曝类似经历,指出自己曾有类似经历,即使成就显著的论文也可能被顶会拒收。

  • 审稿人给出低分的理由,主要集中在对Mamba模型设计和实验的质疑,作者进行rebuttal但未得到重视。

站长之家(ChinaZ.com)1月26日 消息:近期,Mamba架构论文因在ICLR2024评审中得到低分而引起关注。该架构去年底由CMU和普林斯顿的研究者提出,被认为有颠覆Transformer的潜力。然而,ICLR评审中,有一位审稿人给出3分的低分,引发疑虑。LeCun也跃出来分享自己类似的遭遇,指出即便成就显著的论文也可能被拒收。这一事件引起了学术界的不满和质疑。

image.png

论文地址:https://arxiv.org/pdf/2312.00752.pdf

审稿人给出低分的理由主要涉及对Mamba模型设计和实验的质疑。其中,审稿人提到Mamba的设计动机,质疑其在与其他模型的比较中的性能表现。作者在rebuttal中指出,他们的重点是大规模预训练的复杂性,而Mamba在Wikitext-103上的表现明显优于其他模型。审稿人还对Mamba是否具有长度泛化能力提出了质疑。对此,作者回应称他们在长序列方面进行了实验,但这些回应未能得到审稿人的认同。

LeCun回忆了自己的类似经历,表示即便拥有引用超过1880次的论文,也曾被拒收。这凸显了同行评审体系的不确定性和主观性。虽然Mamba架构在学术界产生了深刻影响,但遭遇评审的波折,使得学术界对同行评审的公正性产生质疑。此外,审稿人在rebuttal中提出的问题,虽然作者进行了解答,但最终未能改变审稿人的评分,加剧了学术界对同行评审的不满。

整个过程显示,学术界对于同行评审制度的信任程度在下降。有人认为,Mamba获得3分的低分是业界的笑话。这一事件或许需要学术界进一步探讨和改进同行评审制度,以确保更公正、客观的评价,避免因为主观因素而损害具有潜力的研究。在这个过程中,LeCun的经历成为引发讨论的契机,引导学术界关注同行评审制度的合理性和公正性。

举报

  • 相关推荐
  • 李福贵自曝19岁结婚一年后分开:婚姻经历让我决心改变家庭

    ​近日,一位来自河南新乡的27岁乡村卖货女孩李福贵(本名李亚云)因走村卖货在网络上迅速走红,吸粉超过600万。她在接受媒体采访时,勇敢自曝了自己19岁时的婚姻往事,引发了广泛关注和热议。 李福贵坦言,自己出身于一个原生家庭并不幸福的背景,父母均有智力残疾,父亲智力水平相当于10岁孩童,母亲则停留在2岁水平,生活无法自理。家中还有年迈的爷爷需要照�

  • 小米YU7进行了一次24小时耐力挑战 雷军:只有奔驰保时捷做过类似的挑战

    小米创办人雷军发文表示,小米YU7发布前做了一个夸张的挑战24小时耐力挑战。 其挑战内容是,小米YU7连续跑24小时,含充电时间,换人不换车,车能不能跑下来?能跑多少公里? 听起来似乎没啥,实际上是对整车动力、充电、耐久和可靠等全方面的残酷测试,相当于用短跑的速度跑马拉松”,对于电动车而言更是巨大的考验。 在此之前,只有奔驰和保时捷用电动车做了类�

  • BBA开启驾驶培训 雷军:小米愿和同行一起推动中国汽车文化普及

    近日,汽车界掀起一阵驾驶培训热潮,奔驰、奥迪、宝马这三大传统豪华汽车品牌纷纷宣布开启精英驾驶培训项目。 在这场汽车行业的培训风潮中,新入局的小米汽车也不甘示弱,推出了高阶驾驶培训。 小米计划在全国10多座城市,免费为一万名车主提供培训服务,旨在提升车主的安全意识和控车能力。 从目前的进展来看,北京的车主培训已顺利完成,成都的报名工作也已

  • 载誉启新程|TCL光伏科技SNEC 2025圆满收官,感恩同行

    TCL光伏科技在SNEC2025展会上以"碳索新境+智领未来"为主题,展示了五大创新成果:1)推出商用"特能"系列产品矩阵,为不同场景定制绿色能源方案;2)发布户用"整村汇流"模式,实现从单户到规模化落地闭环;3)针对东南亚市场推出"一站式户用能源方案",欧洲市场开发"光储充"综合方案;4)以AI技术赋能光伏电站全生命周期管理;5)创新电碳业务打通绿电生产-交易-普惠开发全链路。展会期间斩获APVIA亚洲光伏奖等三大权威奖项,吸引数万观众参观,达成超百项合作意向。通过线上线下联动传播,单平台观看量超2万人次,充分展现其在光伏领域的技术创新实力与全球化布局。

  • 柠檬疯涨似黄金:一天一个价

    微博话题柠檬疯涨似黄金”引发关注。 据媒体报道,有柠檬供应商称,安岳黄柠檬的单价涨至7.5-10元/斤,单箱价格飙至200元/箱,较低价时翻了近乎三倍。 为此,有茶饮加盟商感叹,黄柠檬的价格跟黄金似的一天一个价。据了解,黄柠檬价格上涨的主要原因是源头产量少,市场供不应求导致。 尽管黄柠檬价格上涨,但茶饮品牌加盟商不会轻易涨价,因为柠檬水是茶饮门店的

  • 当同行节衣缩食时,西贝为何敢在食材与服务上“不计成本”?

    西贝餐饮在行业普遍控制成本的背景下,坚持"节衣缩食实现不了高质量的生存和发展"的理念。其核心竞争力体现在:1)食材源头投入,如在内蒙建专属牧场,羊肉采购成本比普通品牌高30%;2)服务培训体系严格,新员工需接受12页手册培训,成本远超行业水平;3)供应链数字化建设,投入数亿元实现从牧场到餐桌72小时保鲜;4)持续创新,每年投入营收3%研发新品。这种"把钱花在刀刃上"的策略,形成了难以复制的品质壁垒,让顾客为"值得"的体验买单。

  • 孤品也在跌!拍出51万的Labubu 12天后同款落槌遭“腰斩”

    前两周薄荷色Labubu”以108万元的天价落槌,随后Labubu的拍卖纪录不断刷新。 6月22日晚,Labubu x衡山宏机甲飞行员”成交价为75.9万元,创下该IP联名款全球纪录。 但值得注意的是,拍卖过程中的Labubu不仅过度溢价”,其拍卖价格也出现剧烈波动。

  • 行业首个!海尔智家ESG实践成复旦MBA研究课题

    6月17日,复旦MBA iLab项目举行终期汇报,28个项目涵盖科创管理、ESG等四大领域。海尔智家作为家电行业首个入选案例,其ESG实践获师生高度评价。海尔通过绿色产品创新、全球公益联动和投资者沟通等举措,连续四年稳居《财富》中国ESG影响力行业榜首。未来,海尔将持续深化ESG战略,推动行业可持续发展。

  • AI日报:MiniMax-M1开源;阿里Qwen3升级版适配苹果MLX架构;月之暗面发布新模型Kimi-Dev-72B

    《AI日报》汇总了近期AI领域多项重要进展:1)月之暗面推出开源编程模型Kimi-Dev-72B,在软件工程任务测试中创下新纪录;2)MiniMax开源M1模型,支持超长上下文推理且训练成本低;3)腾讯发布AI音乐模型LeVo,支持音色克隆和分轨生成;4)阿里云Qwen3升级版适配苹果MLX架构;5)豆包推出"AI播客"功能,可将PDF转为对话播客;6)夸克App上线个性化AI家教"夸克老师";7)松下发布多模态大模型OmniFlow,实现文本/图像/音频自由切换;8)TikTok推出三款AI视频创作工具;9)极氪与火山引擎合作,将豆包大模型接入智能座舱系统;10)Meta的Llama3.1模型在文本记忆方面表现突出;11)Grok上线定时追踪X热门话题功能;12)Gemini2.5Pro即将更新Deep Think功能;13)谷歌地图引入AI技术升级导航和个性化推荐功能。

  • 荣获“CIO 信赖品牌”奖项,MAXHUB 赋能企业数字化转型

    2025年5月28日,第十一届全国CIO大会在西安召开,聚焦"AI+数据赋能业务场景"主题。MAXHUB在会上展示了AI会议解决方案2.0,通过硬件+软件升级,实现会议全流程智能化管理,包括自动预约、精准语音转写(准确率最高达95%)、5秒生成图文纪要等功能。同时推出全新AI+电脑,采用创新架构确保AI运算性能,集成智能搜索等办公功能。数据显示,国内84%企业已应用AI技术,13%进入全面应用阶段。MAXHUB深耕企业数字化领域,连续四年获"CIO信赖品牌"奖,致力于通过AI技术提升会议效率和决策质量,推动企业数字化转型。