首页 > AI头条  > 正文

推特争论引发学术新发现!谢赛宁团队发布 iREPA,仅需 3 行代码!

2025-12-17 11:48 · 来源: AIbase基地

最近,谢赛宁团队的新作 “iREPA” 便是源于一场持续了四个月的推特辩论。这场论战虽以谢赛宁的让步为结局,却意外催生了一篇重要论文,展示了新颖的研究思路。

事件的起源可以追溯到八月份。当时,一位网友在推特上提出了关于自监督学习(SSL)模型的看法,认为它们应该专注于稠密任务,因为这些任务依赖于图像的空间和局部信息,而不仅仅是全局分类性能。谢赛宁对此提出了反驳,认为全局性能与稠密任务并没有直接关系。

网友们展开了热烈的讨论,其中一位网友还分享了可以与 REPA 进行比较的方案。这个讨论激发了谢赛宁的兴趣,并促使他深入探索这一问题。几个月后,谢赛宁表示,自己之前的看法被修正,并且这篇论文的研究为理解视觉编码器的生成能力提供了新视角。

在这篇论文中,研究者们探讨了在预训练视觉编码器中,究竟是哪些部分决定了生成模型的表现。结果显示,空间结构的信息,而非全局语义,才是驱动生成质量的关键因素。传统观点认为更好的全局语义信息能提升生成效果,但研究表明,实际上较低准确率的视觉编码器往往能实现更好的生成性能。

为了解决这一问题,研究者们提出了 iREPA,这一新框架仅需三行代码即可整合到任何表示对齐方法中。通过对 PA 的改,如用卷层替换传统的 MLP 投影层,研究者们成功强化了空间结构信息,显著提升了生成性能。

这次学术讨论不仅展示了开放和的科研氛,更强调了通过交流和实验获取知识的重要性。


  • 相关推荐
  • TRAE发布首份年度产品报告:2025年共计生成1000亿行代码、5 亿条Query

    字节跳动旗下AI编程工具TRAE发布2025年度产品报告。报告显示,2025年AI编程从技术创新走向实际应用,深刻变革开发者生产场景。行业需求已从单点高效的代码补全,升级为全流程、自驱动的Agent开发模式。TRAE用户规模持续增长,总注册用户超600万,覆盖全球近200个国家和地区。产品年内完成超100次迭代,推出SOLO模式及企业版,智能代码补全功能Cue实现关键技术突破。用户使用粘性不断增强,与AI协作深入,共同生成近1000亿行代码。TRAE在多项国际评测中达到第一,并持续产出前沿学术研究成果。

  • 大眼橙品牌分享暨新品发布会官宣,1月13日直播引发期待

    1月13日晚,大眼橙将举办品牌分享暨新品发布会,主题为“新征程”。届时将回顾品牌2025年发展,并展望2026年新品布局。作为1LCD投影赛道领军者,大眼橙成立九年来专注智能投影领域,以技术创新和用户需求为核心,实现了从行业黑马到市场引领者的蜕变。本次发布会将深度解读品牌崛起背后的关键决策,并揭晓2026年产品蓝图,值得期待。

  • 嘲笑同事的奖牌破结果发现是纯金的:暗藏6万价值

    近日,浙江温州冠盛汽车零部件集团因一枚“其貌不扬”的奖牌引发全网关注。在该公司年会上,数十名工龄满20年的老员工获颁纪念奖牌,其外观简约甚至被部分同事调侃“破旧”。 然而,随着奖牌材质真相浮出水面——这块直径50毫米、重2盎司(约62.2克)的奖牌实为99.9%纯金打造,按2026年1月8日金价计算单枚价值超6万元,事件迅速演变为一场“嘲笑变社死”的职场乌龙。

  • 红魔11 Air官宣将于1月20日发布

    红魔游戏手机官方宣布,新一代电竞旗舰红魔11Air将于1月20日全球首发。该机采用真全面屏形态,通过屏下摄像头技术实现无开孔完整屏幕,标志着游戏手机进入“无界视觉”时代。散热系统延续标志性设计,内置高转速离心风扇与完整风道结构,通过每秒数十次冷热空气交换形成强制对流,可快速导出主板区域热量。核心配置方面,红魔11Air搭载6.85英寸1.5K分辨率直屏,支持144Hz高刷新率与DC调光技术。内置7000mAh硅碳负极电池,配备100W快充方案,兼顾续航与充电效率。影像系统采用1600万像素前置屏下摄像头,后置5000万像素主摄+800万像素超广角双摄组合,满足日常拍摄需求。

  • REDMI Pad 2 Pro系列本月发布:120Hz高刷LCD屏+骁龙7s Gen4

    REDMI Turbo 5系列已经官宣本月发布,预计会在联发科天玑9500s发布会上正式公布发布会时间。 值得注意的是,这次除了手机之外,还会有REDMI平板产品线更新。 据博主体验more”透露,这次REDMI Pad 2 Pro和REDMI Pad 2 Pro 5G也会登场。

  • 网友深夜代娃写作业引发家长集体共鸣:老师喊话失去诊断意义

    期末临近,多地家长集体发声,孩子作业过多到天天熬夜至深夜10点后,这样的行为引发了网友的热议。 家长一边代笔,一边还得做旧”作业,揉纸团、撕边角、模仿字迹,生怕被老师识破。有人苦笑:手累心更累。 一边是心疼孩子睡眠的爸妈,另一边是着急喊停的老师。杭州多位教师明确喊话:家长别帮忙!代写会掩盖真实学情,让作业失去诊断意义。 之前,教育部联合

  • 2026淘宝天猫年货节开启:淘宝天猫2026年货节京东超级红包口令最新发布更新怎么领取淘宝天猫红包

    2026年淘宝天猫年货节将于1月19日10:00开始,持续至1月31日23:59。活动期间,用户每天可通过淘宝APP搜索“天降红包393”进入活动页面,领取最高26888元超级红包,并可叠加官方立减、补贴优惠券等,用于购买家电、数码、年货、服饰等商品。此外,搜索“红包好运来”可参与购物车优惠活动。京东年货节红包口令为京东搜“红包2000”、“福333”、“福800”。

  • 马斯克:X平台将于七天内开源算法 后续每四周更新一次代码

    马斯克宣布X平台将在七天内开源其新版算法,包含推荐帖文和广告的代码,并每四周更新一次。此举被视为重启算法透明化承诺,但未说明具体原因。此前X因内容审核问题与监管机构冲突,欧洲审查尤其严格,法国曾要求其共享算法内容但遭拒。

  • 微信团队优化微信占用问题:带来3大举措

    如今各种APP占用空间越来越大,尤其是日常必备的微信,可以说是吃空间大户”,一些128G甚至256G的手机用户都忍不住抱怨:手机空间基本不够用啊。 微信员工客村小蒋发文表示,微信产品开发团队对关于微信占空间的误解做了一次比较集中的沟通。很多用户面临的微信占空间问题的根源是聊天记录,大盘数据显示,微信占空间在40GB以上的重度用户,聊天记录平均占比超过70%

  • 信通院星河案例|AI 智能体 + 低代码破解西医开中药难题

    12月18日,2025数据资产管理大会在北京盛大召开,备受瞩目的2025数据智能“星河(Galaxy)”案例在活动现场重磅发布!葡萄城与浙江省肿瘤医院、杭州腾晨科技联合申报的“基于AI大模型实现医院中药协定方合理用药的应用实践”项目,成功入选“智能体专项”典型案例。权威认可,树立“低代码+智能体”实践新标杆 自2017年起,中国通信标准化协会大数据技术标准推进委员会�

今日大家都在搜的词: