首页 > AI头条  > 正文

清华与快手联手推出新型SVG扩散模型,训练效率暴增6200%

2025-10-29 14:35 · 来源: AIbase基地

在近期的科技界,VAE(变分自编码器)正在经历被逐步淘汰的尴尬局面,随着清华大学与快手可灵团队的合作,推出了一款名为 SVG(无 VAE 潜在扩散模型)的新型生成模型。此次创新不仅在训练效率上实现了6200% 的惊人提升,而且在生成速度上更是达到了3500% 的飞跃。

VAE 在图像生成领域的衰退,主要源于其存在的 “语义纠缠” 问题。也就是说,当我们尝试仅仅改变图像中某一特征(如猫的颜色)时,其他特征(如体型、表情)往往也会受到影响,导致生成的图像不够精准。为了解决这个问题,清华与快手的 SVG 模型采取了不同的策略,主动构建了一个融合语义与细节的特征空间。

image.png

在 SVG 模型的设计中,团队首先使用 DINOv3预训练模型作为语义提取器,该模型经过大规模的自监督学习,能够有效识别和分离不同类别的特征,解决了传统 VAE 模型中的语义混乱。此外,为了补充细节,团队还特别设计了一个轻量级的残差编码器,确保细节信息不会与语义特征相冲突。关键的分布对齐机制则进一步增强了这两种特征的融合,保证了生成图像的高质量。

image.png

实验结果表明,SVG 模型在生成质量和多任务通用性方面,全面超越了传统的 VAE 方案。在 ImageNet 数据集上,SVG 模型在仅训练80个周期时,FID 值(衡量生成图像与真实图像相似度的指标)达到6.57,远超同规模的 VAE 模型;而在推理效率上,SVG 模型也显示出卓越的性能,在较少的采样步骤下即可生成清晰图像。此外,SVG 模型的特征空间还可直接用于图像分类、语义分割等多种视觉任务,无需额外微调,大大提高了应用的灵活性。

清华与快手的这一新技术不仅为图像生成领域带来了革命性的变化,更有望在多模态生成任务中展现出强大的潜力。

论文地址:https://arxiv.org/pdf/2510.15301

  • 相关推荐
  • 活力新农人,共创新未来!2025快手三农生态大会即将在贵州乌江寨启幕​​

    2025快手三农生态大会将于10月30日在贵州遵义乌江寨举办,以"活力新农人,共创新未来"为主题。大会由贵州省农业农村厅指导、快手三农主办,汇聚数百名扎根乡村的新农人代表,探讨数字时代三农发展新趋势。活动设置主论坛分享、达人带逛及线上直播,快手创作者@西北刀客-公益护农与@村花赵老婆子将现场讲述公益助农与乡村生活故事。同期发布《2025快手三农生态数据报告》,展现数字技术赋能乡村振兴的实践。大会通过线上线下联动,打造沉浸式三农盛宴,致敬新农人活力与乡村价值。

  • 快手进军AI Coding,开发工具、模型和Maas平台齐登场

    10月23日,快手StreamLake发布全新AI编程产品矩阵,以“工具+模型+平台”三位一体战略布局AI Coding领域。核心产品包括智能开发助手CodeFlicker、自研高性能编码模型KAT-Coder系列及企业级服务平台快手万擎。CodeFlicker提供全流程开发支持,KAT-Coder在权威测试中性能超越GPT-5,平台保障99.95%服务可用性。该生态旨在通过技术普惠,为企业与开发者提供颠覆性研发体验,推动AI编程普及。

  • 家庭主妇体验多面人生,快手星芒短剧《十二天》即将奇幻来袭

    快手短剧《十二天》将于10月28日独播,讲述家庭主妇因爆炸事故陷入时间循环,每天醒来随机变换身份(如老人、少年等),被迫体验不同人生。通过奇幻设定探讨房贷、育儿、婚姻等现实议题,展现女性意识觉醒与自我追寻。王真儿领衔主演,以“新身份解决新难题”单元结构激发观剧兴趣,结合京东家电植入呈现生活日常。该剧以轻奇幻手法反思现实,提供情感疗愈指南。

  • “秦声万里·益暖人心”,快手“益起携手”公益行动为银龄群体送上秋日温暖

    2025年重阳节期间,快手公益联合多方在陕西延安冯庄村举办“秦声万里·益暖人心”公益活动,为当地敬老院捐赠价值10万元的过冬棉服、粮油、辅助器具及演出道具等物资,并带来秦腔公益演出。活动整合平台内外资源,精准帮扶老年群体,通过线上线下联动传递敬老爱老传统美德。快手“益起携手”公益行动持续关注老幼群体,探索数字时代公益新模式,让科技更具温度与

  • 鸿蒙智行:全新问界M7上市36天交付破20000台

    鸿蒙智行全新问界M7自9月23日上市以来表现强劲:起售价27.98万元,24小时订单破4万台,国庆假期收获1.5万大定。上市21天交付量超1万台,36天突破2万台。11月将启动产能爬坡,月产能提升至2-3万台。针对购置税政策疑虑,推出跨年补贴方案,最高补1.5万元。产品全面升级:轴距加长210mm至3030mm,搭载16.1英寸3K中控屏、零重力座椅、后排娱乐屏等配置。底盘采用全铝合金前双叉臂+后五连杆,配备空气悬架与CDC减震器。全系搭载华为乾崑ADS 4.0辅助驾驶系统,Pro版首发舱内激光视觉,提升主动安全能力。

  • 宋木子上演职场现形记,快手星芒短剧《打工吧长官》爆笑来袭

    《打工吧长官》10月25日快手独播,宋木子领衔主演。该剧以24集篇幅呈现职场荒诞生态,通过外星人误当创意总监的错位设定,讽刺职场伪精英文化。剧情融合"00后整顿职场""打工人逆袭"等热点话题,以"水油平衡"式幽默解构职场痛点,堪称职场版《皇帝的新衣》。京东百亿补贴同步联动,为观众提供现实共鸣与消费体验。

  • 王凯沐与张楚萱领衔主演,快手星芒短剧《偏宠小疯妻》锁定浪漫

    都市爱情短剧《偏宠小疯妻》定档10月24日快手独播。该剧由王凯沬、张楚蕊主演,讲述霸总梁景随与曾被诬陷送入精神病院的善良女孩季时微闪婚后,两人从契约婚姻走向真爱的故事。剧中他们智斗宿敌、揭开家族阴谋,最终收获事业与爱情双丰收。本剧由京东冠名,快手与好有本领联合出品,以精品化制作探索爱情成长主题,展现双向奔赴的浪漫叙事。

  • 年轻人DIY服装200元做出大牌同款 网友:真正的私人高定

    在商场里一件标价上千元的连衣裙,如今年轻人只需花200元就能自制出同款,这样的“价格差”正吸引着越来越多年轻人走进布料市场,亲手开启DIY服装的潮流。近日,这一现象在网络和现实中引发广泛关注。 自制服装不仅能省钱,还能满足年轻人对独特风格的追求。有年轻人表示,自己做衣服能获得独一无二的风格,绝对不会跟别人重样,这才是真正的私人高定。同时,一

  • 快手举办“1024程序员节”活动 程一笑称AI应用是未来竞争的关键

    快手在“1024程序员节”活动中强调,AI技术应用是未来竞争关键。活动展示了多项AI创新成果,包括可灵AI模型升级、电商搜索框架OneSearch、AI编程工具CodeFlicker及直播礼物生成应用。快手创始人程一笑指出,AI需与具体场景深度结合,推动业务效率提升。目前超80%程序员高频使用AI工具,技术应用已覆盖直播、电商等领域,带动平台价值重估。

  • 更新功能、内测新App,抖音快手再战社交

    ​抖音和快手又一次向社交领域发起进攻。 近日,抖音、快手在站内密集更新了“日常”“说说”等一系列社交新功能;此外,抖音还被曝正在内测全新的社交App。 当流量增长触及天花板,内容的稀缺性逐渐变弱,社交似乎成为了短视频巨头的“新叙事”。 它们为何始终对“社交”念念不忘?这究竟是构筑护城河的必然选择,还是一场注定艰难的豪赌?

今日大家都在搜的词: