首页 > 业界 > 关键词  > ViViD最新资讯  > 正文

阿里中科大合推虚拟试衣技术ViViD 轻松实现视频换衣

2024-05-31 09:47 · 稿源:站长之家

站长之家(ChinaZ.com) 5月31日 消息:阿里巴巴与中国科学技术大学联手推出了一款名为ViViD的新框架,旨在革新虚拟试衣体验。ViViD基于先进的扩散模型技术,能够实现视频中人物衣物的实时替换,从而生成自然且逼真的视频效果。

image.png

ViViD的推出解决了以往视频试衣中难以保持时间一致性和图像质量的难题。它由三大核心组件构成:服装编码器、姿势编码器以及时间模块。这些组件协同工作,不仅可以精确提取衣物细节的语义特征,还能对人物姿势进行编码,并确保整个视频在时间线上的连贯性。

为了进一步提升试衣效果,研究团队还引入了一种创新的注意力特征融合机制。这种机制优化了衣物语义信息的整合过程,使得最终呈现的试衣效果更加贴合用户的多样化需求。无论是上半身、下半身还是连衣裙等不同类型的服装,ViViD都能够轻松应对,展现出其强大的适应性。

视频来自官方项目页

在实验测试中,ViViD展现出了令人瞩目的性能。与其他现有方法相比,它在视觉质量、时间一致性以及细节保持方面都取得了显著优势。实际演示中,用户可以选择单独更换上衣或裤子,或者同时替换两者,这种灵活的选择极大地丰富了用户体验。

为了全面评估ViViD的性能,阿里和中科大的研究团队投入了大量资源构建了一个专门的数据集,命名为ViViD数据集。这个数据集包含了高达9700个服装视频对,分辨率高达832×624,是目前公开数据中规模最大、多样性最高且分辨率最清晰的视频虚拟试衣数据集。

ViViD的问世不仅是人工智能领域的一项技术突破,更是虚拟试衣技术迈向实用化的重要一步。随着这一新框架的推广和应用,未来消费者在线上购物时将能享受到更加便捷、直观的试衣新体验,为零售商和电商企业带来新的增长机遇。

项目页:https://top.aibase.com/tool/vivid

论文地址:https://arxiv.org/pdf/2405.11794

举报

  • 相关推荐
  • 菁彩Vivid搭载车量超百万,携手车企迎来车载应用新里程碑!

    2025年11月5日,世界超高清视频产业联盟在深圳举办UWA+峰会,宣布中国自主三维音频标准“菁彩声”(Audio Vivid)车载应用装机量突破100万台。该标准基于AI技术,支持7阶HOA渲染与128轨实时处理,解码延迟低于80ms,实现三维空间精准定位与“黄金听音位”个性化体验。已覆盖鸿蒙智行、奇瑞等十余家车企29款车型,获IEC国际标准认证,与Dolby AC-4等并列全球四大三维音频标准。通过构建“标准-内容-终端”生态,推动中国音频产业从技术领先迈向市场引领。

  • 菁彩Vivid影院技术新标准发布,国产自研影音技术再升级

    在高质量观影与产业发展需求驱动下,中国电影科研所联合行业机构研发"菁彩影院技术",制定LED影院图像发行母版与音频处理器两项技术标准。该技术融合自主创新的菁彩Vivid技术与国际标准,实现高亮度、高动态范围等优质画面效果,支持沉浸式音频处理。目前全国已部署约180块LED电影屏,相关影片正式上映,标志着我国在高格式电影技术领域取得突破,为国产技术国际化提供支撑。

  • 平安云原生AI算力资源调度平台,荣获IDC “AI-就绪数字基础设施领军者优秀奖”

    近日,IDC公布2025年中国未来企业大奖获奖名单,平安科技打造的《云原生AI算力资源调度平台》创新项目荣获“AI就绪数字基础设施领军者优秀奖”。该平台通过统一资源池化管理、动态调度及GPU虚拟化等技术,显著提升资源利用率约30%,降低运营成本,并支持金融级高可用与弹性伸缩,助力企业高效应对AI推理与训练场景需求,体现了平安在AI基础设施构建与产业赋能方面的技术实力与国际认可。

  • Vidda 火星基地亮剑:C5 领衔四件套,改写影音产品性能规则

    Vidda在AWE展会发布多款创新产品:C5无界Master投影仪搭载SST架构DMD芯片、双激光器和122mm影院级镜头,实现6800CVIA高亮度和精准色彩;发现X2026电视采用"墨晶屏"技术,解决强光反光问题;同时推出V11开放式耳机与G11智能眼镜,以轻量化设计提升佩戴体验。整场发布会通过实机拆解和极限测试,展现品牌"技术平权"理念,强调用户体验优先于参数竞争。

  • AI日报:Sora正式登陆Android;网易云音乐推AI调音大师;谷歌将推Nano Banana2

    本期AI日报聚焦多领域突破:OpenAI视频应用Sora登陆安卓平台并引入付费角色功能;网易云音乐推出AI调音大师实现智能音效适配;字节跳动高薪布局人形机器人赛道;谷歌Gemini平台将升级图像生成技术;llama.cpp实现多模态革命;特斯拉秘密实验室通过行为数据训练机器人;上海首例AI著作权案宣判保护原创;微软推出自研图像生成器MAI-Image-1,在创意效率与质量间取得平衡。

  • 以算力为基,优刻得与IDEA共建低空经济新格局

    10月24日,粤港澳大湾区数字经济研究院低空经济院长李世鹏一行访问优刻得上海总部,与董事长季昕华、副总裁韩畅交流。双方围绕低空经济发展趋势、技术攻关及生态共建等达成多项合作意向,将共同推动低空经济产业创新与落地。此前中共二十届四中全会提出加快低空经济等新兴产业发展。双方团队将在技术产品创新、生态共建与全球化布局等领域深化合作,整合云计算与产业资源优势,促进低空经济全链条发展,把握战略机遇,引领产业健康、智能、可持续发展新阶段。

  • 超擎速度!全国首批NVIDIA DGX Spark率先抵达超擎数智,现货在仓,交付启动

    10月19日,全国首批NVIDIA DGX Spark桌面级AI超算率先抵达超擎数智并开始交付。这款"全球最小AI超算"在发布72小时内落地中国市场,为企业和科研机构提供强劲算力。产品预装完整AI软件栈,实现开箱即用,配备详细快速指南和专业支持团队,助力开发者无缝对接顶尖计算能力,加速AI本地化开发创新。

  • 信锐助力TCL获 “2025中国IDC未来企业大奖联接领军者”优秀奖!

    10月17日,TCL空调办公网络智能连接与体验升级项目在IDC中国CIO峰会获“2025未来企业连接领军者”优秀奖。该项目依托信锐“AI+网络自动驾驶”理念,通过全网智能2.0与小信GPT方案重构企业网络管理模式,实现从感知、分析到决策的智能闭环,助力TCL实现20+维度数据采集、7*24小时AI调优及自然语言交互运维,推动企业数字化转型升级。

  • AI日报:HeyGen发布AI视频翻译引擎;科大讯飞推星火 X1.5;QQ浏览器推出AI+小窗

    本期AI日报聚焦多项技术突破:HeyGen推出精准唇形同步的视频翻译引擎;科大讯飞发布星火X1.5大模型,提升多语言处理能力;QQ浏览器新增AI助手浮窗;科大讯飞推出软硬一体方案,实现高噪声环境精准识别;谷歌Gemini 3 Pro预览版支持百万级上下文窗口;Comfy Cloud让Stable Diffusion实现零门槛创作;谷歌Gemini新增深度研究功能,可整合邮件生成智能报告;上海AgiBot机器人10分钟完成复杂制造任务,重塑生产效率。

  • 有AI就有无限可能,灰豚AI发布新一代GEO系统

    11月1日,灰豚AI发布新一代GEO系统,突破传统仅支持文本内容优化的局限,全面支持国内短视频平台作品优化,实现近乎零算力成本。该技术被视作行业重大创新,是当前国内GEO源头厂商的重要突破。系统通过AI训练提升企业在生成式搜索中的品牌影响力,助力企业获得竞争优势。未来电商将从平台化转向AI化,灰豚GEO系统支持多种合作模式,让企业以业务增长为导向,抢占AI市场先机。

今日大家都在搜的词: