首页 > 业界 > 关键词  > ViViD最新资讯  > 正文

阿里中科大合推虚拟试衣技术ViViD 轻松实现视频换衣

2024-05-31 09:47 · 稿源:站长之家

站长之家(ChinaZ.com) 5月31日 消息:阿里巴巴与中国科学技术大学联手推出了一款名为ViViD的新框架,旨在革新虚拟试衣体验。ViViD基于先进的扩散模型技术,能够实现视频中人物衣物的实时替换,从而生成自然且逼真的视频效果。

image.png

ViViD的推出解决了以往视频试衣中难以保持时间一致性和图像质量的难题。它由三大核心组件构成:服装编码器、姿势编码器以及时间模块。这些组件协同工作,不仅可以精确提取衣物细节的语义特征,还能对人物姿势进行编码,并确保整个视频在时间线上的连贯性。

为了进一步提升试衣效果,研究团队还引入了一种创新的注意力特征融合机制。这种机制优化了衣物语义信息的整合过程,使得最终呈现的试衣效果更加贴合用户的多样化需求。无论是上半身、下半身还是连衣裙等不同类型的服装,ViViD都能够轻松应对,展现出其强大的适应性。

视频来自官方项目页

在实验测试中,ViViD展现出了令人瞩目的性能。与其他现有方法相比,它在视觉质量、时间一致性以及细节保持方面都取得了显著优势。实际演示中,用户可以选择单独更换上衣或裤子,或者同时替换两者,这种灵活的选择极大地丰富了用户体验。

为了全面评估ViViD的性能,阿里和中科大的研究团队投入了大量资源构建了一个专门的数据集,命名为ViViD数据集。这个数据集包含了高达9700个服装视频对,分辨率高达832×624,是目前公开数据中规模最大、多样性最高且分辨率最清晰的视频虚拟试衣数据集。

ViViD的问世不仅是人工智能领域的一项技术突破,更是虚拟试衣技术迈向实用化的重要一步。随着这一新框架的推广和应用,未来消费者在线上购物时将能享受到更加便捷、直观的试衣新体验,为零售商和电商企业带来新的增长机遇。

项目页:https://top.aibase.com/tool/vivid

论文地址:https://arxiv.org/pdf/2405.11794

举报

  • 相关推荐
  • 跨越四大洲的美丽探索:Vida Glow 十年创新,定义口服美容新范式

    Vida Glow是源自澳大利亚的口服美容品牌,2014年由Anna Lahey创立,以天然水解海洋胶原蛋白粉为核心产品。品牌通过法国专利水解技术提升吸收率,产品覆盖全球高端百货及医美机构,平均每4秒售出一罐,被誉为全球胶原蛋白领先品牌。目前产品线已扩展至日常护理、高级修护和女性健康系列,致力于以科技推动口服美容行业发展。

  • “无限量”供应Claude,就是AI IDE们的百亿补贴

    Anthropic于2025年7月28日宣布,将从8月28日起对Claude Code工具新增每周调用限额——因为少数重度用户全天候高频使用,一次使用成本甚至高达数万美元,远远超过普通订阅预期。 同样在上个月,Cursor曾因其“I’ll keep it unlimited”的Pro收费模式悄然变更为计算tokens限制,导致大量用户抱怨“实际上并非无限”,纷纷在社群中吐槽,迫使公司CEO出面道歉、甚至给出退款补偿。 这两�

  • AI最新资讯在哪里看?AIbase:高效获取国内外AI新闻头条与行业动态

    文章探讨了AI时代信息过载的困境:有价值的前沿动态、重磅模型发布和行业解读分散各处,筛选成本高、效率低下。AIbase资讯导航站应运而生,通过四大核心功能解决痛点:1)聚合主流信源,过滤低质噪音;2)结构化分类呈现大模型动态、行业应用等六大板块;3)提炼核心要点,拒绝标题党;4)高频更新确保信息鲜度。该平台致力于成为AI领域的"信息雷达",帮助用户节省70%信息搜集时间,将精力聚焦于思考与创造。适用于技术负责人快速掌握行业动态、产品经理调研案例、投资人捕捉趋势等多元场景。

  • 苹果首款折叠iPhone细节曝光:支持eSIM、Touch ID回归

    日前,知名科技记者马克古尔曼(Mark Gurman)曝光苹果首款折叠iPhone更多细节。 古尔曼透露,苹果折叠iPhone将配备四颗镜头,分别是外屏前摄、内屏前摄,以及两颗后摄。 另外,新款iPad Air、iPad mini和入门级iPad机型均配备了Touch ID电源键,这一功能可能会延续到折叠iPhone上,而非目前iPhone所使用的面部识别(Face ID)技术。

  • VivienneWestwood饰品真假识别有保障,得物App专业鉴别体系护航正品消费

    Vivienne Westwood"土星"项链因满钻和珍珠设计走红网络,但随之出现大量高仿品。得物App通过专业鉴别体系帮助消费者识别真伪:1)资深鉴别师从绳结、土星标志等细节辨别,正品绳结紧密为多股线,仿品松散;2)科研实验室借助3D超景深显微镜放大101倍观察,正品十字顶部平直、金属珠自然融合,仿品呈弧形且做工生硬;3)依托超10万件正品样本库(含近500件Vivienne Westwood单品)建立鉴别标准。平台采用"先鉴别,后发货"模式,确保消费者购买到正品。

  • 电子证件(Digital ID)的全球信任度全景:亚洲、中东与非洲领先,欧美市场滞后

    Checkout.com最新全球调研报告显示,不同地区对电子证件(digital ID)的接受度存在显著差异。亚洲、中东和非洲消费者对电子证件和生物识别认证表现出高度信任,而欧洲和北美则态度谨慎。AI电商代理的兴起进一步凸显了数字身份验证在交易中的重要性。报告强调,建立数字信任对全球商业发展至关重要,需行业和政策制定者优先考虑数字身份管理方式。

  • BOE(京东方)携手联想发布旗舰款显示器 Oxide氧化物技术打造商用显示器领域新标杆

    8月22日,BOE与联想在南京联合发布ThinkVision P系列高端商用显示器,采用BOE独家Oxide氧化物技术,具备低功耗、高刷新率、高色域及护眼优势。该产品覆盖商务办公、专业设计等多场景,并大量采用环保材料,推动低碳运营。双方合作彰显技术突破与可持续发展理念,共同引领显示产业向高效、绿色、智能化发展。

  • 信安世纪入选2025年度IDC中国金融IT中坚力量榜单,以硬核实力赋能金融数字化转型

    近日,北京信安世纪科技股份有限公司(股票代码:688201)凭借在金融科技领域的持续创新与技术积累,入选2025年度IDC中国金融IT中坚力量榜单。该公司通过“产品+方案+服务”一体化模式,深度参与金融行业关键基础设施建设,为超过1000家金融机构提供信息安全服务,覆盖央行、商业银行、证券保险等全业态。其典型实践包括人行外联业务系统、电子渠道业务系统等,为金�

  • B站要变成AI站

    互联网平台都在跟AI结合,B站没有成为例外。从新一季度财报来看,B站的AI味儿也越来越浓了。 8月21日,B站公布第二季度业绩,总营收达73.4亿元人民币,同比增长20%。其中,游戏业务收入为16.1亿元,同比增长60%,广告业务收入为24.5亿元,同比增长20%。由此推动B站毛利率从去年同期的29.9%提升至36.5%,调整后净利润达到5.6亿元,创下历史最好成绩。 从整体来看,B站生态集聚

  • 央视网首场AI晚会七夕“AI心动夜”即将开启 联合可灵AI打造视听盛宴

    8月28日晚8点,央视频与快手可灵AI联合打造的七夕晚会“AI心动夜”正式开启。晚会以“AI视频叙事+传统文化”为核心,通过AI技术融合文化传承、艺术创作与情感表达,呈现跨越虚拟与现实、科技与文化交融的七夕盛典。节目包括《星河告白》《千年婚服秀》等,展现不同时代的爱情故事与中华婚服之美,同时通过《与妻书》《许愿吧》等作品探讨革命年代的深情与当代浪漫。晚会将在央视频、快手等平台同步直播,带领观众体验科技与文化的精彩碰撞。

今日大家都在搜的词: