首页 > 业界 > 关键词  > 阿里最新资讯  > 正文

阿里推虚拟试穿技术Outfit Anyone 加上Animate Anyone轻松拿捏换装视频

2023-12-14 13:54 · 稿源:站长之家

要点:

  • Outfit Anyone采用双流条件扩散模型,处理模特、服装和文本提示,通过衣物图像作为控制因素实现更逼真的虚拟试穿效果。

  • 该技术在处理服装变形方面表现出色,具有可扩展性,可调节因素包括姿势和身体形状,适用范围涵盖从动漫到真实场景的多种图像。

  • Outfit Anyone包含零拍摄尝试网络和事后精化器两个关键组件,前者用于生成初始试穿图像,后者则用于在输出图像中对服装和皮肤纹理进行详细增强。

站长之家(ChinaZ.com)12月14日 消息:Outfit Anyone是一项由阿里巴巴集团智能计算研究所推动的高质量虚拟试穿技术。该技术通过采用双流条件扩散模型,能够独立处理模特和服装数据,然后在融合网络中将服装细节嵌入到模特的特征表示中,从而实现更逼真、高保真度的虚拟试穿效果。

Outfit Anyone不仅在处理现实场景中的全套装和个别服装时表现出色,还展示了对各种古怪和独特服装风格的处理能力,甚至能够创建相应的搭配。这显示了该模型在试穿需求上的多样性和灵活性,可以满足来自各行各业人群的需求。

image.png

项目地址:https://humanaigc.github.io/outfit-anyone/

体验地址:https://huggingface.co/spaces/HumanAIGC/OutfitAnyone

该技术还展示了对各种体型的泛化能力,包括健身、曲线和娇小体型,使其能够满足不同生活背景的个体的试穿需求。此外,Outfit Anyone还展示了对动漫角色的强大泛化能力,支持新动画角色的创建。

Outfit Anyone的后处理精化器展示了其在提高服装和皮肤纹理逼真度方面的效果。通过展示使用精化器前后的效果,突显了其在保持服装一致性的同时,显著增强了服装纹理的能力。

image.png

如果在加上之前阿里推出的创新视频生成技术Animate Anyone,那么,你可以轻松用任何角色做换装视频。通过与最新的姿势到视频模型的集成,实现了更丰富的试穿体验。

Outfit Anyone项目旨在进行学术研究和效果演示,强调未从中获得商业利益。模型和服装图像主要来自互联网和公共数据集,所有图像和品牌均为其各自所有者的财产。

举报

  • 相关推荐
  • 工程师变身AI“指挥者”,吉利与阿里云的软件开发变革实验

    1975年,IBM工程师Fred Brooks在《人月神话》中指出软件工程的核心难题:系统与团队规模增长会导致复杂度指数级上升,且“没有银弹”能单一提升生产力。如今汽车行业正经历软件史上最大挑战,吉利汽车软件人员占比从不足10%跃升至40%,智能汽车代码量超亿行。面对异构系统协同、安全标准严苛等难题,吉利与阿里云通义灵码深度合作,通过AI生成代码(占比超30%)、代码审查测试等,提升开发效率20%,并探索用AI破解遗留系统维护、知识传递等痛点。工程师角色正从“执行者”转向“AI指挥官”,未来或实现从需求到交付的全流程自动化协同。

  • 双11“换芯” 阿里妈妈AI按下加速键

    ​今年双11的不同,在平台对外披露的商家案例中得以一窥究竟。 AI智能选品、AI智能出价、AI智能调控投放节奏..... 这些营销策略的表述来自音箱品牌Marshall,双11第一波段10天活动期内,Marshall在影音电器行业品牌和店铺排名均位居第一;成交转化率提升67%,爆款成交同比增长30%。这波爆发式增长的背后,反复被CUE到的AI可以说是深藏功与名。 绝非只是平台意志的表达,

  • 阿里夸克AI眼镜S1宣布11月27日发布

    阿里巴巴旗下首款旗舰双显AI眼镜夸克AI眼镜S1将于11月27日上市。产品融合前沿显示、拍摄与交互技术,以双目光机二维衍射波导方案实现低反光率高透性视觉体验,支持环境光智能调节与自定义显示位置。搭载索尼IMX681传感器与1200万超广角镜头,具备极速抓拍、3K视频及超级夜景功能。创新双电池架构与MiniBag换电仓解决续航痛点,支持手势与语音双操作。集成高德导航、支付宝“看一看”支付及办公辅助工具,通过眨眼或语音即可完成路线查询与快捷支付,覆盖生活全场景智能生态。

  • AI日报:Lovart AI上线“元素拆分”功能;Xcode 26.1.1发布;阿里云通义模型首次大规模赋能双11

    本期AI日报涵盖八大热点:Lovart AI推出"元素拆分"功能,实现海报智能分层编辑;苹果Xcode 26.1.1优化AI编码性能;阿里云通义模型双11单日翻译调用量突破14亿次;Gemini 3在历史手稿破译中展现专家级能力;德国法院裁定OpenAI使用歌词训练构成侵权;开源语音模型Maya1实现富有表现力的实时文本转语音;Meta首席AI科学家LeCun计划离职创办世界模型公司;AI专家罗福莉加入小米,将致力于构建物理世界智能。

  • 阿里通义App重大品牌升级!正式更名为“千问”

    11月14日,阿里巴巴旗下“通义”App正式更名为“千问”,版本号从3.60.0跃升至5.0.0,已登陆苹果及各大安卓应用商店。该应用基于阿里最强Qwen大模型打造,具备对话问答、智能写作、多模态相机等核心功能,被定位为“阿里最强大模型官方AI助手”。阿里巴巴视其为“AI时代的未来之战”,已抽调上百名工程师加速推进,并同步研发国际版,计划借助Qwen模型的海外影响力与ChatGPT直接争夺全球用户。

  • 无万卡,不VLA:元戎启行与阿里云的“想法”和“解法”

    1980年代汉斯·莫拉维克提出人工智能悖论:计算机在逻辑推理等高级智能活动中易超越人类,但实现儿童般的感知与常识认知却极困难。智能驾驶的核心挑战在于让AI理解物理世界并进行因果推理。视觉-语言-行动模型通过融合多模态数据,使系统具备推理驾驶能力,推动行业迈向L5完全自动驾驶。面对VLA模型的数据处理、训练效率和成本挑战,阿里云等超级AI云提供全栈解决方案,从算力基础设施到开源生态,加速技术迭代与商业化落地。

  • 阿里回应饿了么更名:正处于灰度测试阶段

    饿了么App完成品牌升级,正式更名为“淘宝闪购”,版本号同步更新至12.0.1。此次升级标志着阿里巴巴整合即时零售战略的关键一步,新平台聚焦餐饮外卖与日用百货的30分钟极速配送服务。目前该平台仍处灰度测试阶段,仅向部分用户开放,由饿了么现有配送体系承接全国主要城市订单。阿里表示将根据测试反馈持续优化服务体验,此举或将重塑电商行业服务标准与竞争格局。

  • 美团阿里互攻“腹地”、红果内测“带货”:双十一无边界了

    意料之中地,今年的双十一的战场提早开打。 10月7日,快手抢先开启预售活动,抖音电商随即于9日加入战局,随后加入的是于9日晚8点的京东,11日开启大促的小红书,以及14日开卷的拼多多,15日启动活动的淘宝,今年整个促销周期将长至38天超过去年,刷新“史上最长”纪录。 辛巴退网、小杨哥复出仍无音讯,还留在牌桌上的头部主播们更加强调自身社会责任,更努力提�

  • 让AI为你打工有多爽?企业如何选对AI员工?尘锋AI员工,帮您真正复刻优秀员工!

    本文探讨2025年AI员工在各行业的广泛应用,强调其核心价值在于替代人工处理重复性、流程固定的工作,如客服、销售等,实现效率提升与成本优化。文章指出,企业选择AI员工需关注四个关键维度:技术专业度、系统开放性、安全合规性及服务可靠性,并以尘锋AI为例说明如何通过智能协作、数据整合推动业务增长。最终总结,雇佣AI员工是企业面向未来的战略布局,需选择匹配需求的可靠产品以构建竞争优势。

  • 内化AI时代,每个人都是主角

    当乡村教师用AI把孩子的想象变成动画,当97年的村官靠它搭建反诈课堂,当深夜加班的打工人向AI索要一个安慰,当60岁画家用百度网盘开画展,当大学生使用AI养猪......这些看似细微的瞬间,都表明AI正融入每一个人的生活。 他们正共同指向一个深刻的变革:人类与AI的关系,已从“提问-回答”的工具阶段,迈入“共生-协作”的伙伴时代。AI不再只是提供标准答案的“百科全�

今日大家都在搜的词: