首页 > 业界 > 关键词  > 阿里最新资讯  > 正文

阿里推虚拟试穿技术Outfit Anyone 加上Animate Anyone轻松拿捏换装视频

2023-12-14 13:54 · 稿源:站长之家

要点:

  • Outfit Anyone采用双流条件扩散模型,处理模特、服装和文本提示,通过衣物图像作为控制因素实现更逼真的虚拟试穿效果。

  • 该技术在处理服装变形方面表现出色,具有可扩展性,可调节因素包括姿势和身体形状,适用范围涵盖从动漫到真实场景的多种图像。

  • Outfit Anyone包含零拍摄尝试网络和事后精化器两个关键组件,前者用于生成初始试穿图像,后者则用于在输出图像中对服装和皮肤纹理进行详细增强。

站长之家(ChinaZ.com)12月14日 消息:Outfit Anyone是一项由阿里巴巴集团智能计算研究所推动的高质量虚拟试穿技术。该技术通过采用双流条件扩散模型,能够独立处理模特和服装数据,然后在融合网络中将服装细节嵌入到模特的特征表示中,从而实现更逼真、高保真度的虚拟试穿效果。

Outfit Anyone不仅在处理现实场景中的全套装和个别服装时表现出色,还展示了对各种古怪和独特服装风格的处理能力,甚至能够创建相应的搭配。这显示了该模型在试穿需求上的多样性和灵活性,可以满足来自各行各业人群的需求。

image.png

项目地址:https://humanaigc.github.io/outfit-anyone/

体验地址:https://huggingface.co/spaces/HumanAIGC/OutfitAnyone

该技术还展示了对各种体型的泛化能力,包括健身、曲线和娇小体型,使其能够满足不同生活背景的个体的试穿需求。此外,Outfit Anyone还展示了对动漫角色的强大泛化能力,支持新动画角色的创建。

Outfit Anyone的后处理精化器展示了其在提高服装和皮肤纹理逼真度方面的效果。通过展示使用精化器前后的效果,突显了其在保持服装一致性的同时,显著增强了服装纹理的能力。

image.png

如果在加上之前阿里推出的创新视频生成技术Animate Anyone,那么,你可以轻松用任何角色做换装视频。通过与最新的姿势到视频模型的集成,实现了更丰富的试穿体验。

Outfit Anyone项目旨在进行学术研究和效果演示,强调未从中获得商业利益。模型和服装图像主要来自互联网和公共数据集,所有图像和品牌均为其各自所有者的财产。

举报

  • 相关推荐
  • 阿里妈妈发布万相台AI无界:新流量新节奏之下的双11,AI是经营唯一解

    电商生态持续演化。 闪购业务的爆发,为淘宝带来了大量新增用户和更高的下单频次;超级88购物节激活了更加轻量、日常的“小促”形式,消费者从一年一度的“囤货式购买”,转变为高频次的“循环式购买”;“红猫计划”则支持用户从小红书笔记直达淘宝货品链接,显著缩短转化链路。 这一系列变化揭示了:淘系在走向全域大消费平台的路上,新的流量场景正在涌现,新�

  • 小米和阿里下场,正在改变AI百镜大战的局面

    AI眼镜正从极客玩具发展为AI大模型落地的重要载体。2024年上半年,市场发布超10款新品,包括雷鸟、雷神等创业品牌及华为、创维等大厂产品。全球出货量激增,预计2025年中国市场将达290.7万台,同比增长121.1%。小米、阿里等巨头入局推动竞争升级,但行业仍面临芯片成本高、续航短、生态不足等挑战。未来大厂凭借供应链和生态优势或主导市场,而创业公司需在细分场景寻�

  • 高德扫街,阿里“成团”

    进入三季度,本地生活的硝烟从到家逐渐向到店蔓延。 9月10日,高德发布扫街榜,从信用资产入手,重新构建点评体系。到9月20日,淘宝、支付宝、高德三端低调上线团购业务。据了解淘宝x饿了么和高德将分别做自己的到店业务,同时业务间又会协同作战。 面对阿里持续加码,美团亦有不少对应动作,包括推出个人AI Agent产品小美。与此同时,日前有行业人士与美团交流,�

  • AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型

    本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。

  • 阿里、美团和抖音,重划到店新战场

    继外卖大战后,几家头部平台对本地生活业务的竞逐再次掀起波澜,这次,目标对准了到店业务。 9月10日,阿里发布重磅业务,高德地图推出全球首个基于用户行为产生的榜单“高德扫街榜”,不同于此前的各类以用户图文评价为基准的美食榜单,高德扫街榜开创性地将用户真实的导航到店行为与评价反馈相结合,意在避免常规榜单容易被刷分、注水等问题。这一举动被市场

  • AI日报:阿里云开源通义DeepResearch;夸克推医师考试大模型

    本期AI日报聚焦多项前沿动态:阿里云开源轻量级AI代理DeepResearch,性能媲美OpenAI;夸克推出国内首个全阶段医师考试大模型测试集;微软Copilot将上线类ChatGPT记忆管理功能;迪士尼等巨头起诉MiniMax侵犯版权;OpenAI提升ChatGPT搜索准确性;Notion推出个性化AI助手;谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5;Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�

  • 全球AI计算规模效应拐点凸显,谷歌/阿里/微美全息开启云智算“战略博弈”之争

    谷歌作为英伟达顶级芯片大买家,通过云服务向OpenAI等客户提供算力,同时加速自研AI芯片布局。阿里巴巴加大AI与云计算投资,与博世深化合作推动企业数字化转型。微美全息构建全场景算力覆盖体系,聚焦新型算力系统突破。AI产业持续发力,从消费转向AI与云计算投资,行业有望受益于新老玩家共同推动的高韧性增长。AI算力应用价值进一步凸显,推动技术迭代与行业水平提升。

  • AI日报:美团发布推理大模型LongCat-Flash-Thinking;阿里Wan-Animate开源;字节推豆包翻译大模型

    AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking;阿里开源Wan-Animate模型革新AI视频生成;字节跳动发布豆包翻译模型,支持28种语言互译;华为与浙大联合推出安全大模型DeepSeek-R1-Safe;阿里云即将发布跨模态模型Qwen3-Omni;xAI推出计算成本降低98%的Grok4Fast模型;YouTube发布多项AI创作辅助功能;IBM推出轻量级文档处理模型Granite-Docling-258M;中科院发布类脑大模型SpikingBrain实现百倍速度突破;OpenAI将推出仅限Pro用户的计算密集型新功能。

  • SNOW量化再升级:携手阿里系强化监管无任何风险

    SNOW量化平台在金融科技合规化背景下迎来重大监管升级。新浪阿里巴巴金融板块正式介入其监管体系,并与香港金融专家深度合作,构建“双轨监管”模式。该创新合作不仅为行业树立新标杆,更展现中国金融科技企业全球化发展的新路径,通过技术+监管双轮驱动,推动行业规范化发展。

  • 阿里巴巴总市值重回3万亿港元 股价年内近乎翻倍

    今日,阿里巴巴在港股市场表现强劲,开盘即高开2.74%,截至发稿时,涨幅已扩大至3.13%,最新股价报158.3港元,这一价格续创近4年新高。 随着股价的攀升,阿里巴巴港股总市值也成功重回3万亿港元大关。值得一提的是,今年以来,阿里巴巴股价累计涨幅已接近100%,展现出强劲的复苏势头。

今日大家都在搜的词: