首页 > 业界 > 关键词  > Anydoor最新资讯  > 正文

AI图片编辑神器Anydoor:开启图片编辑的任意门 图片主体随意移动

2023-12-21 14:10 · 稿源:站长之家

划重点:

🌐 由香港大学、阿里巴巴和蚂蚁集团联合研发AnyDoor,通过一张照片将任何物品传送到另一张图片的世界中。

🚪 AnyDoor为图片编辑开启全新时代,实现零样本对象-场景合成。

🎨 设计师无需为合照缺人而烦恼,AnyDoor让贴图穿进背景图,实现自动摆姿势、站位的「魔法」。

站长之家(ChinaZ.com)12月21日 消息:随着数字时代图像编辑的飞速发展,来自香港大学、阿里巴巴和蚂蚁集团的新成果AnyDoor为图片编辑开辟了一扇全新的时代之门。

这是一项基于扩散技术的创新,具有将目标物体以和谐的方式传送到用户指定位置的神奇能力。与传统模型需要为每个物体调整参数不同,AnyDoor只需进行一次训练,就能在推断阶段轻松适应多样化的物体-场景组合。

这种具有挑战性的零障碍设置要求对某个对象进行充分的特征描述。为此,在常用的身份特征基础上,补充了细节特征,这些特征经过精心设计,既能保持纹理细节,又能允许多样化的局部变化(如光照、方向、姿势等),使对象能够与不同环境和谐融合。

此外,研究人员还提出从视频数据集中借用知识,从中观察单个对象在时间轴上的各种形态,以增强模型的泛化能力和稳健性。大量实验证明,我们的方法在效果上优于现有替代方案,并在虚拟试穿和物体移动等实际应用中展现出巨大潜力。

AnyDoor能实现的效果包括

1. 物体移动: AnyDoor可应用于高级任务,如物体移动,轻松实现场景中物体的位置变换。

比如把这张图里桌面上的位置任意变化:

image.png

2. 物体交换: AnyDoor可扩展为进行物体交换,为图像增添更多创意和趣味。

如下图,可以将图中两辆车的位置对调:

image.png

3. 多主体合成: 由于AnyDoor对于将物体放置在给定场景特定位置具有高度可控性,因此轻松扩展为多主体合成,创造更加丰富的画面。

比如把下图中所有的宠物狗都放到同一个草地上:

image.png

4. 虚拟试穿: AnyDoor可作为虚拟试穿的简单但强大基线。无需复杂的人体解析,能够保留不同衣物的颜色、图案和纹理。试穿衣服也能玩成贴画游戏版本,图中人物换上想要的衣服

image.png

这项技术创新为图像编辑领域带来了新的可能性,将在图像合成、效果图像渲染、海报制作、虚拟试穿等多个应用场景中发挥实际作用。

项目网址:https://top.aibase.com/tool/anydoor

论文网址:https://arxiv.org/pdf/2307.09481.pdf

举报

  • 相关推荐
  • 声网与Oopz达成战略合作 共同打造游戏语音场景AI降噪极致体验

    游戏语音头部平台Oopz与声网达成战略合作,聚焦游戏开黑场景中的噪音问题。双方将结合AI降噪技术,针对复杂多变噪音环境,解决降噪不彻底、过度降噪等痛点,提升玩家沉浸式开黑体验。未来合作将覆盖连麦降噪、环境音消除等方向,优化主播端功能,共同打造更稳定流畅的语音解决方案。

  • iQOO 15 Ultra已在路上:配置最激进的iQOO旗舰

    iQOO产品副总裁罗锋在接受媒体专访时透露,iQOO 15系列还有一款高配版本,目前正在打磨中,面向特定群体,是游戏生产力工具”。 此前博主数码闲聊站爆料,iQOO 15 Ultra采用2K LIPO直屏,搭载高通第五代骁龙8至尊版平台,配备潜望长焦,支持无线快充,该机还测试了肩键以及主动散热风扇,支持IP68级防尘防水。 对比iQOO 15,iQOO 15的堆料

  • AI日报:Google Skills平台向公众免费开放内部AI知识;LiblibAI 完成1.3亿美元融资;Sora更新推出“角色客串”功能

    本期AI日报聚焦视频生成领域重大进展:昆仑万维SkyReels将于11月上线新版AI视频工具;LiblibAI完成1.3亿美元融资;阿里推出夸克对话助手;豆包视频模型Seedance1.0pro实现首尾帧一致性突破;Vidu Q2全面开放API;Sora新增角色客串功能并即将推出安卓版;MiniMax海螺2.3在真实感方面超越Veo;谷歌推出免费AI学习平台"Google Skills";字节跳动Seed团队发布3D生成模型Seed3D1.0,支持单图生成高质量3D资产。

  • iQOO 15原装保护膜不要撕 产品经理:厂商下血本了

    iQOO产品经理戈蓝表示,如非必要,千万不要撕掉iQOO 15原装保护膜,这是一张比普通原装保护膜成本贵几倍的AR增透保护膜,厂商下血本了,如果保护膜损坏,可以去我们官方售后更换同款AR膜,每年4次。如果大家要换玻璃膜,我建议一步到位上AR玻璃膜,我们也在推动官方商城尽快上架。 据悉,iQOO 15全版本标配AR增透保护膜,能有效减少光线的反射和折射,进一步提升屏幕的

  • Google中国×小渔夫深度对话:共绘2026AI品牌出海战略新蓝图!

    2025年9月16日,Google中国团队到访小渔夫广州总部,双方围绕2026年战略合作与AI赋能展开深度交流。此次会面深化了连续13年的伙伴关系,并为推动中国品牌全球化注入AI动力。小渔夫获得Google"百万会员俱乐部战略合作伙伴"与"星火Plus优秀客户成长合作伙伴"两项认证,奠定2026年深入协作基石。会议重点探讨了联合市场洞察、产品共建与生态协同,旨在通过AI营销技术助力中国企业出海实践。时值小渔夫成立20周年,此次合作标志着双方共同赋能中国品牌全球化的重要里程碑。

  • 宝贵!谷得易GoodyAds团队投放经验、素材方法将发布于大声出海微信公众号

    在海外广告投放风险与机遇并存的时代,中国出海服务商谷得易GoodyAds凭借源头资源与专业服务的双重优势,为游戏、工具、社交、电商等领域的出海企业搭建通往全球市场的桥梁。通过Facebook、Google等海外户源资源构建账户稳定性与成本优势,结合全链路服务能力,已服务超600款产品。典型案例显示:某游戏实现连续6个月零风控稳定投放,某社交应用三个月拓展5个新市场且获客成本低于行业22%。其"资源+服务+知识共享"的全链路模式,正成为出海营销服务新标准。

  • 未来iPad mini/iPad Air/MacBook都将升级OLED屏:LCD退场

    苹果正在研发搭载OLED显示屏的iPad mini、iPad Air、MacBook Pro和MacBook Air机型,苹果已在iPad Pro中采用OLED屏,并计划在未来数月及数年内将OLED推广到更多设备上,从而淘汰LCD屏幕。 具体来看,iPad mini最快会在2026年配备OLED屏,同时会提升防水性能,新款iPad mini也因此涨价100美元。 至于iPad Air,其商用OLED的时间要晚于iPad mini,爆料称2026年春季亮相的iPad Air将继续使用LCD屏幕,但后续

  • 宝藏新品登场!WIKO Hi MateBook 14锐龙版预售:颜艺双全,福利拉满

    WIKO Hi MateBook 14锐龙版于10月24日开启预售,起售价4999元。配备14英寸2.8K OLED触控屏,支持120Hz刷新率、100% sRGB色域及专业级色准,搭载AMD锐龙7 H255处理器与Radeon 780M显卡,性能强劲。设计上采用波点艺术键盘与1.32kg轻薄机身,支持AI智慧功能及跨设备协同,内置70Wh电池满足全天移动办公需求,兼顾高颜值与实用性,适合职场人士与创作者。

  • 苹果藏了一手!M5 MacBook Pro隐形升级:SSD速度提升211%

    苹果在前不久正式推出了新款M5 MacBook Pro,不过在外观上缺乏明显变化,可能给人留下了苹果只是升级了M5芯片就完事”的印象。 然而最新的测试显示,其固态硬盘速度也有着大幅提升,对比M4 MacBook Pro,读写速度最高竟提升了211%。 根据Max Tech的对比测试,M5和M4 MacBook Pro在内部布局、单风扇和单热管散热方案上保持一致,都采用了两颗NAND闪存芯片以最大化SSD性能。 不过,在

  • 性价比最高的MacBook来了!苹果把iPhone处理器塞进笔记本里

    本月苹果推出了全新MacBook Pro、iPad Pro及Vision Pro,这些设备均搭载新一代M5芯片。除了上述新品,苹果还有一款MacBook已在路上,许多人期待能在节前看到。 行业分析师郭明錤透露,苹果正研发一款更具性价比的13英寸笔记本电脑,这款产品旨在对标Chromebook,提升MacBook的整体销量,新MacBook将搭载A18 Pro芯片,这颗芯片去年在iPhone 16 Pro上首发搭载。 在Mac产品中使用iPhone芯片,从�

今日大家都在搜的词: