首页 > 业界 > 关键词  > ObjectDrop最新资讯  > 正文

谷歌发布图像局部重绘项目ObjectDrop 插入物体和环境完美融合

2024-03-29 09:26 · 稿源:站长之家

站长之家(ChinaZ.com)3月29日 消息:谷歌今天发布了一个名为ObjectDrop的图像局部重绘项目,其效果令人印象深刻。这个项目成功模拟了物体对场景的影响,包括遮挡、反射和阴影,实现了逼真的物体移除和插入。

QQ截图20240329092330.png

论文地址:https://arxiv.org/pdf/2403.18818.pdf

在该项目的论文中,他们介绍了一种方法,该方法包括在移除场景中的某个物体之前和之后拍摄场景,同时尽可能减少其他因素的变化。通过在这个特别的数据集上微调扩散模型,他们不仅能够消除图像中的物体,还能去除它们对周围环境的影响。

然而,他们发现,要把这个方法用于创造逼真的物体插入,需要一个非常大的数据集,这在实际应用中是不现实的。为了解决这个问题,他们引入了一种新的方法,称为引导监督(bootstrap supervision)。

这种方法通过利用他们在一个小反事实数据集上训练的物体移除模型,能够在合成层面大量扩展这个数据集。这意味着,他们可以在不需要大量实际数据的情况下,创造出逼真的物体插入效果。

在创造逼真的物体移除和插入方面,他们的方法明显优于之前的技术,尤其是在模拟物体对其环境的影响这一点上做得非常出色。这一成果对于图像处理和计算机视觉领域来说,是一个重要的突破。

举报

  • 相关推荐
  • AI日报:美图发布影像AI Agent RoboNeo;1.8bit量化Kimi K2模型上线;亚马逊推AI代码编辑器 Kiro

    【AI日报】今日AI领域重要动态:1)美图推出RoboNeo,通过自然语言指令实现图片精修、品牌设计等全能影像处理;2)Unsloth AI将Kimi K2模型量化至1.8bit,体积缩减78%保持性能;3)谷歌Gemini嵌入模型登顶MTEB榜单,超越OpenAI;4)亚马逊发布免费AI代码编辑器Kiro,集成Claude模型;5)Claude新增应用工具目录功能提升工作效率;6)MiniMax完成近3亿美元融资,估值超40亿美元;7)UTCP新协议让AI代理直

  • 马斯克xAI推出Grok - 4 大模型将至,Meta/微美全息深耕开源AI融合加速

    埃隆·马斯克旗下xAI即将发布Grok-4大模型,该模型将在语言、数学和推理方面超越OpenAI和谷歌最新AI产品。同时苹果低调收购两家AI公司TrueMeeting和WhyLabs,加速布局Vision Pro头显和Apple Intelligence领域。Meta计划投入数百亿美元扩建AI基础设施,扎克伯格亲自招募顶尖AI人才。微美全息聚焦高性能算力与多模态模型,推动AI产业升级。当前AI赛道竞争激烈,大模型正向通用多模态演进,商业化落地成为关键。

  • 绘王发布新款蓝牙单手键盘Keydial Remote K40

    7月15日,绘王推出专为ACG创作者设计的单手键盘Keydial+Remote K40。该产品仅152×56×13.5mm大小,配备8个自定义按键和2个切换键,采用U型布局。支持6组软件专属快捷键设置,创新双编码器采用内外圈嵌套设计,全键无冲。配备OLED屏实时显示键值/电量,蓝牙5.0支持PC/移动端双通道切换,约30小时续航满足多场景创作需求。

  • 王腾:REDMI Turbo 4 Pro非常成功 很多友商都在关注

    REDMI总经理王腾发文表示,REDMI上半年发布的Turbo 4 Pro非常成功,受到了广大用户的喜爱,也收到了很多友商的关注。 据悉,REDMI Turbo 4 Pro于4月份发布,首发起售价是1999元,该机上市不到一个月累计销量突破100万台,成为行业内最火的Turbo手机。 随着REDMI Turbo系列的热销,各大品牌纷纷推出Turbo系列手机,主打高性能,对此王腾表示,领先的一种体现就是被模仿,说明REDMI这几�

  • 不止更多筒,而是更懂家!海尔洗衣机发布融合·洗护家

    海尔发布全新"融合·洗护家"洗衣机,创新性地将4个独立洗烘空间集成在0.36㎡机身内,包含10KG洗涤+10KG烘干+2个1KG专属分区洗涤空间。产品采用AI洁净科技,能针对不同面料智能匹配最佳洗护参数,实现分区洗护、大容量烘干,杜绝交叉污染。设计上采用纯平一体外观,隐藏式门体与超薄工艺,完美融入家居环境。同时配备智慧语音、人感开机等智能交互功能,通过手势和语音即可轻松操作。该产品获得艾普兰金奖等权威认可,不仅解决用户痛点,更重新定义了高端洗护体验。

  • 安卓迎来大变化:ChromeOS将跟安卓合并

    谷歌安卓生态系统总裁Sameer Samat确认,谷歌将会把ChromeOS与安卓系统整合为一个平台,不过Sameer Samat并未透露该计划的更多细节,消息称谷歌的计划是将ChromeOS迁移至安卓系统。 目前安卓系统已经支持大屏设备,提供完善的桌面模式、桌面窗口,还支持外接显示器,同时优化了应用适配,让应用在不同尺寸的屏幕上都能得到较好的适配和体验。 资料显示,ChromeOS是谷歌开

  • A日报:月之暗面开源大模型Kimi K2;智源全面开源RoboBrain2.0;通义千问发布Qwen Chat桌面客户端

    本期AI日报重点报道了多项AI领域突破性进展:1.月之暗面推出万亿参数开源大模型Kimi K2,展现强大智能能力;2.智源研究院开源RoboBrain2.0和RoboOS2.0机器人系统;3.通义千问发布桌面客户端Qwen Chat;4.IndexTTS2实现影视级语音合成;5.HuggingFace开源机器人Reachy Mini热销;6.Meta推出实时视频生成模型StreamDiT;7.PixVerse新增多关键帧视频生成功能;8.特斯拉推出仅支持AMD处理器的Grok AI助手;9.OpenAI推迟开源大模型发布以加强安全测试;10.Liquid AI开源边缘AI模型LFM2;11.AI"时间穿越"特效在社交媒体走红。

  • 剑指谷歌Chrome!OpenAI即将推出AI浏览器

    据媒体报道,OpenAI即将推出的AI浏览器,利用人工智能技术彻底重塑用户的网络浏览体验,直接向占据市场主导地位的谷歌 Chrome 发起挑战。 凭借庞大的每周4亿活跃ChatGPT用户基础,OpenAI的浏览器若被广泛接纳,将对谷歌的广告生态系统、网络数据流和搜索流量构成实质性威胁。谷歌Chrome长期以来是Alphabet广告业务的基石,为其精准广告投放和将流量导向自家搜索引擎提供了关�

  • AI驱动全域进化,金仓数据库以“融合”重构数据基座

    7月15日,电科金仓在京举办"融合进化+智领未来"主题产品发布会,推出多款AI时代数据库产品:KES V92025融合数据库具备多语法体系兼容、多集群架构等特性,性能提升30%;KEMCC统一管控平台实现跨云环境数据库管理;云数据库AI版集成高性能硬件与AI大模型;KFS Ultra智能数据集成平台支持百种数据源。中国人民大学教授王珊指出,数据库与AI深度结合已成释放数据价值关�

  • 80后领军设计师黄全的家:让艺术与烟火气自然融合

    斐雪派克与Green+BAZAAR合作,邀请设计师黄全以上海新居为样本,展现生活与艺术在家庭空间的完美融合。通过打通厨房与客厅、餐厅的隔墙,打造出开放流动的大空间,自然光透过挑空区域洒落在大理石岛台上。嵌入式冰箱、酒柜等电器与空间设计融为一体,既满足实用需求又与艺术品和谐搭配。开放式厨房增强了家人互动,烹饪时能照看孩子或与客人交谈,让厨房成为家庭情感联结的中心。这种"社交厨房"理念超越了单纯的烹饪功能,成为家人最常聚集的场所,无论是早晨咖啡时光还是周末聚餐,都让家庭交流充满轻松氛围。