首页 > 业界 > 关键词  > ObjectDrop最新资讯  > 正文

谷歌发布图像局部重绘项目ObjectDrop 插入物体和环境完美融合

2024-03-29 09:26 · 稿源:站长之家

站长之家(ChinaZ.com)3月29日 消息:谷歌今天发布了一个名为ObjectDrop的图像局部重绘项目,其效果令人印象深刻。这个项目成功模拟了物体对场景的影响,包括遮挡、反射和阴影,实现了逼真的物体移除和插入。

QQ截图20240329092330.png

论文地址:https://arxiv.org/pdf/2403.18818.pdf

在该项目的论文中,他们介绍了一种方法,该方法包括在移除场景中的某个物体之前和之后拍摄场景,同时尽可能减少其他因素的变化。通过在这个特别的数据集上微调扩散模型,他们不仅能够消除图像中的物体,还能去除它们对周围环境的影响。

然而,他们发现,要把这个方法用于创造逼真的物体插入,需要一个非常大的数据集,这在实际应用中是不现实的。为了解决这个问题,他们引入了一种新的方法,称为引导监督(bootstrap supervision)。

这种方法通过利用他们在一个小反事实数据集上训练的物体移除模型,能够在合成层面大量扩展这个数据集。这意味着,他们可以在不需要大量实际数据的情况下,创造出逼真的物体插入效果。

在创造逼真的物体移除和插入方面,他们的方法明显优于之前的技术,尤其是在模拟物体对其环境的影响这一点上做得非常出色。这一成果对于图像处理和计算机视觉领域来说,是一个重要的突破。

举报

  • 相关推荐
  • 中国UP主成为不了MrBeast

    影视飓风创始人Tim刚刚结束的“100小时荒岛直播挑战”,无疑是一次B站在这个夏天难得的现象级事件——B站累计超过四千万观众进入直播间,全平台总观看量超过两亿,弹幕数以百万计,甚至带动了直播带货的即时转化。 从数据到热搜,此次直播堪称完美演绎了“爆款”的逻辑。 质疑声同样随之而来:这场直播与其说是“荒岛生存”,不如说是“带电度假”;也评论认为,它

  • 8TB登场 三星 9100 PRO PCIe 5.0 固态硬盘,性能规格上新

    三星电子于2025年8月20日推出9100PRO系列8TB固态硬盘,包括标准版和散热片版。新品采用PCIe 5.0接口,顺序读写速度分别高达14,800MB/s和13,400MB/s,相比前代990PRO性能提升99%。支持多设备兼容,包括笔记本电脑、游戏主机等,适用于游戏、内容创作等高性能场景。8TB版本将于9月2日发售,建议零售价分别为999.99美元和1019.99美元。

  • Matrixport 受邀出席 Bitcoin Asia 2025,共议机构投资新趋势

    Bitcoin Asia 2025峰会将于8月28-29日在香港举行,由BTC Media主办。预计吸引超1.5万名与会者,涵盖主题演讲、圆桌讨论及展览等活动,突显香港在全球数字资产领域的战略地位。会议将探讨亚太市场潜力、机构化进程及多元化投资机会,并邀请200余位全球重量级嘉宾参与。Matrixport作为亚洲领先加密金融服务平台,将持续推动资产数字化及Web3基础设施落地,助力行业创新与发展。

  • OpenAI的开源模型现已在IBM watsonx.ai上提供

    OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B,允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台,采用专家混合架构,支持本地或云端部署,不受商业用途限制。模型具备高透明度,输出完整推理链,在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态,IBM强调其开放战略,为企业提供灵活、安全的AI开发选择。

  • B站要变成AI站

    互联网平台都在跟AI结合,B站没有成为例外。从新一季度财报来看,B站的AI味儿也越来越浓了。 8月21日,B站公布第二季度业绩,总营收达73.4亿元人民币,同比增长20%。其中,游戏业务收入为16.1亿元,同比增长60%,广告业务收入为24.5亿元,同比增长20%。由此推动B站毛利率从去年同期的29.9%提升至36.5%,调整后净利润达到5.6亿元,创下历史最好成绩。 从整体来看,B站生态集聚

  • 苹果上架翻新版Apple Pencil Pro售价849元

    今日,苹果在其官方Apple Store线上商店低调上架了翻新版Apple Pencil Pro,定价849元,较新品999元的官方售价优惠150元。值得注意的是,这是自2024年5月该产品首次发布以来,首次登陆苹果官方翻新渠道,且过去一个月已在多个国家陆续上架销售。 苹果官方强调,翻新版Apple Pencil Pro虽为二手商品,但均经过严格的功能测试与检验流程,确保性能与新品无异。用户购买后可享受与新

  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

  • AI日报:腾讯开源3D世界模型HunyuanWorld-Voyager;即梦AI系列模型开放API;通义推智能体开发框架AgentScope 1.0

    本文介绍了AI日报栏目,聚焦人工智能领域最新动态。主要内容包括:腾讯开源具备3D重建能力的HunyuanWorld-Voyager模型、通义实验室推出的多智能体开发框架AgentScope 1.0、即梦AI开放图像与视频生成API、腾讯翻译模型Hunyuan-MT-7B在WMT2025斩获佳绩、苹果推出图像生成技术STARFlow和视觉语言模型FastVLM、新模型CoMPaSS-FLUX.1提升空间理解能力、Cherry Studio免费提供Qwen38B模型、谷歌Gemini API新增网页内容解析功能,以及腾讯优图开源智能体框架Youtu-Agent。这些进展展现了AI技术在多个领域的创新与应用。

  • 快手向量化引擎Auron 正式加入Apache孵化器

    快手开源的向量化引擎Auron(原Blaze项目)正式进入Apache孵化器,标志着项目发展的重要里程碑。Auron基于Rust开发,采用原生执行和向量化技术,相比Spark性能提升2倍以上,已在快手内部大规模应用并获多家企业采用。项目开源后社区活跃,未来将依托ASF开源治理模式,融入全球开源生态,获得更可持续的创新动能与影响力。

  • AI与数字化变革费率3年连降,海尔智家H1再优化0.1pct

    海尔智家2025上半年业绩逆势增长,营收1564.94亿元,同比增长10.2%;净利润120.33亿元,增长15.6%。核心驱动因素为数字化转型与AI技术应用,通过全流程降本增效,销售管理费用率连续三年下降。国内聚焦明星爆品与多品牌协同,海外坚持本土化运营,实现各区域加速增长。AI驱动的产品创新打造多个行业爆款,带动高端品牌卡萨帝增长超20%。未来将持续深化数字化变革,开拓新发展空间。

今日大家都在搜的词: