首页 > 业界 > 关键词  > ZeroNVS最新资讯  > 正文

李飞飞团队推零样本360度场景合成技术ZeroNVS

2023-11-06 09:30 · 稿源:站长之家

要点:

1. 斯坦福和谷歌团队提出了ZeroNVS,一种能够从单个图像实现零样本360度试图合成的新技术。

2. ZeroNVS利用3D感知扩散模型和SDS蒸馏来生成逼真且多样化的合成图像,聚焦于场景而不是物体。

3. 研究人员使用不同的基准数据集进行评估,结果表明ZeroNVS在零样本性能方面明显领先于其他方法,特别是在LPIPS指标上。

站长之家(ChinaZ.com)11月6日 消息:斯坦福和谷歌团队提出了一项名为ZeroNVS的创新技术,能够从单个图像实现零样本360度试图合成。过去,3D感知扩散模型的训练主要集中在模型生成单个物体的SDS蒸馏上,但要生成逼真且多样化的合成图像,需要关注整个场景。ZeroNVS的方法涉及使用高质量大规模数据集,如Objaverse-XL,以实现从新视角生成逼真图像,然后通过SDS蒸馏采样,提高3D一致性。与以往的工作不同,ZeroNVS聚焦于场景,而不是物体,因为背景对于图像多样性至关重要。

在具体方法上,研究人员首先训练扩散模型,然后使用它来执行新颖的视图合成,随后进行3D SDS蒸馏。与以往不同的是,ZeroNVS引入了一种具有六个自由度的相机表示,以捕获所有可能的位置和方向。这种表示被称为“6DoF+1”,它对于场景的刚性变换具有不变性。此外,研究人员还通过“SDS anchoring”来提高多样性,使用DDIM对新视图进行采样,然后使用最近的图像作为指导。

image.png

论文地址:https://arxiv.org/pdf/2310.17994.pdf

在实验结果方面,研究人员使用了一组标准的新视图合成指标来评估各种方法,主要关注LPIPS。结果显示,ZeroNVS在零样本性能方面明显领先于其他方法,包括DS-NeRF、PixelNeRF等。此外,研究人员还引入了Mip-NeRF360数据集,来进一步测试单张图像的360度视图合成任务,结果仍然显示ZeroNVS表现出色。

总之,ZeroNVS是一项创新的技术,可以从单个图像生成多样的合成图像,聚焦于场景级的合成。它利用3D感知扩散模型和SDS蒸馏,采用新的相机表示和“SDS anchoring”来提高性能,从而在零样本性能方面取得显著成果。这一技术有望在计算机视觉和图像合成领域产生重要影响。

点击前往ZeroNVS体验入口

举报

  • 相关推荐
  • NVIDIA干得漂亮!最新595.76驱动跑分提升7%:游戏暴增30帧

    NVIDIA近期显卡驱动更新频出问题,595.59版导致风扇停转被撤回,595.71版又存在电压限制问题,导致GPU性能大幅下降。随后紧急发布的595.76热修复驱动解决了电压限制问题。用户实测显示,更新后RTX 50系列显卡性能明显提升,部分游戏帧数增幅达15-30 FPS。华硕PRIME RTX 5080在3DMark测试中创个人记录,Steel Nomad基准测试提升约7%。多位用户证实新驱动让显卡超频状态下能稳定维持高频率运行,游戏性能显著改善。

  • AI日报:OpenAI测试ChatGPT写作模板功能;番茄、拼多多密测AI互动剧;Canvas 正式全美公测

    本期AI日报涵盖多项AI领域动态:OpenAI正测试ChatGPT写作模板功能,支持用户上传个人文档以生成匹配其风格的模板;Google推出Canvas功能,将搜索工具转型为全能创作平台,支持文档深度加工与长文本处理;字节跳动与拼多多开启AI互动剧测试,标志互联网内容生产向“可计算的树状叙事”转型;华为全新AI眼镜曝光,支持拍摄与同声传译,预计4月与Pura90同步发布;阿里确认通义千问负责人林俊旸离职,CEO吴泳铭牵头成立基础模型支持小组;宇树科技开源人形机器人架构OmniXreme,解决高动态动作难题;苹果发布M5系列芯片,AI性能大幅提升,新款MacBook Pro续航超24小时;Google NotebookLM推出“电影级视频概览”新功能,提供沉浸式定制视频以辅助学习。

  • 系列首款Pro Max!余承东提前展示华为畅享90 Pro Max:月底上市

    今天上午10点,华为终端BG董事长余承东在AWE展会与尼格买提同框直播,在展示产品时,余承东提前亮出了即将在月底发布的华为畅享90 Pro Max。 这是华为畅享系列的第一款Pro Max手机,官方透露该机将搭载麒麟芯片 鸿蒙6系统 巨鲸电池。 余承东专门低调,该机续航能力非常强,在超薄机身内塞进了8000多mAh电池,出门完全可以不用带充电宝。 另外,该机还将搭载麒麟8000系列处

  • 首款骁龙8E6 Pro+LPDDR6内存旗舰来了:价格直冲万元 对标iPhone 18 Pro

    内存市场正在经历一场历史性的涨价潮。上游原厂的调价幅度频创新高,与此同时,内存规格的迭代升级也在加速进行,行业正处于技术与价格的双重剧变期。 根据最新爆料,部分安卓厂商已经开始测试顶级的存储方案,即16GB LPDDR6内存配合1TB UFS 5.0闪存。该测试平台基于高通最新的骁龙8 Elite Gen6 Pro处理器。这套顶级存储方案仅会搭载在超大杯机型上,核心目标是对标同期的i

  • OpenClaw 全新搭档:英特尔芯铭凡M2 Pro 重塑隐私与实用平衡

    MINISFORUM铭凡即将发布AI迷你主机M2Pro,搭载英特尔Panther Lake平台,最高可选酷睿Ultra X9388H处理器,支持9600MHz内存频率和180TOPS算力,提供超高带宽与强劲本地AI支持。该主机以“混合模式”运行OpenClaw,结合云端AI,实现更安全、更具性价比的AI体验。应用场景包括7x24小时全天候AI工作助手,自动化处理信息流与内容工作流。混合执行模式优先隐私,兼顾实用性,敏感数据本地处理,仅必要时调用云端AI,降低Token成本。M2Pro旨在推动本地AI与隐私计算创新,为用户提供安心便捷的智能体验。

  • 九号滑板车选购指南:新品MAX G3、E2 Pro、E2、C2 Pro、F3、E3怎么选?

    九号公司于3月4日发布全新旗舰电动滑板车MAX+G3,定位2026年性能旗舰。核心亮点包括40km/h极速、30%爬坡能力、前后双液压减震及11英寸自修复果冻胎,堪称“全地形性能怪兽”。文章还对比了九号旗下多款车型(如C2Pro、E2、F3等),覆盖从1299元青少年款到3699元智能旗舰的不同人群与场景,并解答了售后、质保等常见问题,帮助用户根据通勤距离、性能需求和预算做出选择。

  • 韶音携开放式滤噪新物种OpenFit Pro,重磅亮相AWE2026

    2026年中国家电及消费电子博览会(AWE2026)期间,Shokz韶音以“重塑开放之声”为主题,携新品OpenFit+Pro开放式滤噪耳机、AI眼镜及全系列产品亮相。OpenFit+Pro凭借韶音天旸滤噪技术,打破传统开放式耳机降噪局限,实现开放聆听与专注听音的平衡。同时,展台设置沉浸式体验区,让参观者直观感受其滤噪效果与杜比音效。此外,韶音还展示了多款开放式耳机及创新AI眼镜,呈现其在“音频+智能穿戴”生态的布局。作为开放式耳机领域的引领者,韶音持续以原创技术推动产品高端化与智能化发展。

  • 落地广州!腾讯出行服务上线Robotaxi打车

    腾讯云与文远知行、小马智行深化合作,在“腾讯出行服务”小程序上线Robotaxi打车服务。广州用户可通过小程序呼叫自动驾驶车辆,享受安全便捷的智慧出行体验。该服务也即将在腾讯地图App内上线。近年来,腾讯云与多家Robotaxi企业达成战略合作,在自动驾驶云平台等方面展开深度技术融合,共同打造高效的自动驾驶研发和测试云平台,覆盖从研发、测试到运营的全生命周期产品周期,满足L4级自动驾驶车载模型的大规模训练、并行仿真等研发需求。2025年4月以来,腾讯云与Robotaxi企业深化合作,共同推进L4级自动驾驶Robotaxi的规模化运营,持续为Robotaxi的技术研发、商业运营等环节提供云服务和地图数据支撑。未来,腾讯云将继续与自动驾驶科技公司探索更多创新应用场景,共同为用户打造安全、高效、愉悦的出行体验。

  • 小米最强旗舰!小米18 Pro Max偷跑:首发骁龙8E6 Pro+6.9英寸大屏

    小米最快将于今年9月推出全新的小米18系列。届时小米18、小米18 Pro以及小米18 Pro Max将会同步亮相,开启新一代性能旗舰的序幕。 据可靠爆料,顶级的小米18 Pro Max的屏幕尺寸将达到6.9英寸。该机采用了纯粹的直屏形态,并引入先进的LIPO极窄四等边工艺,使得视觉黑边比上一代更加纤细。 这款新机的屏幕表现还将迎来跨越式升级,小米18 Pro Max将正式支持BT.2020色域。这是由国

  • PropellerAds 助力中国广告主实现全球增长

    随着中国市场竞争加剧,海外拓展成为广告主实现增长的核心策略。全球效果广告平台PropellerAds凭借其稳定性和韧性,为广告主提供多样化广告形式和全球化投放支持。专家MaxJmac分享实战经验,指出出海需转变心态:从追求快速回报转向数据驱动,关注本地化与文化差异,针对不同市场调整创意和呈现方式。投放策略应遵循“先投放、再学习、再分组、最后放大”的结构,初期避免过早定向,保持探索性。建议从成本较低、测试自由度高的市场入手,利用Push通知等低成本形式起步,通过持续测试与优化实现可控增长。

今日大家都在搜的词: