首页 > 业界 > 关键词  > InseRF最新资讯  > 正文

InseRF技术:在图片中通过文本提示生成逼真的3D物体

2024-01-12 10:10 · 稿源:站长之家

划重点:

1. 🌐 **新技术亮点**:InseRF技术通过文本提示和2D边界框,成功在3D场景中生成一致的物体,无需明确的3D信息。

2. 🚀 **性能超越**:实验证明,InseRF相较于现有方法表现更出色,能够在NeRF中插入一致的物体,为生成式AI领域带来新突破。

3. 🌈 **未来展望**:尽管受到底层模型能力的限制,但团队计划通过未来模型的改进,进一步优化InseRF性能。

站长之家(ChinaZ.com)1月12日 消息:近日,瑞士苏黎世联邦理工学院和Google苏黎世的研究人员联合提出了一项名为InseRF的新技术,该技术引起了科技界的广泛关注。该技术通过文本提示和2D边界框,成功在3D场景中生成一致的物体,无需明确的3D信息。这一创新的方法为生成式AI领域注入了新的活力。

image.png

新技术亮:

InseRF技术的独特之处在于,它结合了Neural Radiance Fields(NeRFs)和生成式AI的最新进展。通过在2D图像上标记变化区域,并使用文本提示描述变化,例如“在托盘上放入面包”,InseRF生成了一致的3D物体。该技术的核心在于使用扩散模型和NeRFs,从2D视图中生成物体并估计深度信息,然后更新NeRF以生成逼真的3D物体,如下图托盘就增加了个面包。

image.png

image.png

性能超越:

实验结果表明,InseRF在NeRF中插入一致的物体方面表现优越,相较于现有方法具有更高的性能。研究人员在MipNeRF-360和Instruct-NeRF2NeRF数据集上对室内外场景进行了测试,清晰展示了InseRF在局部修改场景和插入3D一致物体方面的卓越能力。

尽管InseRF的性能受到底层生成式2D和3D模型能力的限制,但研究团队表示,未来对这些模型的改进将有望轻松应用于InseRF技术。团队计划在未来测试其他方法,包括改进阴影效果和提升生成物体及其环境质量的方法,以进一步推动该技术的发展。

InseRF技术的提出为生成式AI领域带来了新的可能性,为在3D场景中插入一致物体提供了一种创新的方法。随着技术的不断发展和改进,InseRF有望成为未来生成式AI领域的重要技术之一。

项目网址入口:https://top.aibase.com/tool/inserf

举报

  • 相关推荐
  • 新Siri或明年春季发布 苹果公司或引入谷歌Gemini大模型 AI技术

    苹果因自研大模型项目遇瓶颈,决定引入谷歌Gemini大模型升级Siri,计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数,将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能,支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送,后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

  • Hugging Face创始人x小红书技术副总裁对谈:开源、AI与技术人的成长

    小红书科技与Red++ Academy在1024程序员节举办直播,技术副总裁凯奇、语音模型负责人风龙与Hugging Face联合创始人Thomas Wolf围绕三大核心观点展开AMA对话:AI编程正成为基础能力;开源是技术发展的核心引擎;实现有"人味"的AGI路径清晰但仍需攻克创造力、复杂环境感知等难题。讨论覆盖开源价值、AGI发展瓶颈、AI人味化实践,强调技术人需提升问题定义与框架性解决能力,并分享了AI编码提效、学习新技术的方法。直播展现小红书从文本模型到语音模型的开源布局,旨在降低技术使用门槛,推动社区共进。

  • 有AI就有无限可能,灰豚AI发布新一代GEO系统

    11月1日,灰豚AI发布新一代GEO系统,突破传统仅支持文本内容优化的局限,全面支持国内短视频平台作品优化,实现近乎零算力成本。该技术被视作行业重大创新,是当前国内GEO源头厂商的重要突破。系统通过AI训练提升企业在生成式搜索中的品牌影响力,助力企业获得竞争优势。未来电商将从平台化转向AI化,灰豚GEO系统支持多种合作模式,让企业以业务增长为导向,抢占AI市场先机。

  • 逗哥配音团队:以硬核技术铺就AI创作未来,重塑短视频创作生态

    逗哥配音平台凭借AI语音技术革新,为短视频创作者提供全方位赋能。平台集成上千款覆盖多年龄风格的真人声音资源,支持多语言合成,具备媲美真人的情感表达能力。其核心功能包括AI角色分配、5秒极速克隆及20项精细调节工具,结合去水印、字幕生成等实用功能,实现一站式创作。已获超百位大V推荐,用户量破千万,累计播放量达十万亿级,显著降低创作门槛,助力各领域内容生产。团队将持续优化技术,拓展功能生态。

  • AI漫剧,比短剧更短剧?

    “是个人就能起飞的风口”,又来了。 在短剧行业摸爬两年后,飞鸟再次感受到了熟悉的躁动。朋友圈、群聊、行业会都在谈论同一个词——“漫剧”。有人劝他趁早上车,理由几乎与当年如出一辙:“就像当时的短剧,是个人就能起飞。” 所谓漫剧,并没有统一的定义。它们形式多样:有的是用游戏编辑器生成的3D动画,有的是将平面漫画动态化,还有的直接以“熊猫头”等

  • 从识别到修复,联想想帮帮AI服务智能体打造你的AI智能维修管家

    AI时代重塑陪伴形式,联想“想帮帮AI服务智能体”以公益之心推出,通过五大功能(智玩、智验、智检、智修、智换)构建全流程闭环服务。它能随时响应、精准诊断、智能优化系统,一键解决电脑卡顿等问题,让用户省时省心。该服务强调责任与长期守护,结合北京领养日公益理念,传递科技向善、服务有爱的智能温度,重新定义AI陪伴的全部意义。

  • 横扫拉美、力压字节系,「AI届的4399」成为出海AI应用新王?

    在 Sensor Tower 发布的 Q3应用出海榜单中,我们注意到了一个特别的 AI 应用「Seekee」。 它空降下载榜 Top9,是当季度在海外获得最多下载量的出海 AI 应用,而由字节跳动出品、近一段时间炙手可热的「Cici」尽管排名上涨,但仅位列第13。

  • AI排名查询工具推荐:如何查询竞争对手在AI回答中的曝光

    AI搜索时代品牌面临新挑战:用户直接询问AI工具推荐,若品牌未被提及将流失流量。数据显示,2024年58.5%的谷歌搜索为零点击,ChatGPT日均查询超百亿次。AI推荐高度集中,平均每次仅引用2-7个品牌。建议使用专业GEO监控工具(如AIBase)追踪主流AI平台曝光情况,及时优化内容策略。核心逻辑已从“让用户搜到你”转变为“让AI推荐你”。

  • 法大夫AI法律智能体首次亮相法博会引关注!“法小助”斩获卓越技术奖!

    2025年10月25-26日,深圳法律服务博览会(法博会)在福田会展中心举办。本届展会聚焦“法律服务创新保障科技与产业创新”,汇聚众多法律科技企业。法大夫推出的AI法律智能体矩阵备受关注,其与广东宝城律师事务所联合研发的“法小助”AI律师智能体成为亮点,荣获法博会法律科技产品大赛“卓越技术奖”。该智能体集成九大核心功能,覆盖法律咨询、合同审查、文书生成等场景,提供24小时不间断服务,通过“Web端+小程序+智能终端”实现多端覆盖,已落地多地法院及企业园区,有效提升法律服务效率与普惠性。

  • AI搜索优化工具推荐:产品描述如何写才容易被AI引用

    通过测试发现,优化产品描述能显著提升AI推荐排名。关键技巧包括:开篇明确产品类型及用途,避免模糊表述;用具体数据替代空泛描述,如“被10万家企业使用”;突出差异化功能,比如“支持离线编辑+双向链接”。建议使用AIBase等工具监测曝光数据,通过持续优化循环,曝光率可提升20-30%。在AI搜索时代,产品描述需为算法优化,写清楚、写具体、写出差异。

今日大家都在搜的词: