InseRF技术:在图片中通过文本提示生成逼真的3D物体

2024-01-12 10:10 · 稿源：站长之家

划重点:
1. 🌐 **新技术亮点**:InseRF技术通过文本提示和2D边界框，成功在3D场景中生成一致的物体，无需明确的3D信息。
2. 🚀 **性能超越**:实验证明，InseRF相较于现有方法表现更出色，能够在NeRF中插入一致的物体，为生成式AI领域带来新突破。
3. 🌈 **未来展望**:尽管受到底层模型能力的限制，但团队计划通过未来模型的改进，进一步优化InseRF性能。

站长之家（ChinaZ.com）1月12日消息:近日，瑞士苏黎世联邦理工学院和Google苏黎世的研究人员联合提出了一项名为InseRF的新技术，该技术引起了科技界的广泛关注。该技术通过文本提示和2D边界框，成功在3D场景中生成一致的物体，无需明确的3D信息。这一创新的方法为生成式AI领域注入了新的活力。

新技术亮:

InseRF技术的独特之处在于，它结合了Neural Radiance Fields（NeRFs）和生成式AI的最新进展。通过在2D图像上标记变化区域，并使用文本提示描述变化，例如“在托盘上放入面包”，InseRF生成了一致的3D物体。该技术的核心在于使用扩散模型和NeRFs，从2D视图中生成物体并估计深度信息，然后更新NeRF以生成逼真的3D物体，如下图托盘就增加了个面包。

性能超越:

实验结果表明，InseRF在NeRF中插入一致的物体方面表现优越，相较于现有方法具有更高的性能。研究人员在MipNeRF-360和Instruct-NeRF2NeRF数据集上对室内外场景进行了测试，清晰展示了InseRF在局部修改场景和插入3D一致物体方面的卓越能力。

尽管InseRF的性能受到底层生成式2D和3D模型能力的限制，但研究团队表示，未来对这些模型的改进将有望轻松应用于InseRF技术。团队计划在未来测试其他方法，包括改进阴影效果和提升生成物体及其环境质量的方法，以进一步推动该技术的发展。

InseRF技术的提出为生成式AI领域带来了新的可能性，为在3D场景中插入一致物体提供了一种创新的方法。随着技术的不断发展和改进，InseRF有望成为未来生成式AI领域的重要技术之一。

项目网址入口:https://top.aibase.com/tool/inserf

（举报）

相关推荐

关键词：

新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

苹果因自研大模型项目遇瓶颈，决定引入谷歌Gemini大模型升级Siri，计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数，将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能，支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送，后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

苹果谷歌Gemini Siri升级
Hugging Face创始人x小红书技术副总裁对谈：开源、AI与技术人的成长

小红书科技与Red++ Academy在1024程序员节举办直播，技术副总裁凯奇、语音模型负责人风龙与Hugging Face联合创始人Thomas Wolf围绕三大核心观点展开AMA对话：AI编程正成为基础能力；开源是技术发展的核心引擎；实现有"人味"的AGI路径清晰但仍需攻克创造力、复杂环境感知等难题。讨论覆盖开源价值、AGI发展瓶颈、AI人味化实践，强调技术人需提升问题定义与框架性解决能力，并分享了AI编码提效、学习新技术的方法。直播展现小红书从文本模型到语音模型的开源布局，旨在降低技术使用门槛，推动社区共进。

1024程序员节小红书Red Academy
有AI就有无限可能，灰豚AI发布新一代GEO系统

11月1日，灰豚AI发布新一代GEO系统，突破传统仅支持文本内容优化的局限，全面支持国内短视频平台作品优化，实现近乎零算力成本。该技术被视作行业重大创新，是当前国内GEO源头厂商的重要突破。系统通过AI训练提升企业在生成式搜索中的品牌影响力，助力企业获得竞争优势。未来电商将从平台化转向AI化，灰豚GEO系统支持多种合作模式，让企业以业务增长为导向，抢占AI市场先机。

灰豚AI GEO系统短视频优化
逗哥配音团队：以硬核技术铺就AI创作未来，重塑短视频创作生态

逗哥配音平台凭借AI语音技术革新，为短视频创作者提供全方位赋能。平台集成上千款覆盖多年龄风格的真人声音资源，支持多语言合成，具备媲美真人的情感表达能力。其核心功能包括AI角色分配、5秒极速克隆及20项精细调节工具，结合去水印、字幕生成等实用功能，实现一站式创作。已获超百位大V推荐，用户量破千万，累计播放量达十万亿级，显著降低创作门槛，助力各领域内容生产。团队将持续优化技术，拓展功能生态。

AI配音内容创作语音合成
AI漫剧，比短剧更短剧？

“是个人就能起飞的风口”，又来了。在短剧行业摸爬两年后，飞鸟再次感受到了熟悉的躁动。朋友圈、群聊、行业会都在谈论同一个词——“漫剧”。有人劝他趁早上车，理由几乎与当年如出一辙:“就像当时的短剧，是个人就能起飞。” 所谓漫剧，并没有统一的定义。它们形式多样:有的是用游戏编辑器生成的3D动画，有的是将平面漫画动态化，还有的直接以“熊猫头”等

漫剧短剧行业 3D动画
从识别到修复，联想想帮帮AI服务智能体打造你的AI智能维修管家

AI时代重塑陪伴形式，联想“想帮帮AI服务智能体”以公益之心推出，通过五大功能（智玩、智验、智检、智修、智换）构建全流程闭环服务。它能随时响应、精准诊断、智能优化系统，一键解决电脑卡顿等问题，让用户省时省心。该服务强调责任与长期守护，结合北京领养日公益理念，传递科技向善、服务有爱的智能温度，重新定义AI陪伴的全部意义。

AI陪伴领养代替购买智能服务
横扫拉美、力压字节系，「AI届的4399」成为出海AI应用新王？

在 Sensor Tower 发布的 Q3应用出海榜单中，我们注意到了一个特别的 AI 应用「Seekee」。它空降下载榜 Top9，是当季度在海外获得最多下载量的出海 AI 应用，而由字节跳动出品、近一段时间炙手可热的「Cici」尽管排名上涨，但仅位列第13。

AI应用出海榜单下载榜
AI排名查询工具推荐:如何查询竞争对手在AI回答中的曝光

AI搜索时代品牌面临新挑战：用户直接询问AI工具推荐，若品牌未被提及将流失流量。数据显示，2024年58.5%的谷歌搜索为零点击，ChatGPT日均查询超百亿次。AI推荐高度集中，平均每次仅引用2-7个品牌。建议使用专业GEO监控工具（如AIBase）追踪主流AI平台曝光情况，及时优化内容策略。核心逻辑已从“让用户搜到你”转变为“让AI推荐你”。
法大夫AI法律智能体首次亮相法博会引关注！“法小助”斩获卓越技术奖！

2025年10月25-26日，深圳法律服务博览会（法博会）在福田会展中心举办。本届展会聚焦“法律服务创新保障科技与产业创新”，汇聚众多法律科技企业。法大夫推出的AI法律智能体矩阵备受关注，其与广东宝城律师事务所联合研发的“法小助”AI律师智能体成为亮点，荣获法博会法律科技产品大赛“卓越技术奖”。该智能体集成九大核心功能，覆盖法律咨询、合同审查、文书生成等场景，提供24小时不间断服务，通过“Web端+小程序+智能终端”实现多端覆盖，已落地多地法院及企业园区，有效提升法律服务效率与普惠性。

法律服务创新 AI法律智能体法律科技
AI搜索优化工具推荐：产品描述如何写才容易被AI引用

通过测试发现，优化产品描述能显著提升AI推荐排名。关键技巧包括：开篇明确产品类型及用途，避免模糊表述；用具体数据替代空泛描述，如“被10万家企业使用”；突出差异化功能，比如“支持离线编辑+双向链接”。建议使用AIBase等工具监测曝光数据，通过持续优化循环，曝光率可提升20-30%。在AI搜索时代，产品描述需为算法优化，写清楚、写具体、写出差异。

今日大家都在搜的词：

热文

3 天
7天

InseRF技术:在图片中通过文本提示生成逼真的3D物体

新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

Hugging Face创始人x小红书技术副总裁对谈：开源、AI与技术人的成长

有AI就有无限可能，灰豚AI发布新一代GEO系统

逗哥配音团队：以硬核技术铺就AI创作未来，重塑短视频创作生态

AI漫剧，比短剧更短剧？

从识别到修复，联想想帮帮AI服务智能体打造你的AI智能维修管家

横扫拉美、力压字节系，「AI届的4399」成为出海AI应用新王？

AI排名查询工具推荐:如何查询竞争对手在AI回答中的曝光

法大夫AI法律智能体首次亮相法博会引关注！“法小助”斩获卓越技术奖！

AI搜索优化工具推荐：产品描述如何写才容易被AI引用

今日大家都在搜的词：

热文

阿里回应饿了么更名：正处于灰度测试阶段

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

vivo Y500 Pro官宣11月10日发布：同档首发2亿HP5主摄

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

鸿蒙智行新款享界S9官宣11月7日开订

B站回应拉黑指定用户可屏蔽开屏广告：不实信息

问界M7提车关爱计划发布：等车超10周最高可补贴10000元

鸿蒙HarmonyOS 6与iOS数据互传功能预计12月上线

AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功

DeepSeek崩了上热搜页面显示“服务器繁忙”

阿里回应饿了么更名：正处于灰度测试阶段

特斯拉Cybercab不配备方向盘和踏板预计2026年二季度下线

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

马斯克称若发现外星人证据就公开

OPPO ColorOS 16正式版11月升级机型公布：支持23款机型

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

何小鹏：小鹏X9超级增程是全球续航最长的大七座车

站长商机