首页 > 业界 > 关键词  > InseRF最新资讯  > 正文

InseRF技术:在图片中通过文本提示生成逼真的3D物体

2024-01-12 10:10 · 稿源:站长之家

划重点:

1. 🌐 **新技术亮点**:InseRF技术通过文本提示和2D边界框,成功在3D场景中生成一致的物体,无需明确的3D信息。

2. 🚀 **性能超越**:实验证明,InseRF相较于现有方法表现更出色,能够在NeRF中插入一致的物体,为生成式AI领域带来新突破。

3. 🌈 **未来展望**:尽管受到底层模型能力的限制,但团队计划通过未来模型的改进,进一步优化InseRF性能。

站长之家(ChinaZ.com)1月12日 消息:近日,瑞士苏黎世联邦理工学院和Google苏黎世的研究人员联合提出了一项名为InseRF的新技术,该技术引起了科技界的广泛关注。该技术通过文本提示和2D边界框,成功在3D场景中生成一致的物体,无需明确的3D信息。这一创新的方法为生成式AI领域注入了新的活力。

image.png

新技术亮:

InseRF技术的独特之处在于,它结合了Neural Radiance Fields(NeRFs)和生成式AI的最新进展。通过在2D图像上标记变化区域,并使用文本提示描述变化,例如“在托盘上放入面包”,InseRF生成了一致的3D物体。该技术的核心在于使用扩散模型和NeRFs,从2D视图中生成物体并估计深度信息,然后更新NeRF以生成逼真的3D物体,如下图托盘就增加了个面包。

image.png

image.png

性能超越:

实验结果表明,InseRF在NeRF中插入一致的物体方面表现优越,相较于现有方法具有更高的性能。研究人员在MipNeRF-360和Instruct-NeRF2NeRF数据集上对室内外场景进行了测试,清晰展示了InseRF在局部修改场景和插入3D一致物体方面的卓越能力。

尽管InseRF的性能受到底层生成式2D和3D模型能力的限制,但研究团队表示,未来对这些模型的改进将有望轻松应用于InseRF技术。团队计划在未来测试其他方法,包括改进阴影效果和提升生成物体及其环境质量的方法,以进一步推动该技术的发展。

InseRF技术的提出为生成式AI领域带来了新的可能性,为在3D场景中插入一致物体提供了一种创新的方法。随着技术的不断发展和改进,InseRF有望成为未来生成式AI领域的重要技术之一。

项目网址入口:https://top.aibase.com/tool/inserf

举报

  • 相关推荐
  • 日销破千元!AI生成3D挂件,被我们卖爆了

    先说结论:我们花15天做的AI3D挂件,在线下卖爆了,单日营收破千元!故事的开始,是因为我们发现把AI3D打印手办做成一门小生意的可行性越来越高,这也激发了我们的“搞钱基因”。再加上前不久新榜在上海举办了「新榜内容节」,一拍即合,我们于是做了一批模型去大会现场摆摊试水!最后结果还不错,单日最高收入突破1000元,是我们“创业史”上的一个高光表现。欢迎大家

  • 阿里开源通义新模型:指定首尾图片生成视频

    快科技4月18日消息,据报道,阿里巴巴旗下通义万相宣布开源其创新视频生成技术首尾帧生视频14B模型。这项突破性AI技术能够根据用户提供的起始和结束画面,智能生成720p高清过渡视频,为视频创作带来全新可能。该模型通过先进的深度学习算法,能够精准理解输入画面的内容、风格及主题特征。当用户提供首尾两帧图像后,模型会智能分析画面中的视觉元素,包括物体形�

  • ​上海毅速推出第三代模具3D打印专机E3系列,引领模具制造技术革新

    导读:近年来,金属3D打印技术在模具制造领域得到了广泛的应用,模具行业正在迎来一场前所未有的技术变革,随着应用的逐渐深入,模具专用的金属3D打印机应运而生。2025 年 4 月 15 日,上海毅速激光科技有限公司(以下简称“毅速”)正式发布了其第三代模具3D打印专机系列——E3- 420 和E3-520。这一新品的推出,标志着模具制造行业向增材制造迈出了重要一步。毅速E3- 420 �

  • ChatGPT上线库功能:可管理AI生成图片

    快科技4月16日消息,据报道,OpenAI近日宣布将为ChatGPT推出全新的Image Library图库功能,该功能将帮助用户更高效地管理和查看AI生成的图像。这项创新功能将逐步向所有用户开放,包括移动端和网页端的免费版、Plus版及Pro版用户。新功能的设计充分考虑了用户体验的便捷性。用户只需点击ChatGPT侧边栏的Library入口,就能进入一个直观的图像网格界面。在这个界面中,用户可以轻�

  • 1至5元不等!有人开始售卖ChatGPT生成的“吉卜力风格”图片

    SNS上出现了售卖吉卜力风格图片的“交易”,一些二手交易平台上声称收到钱后就会帮忙制作吉卜力风格图片的帖子也层出不穷。吉卜力风格的图片转化功能在全球备受欢迎,近一周时间,通过ChatGPT制作的相关图片数量就超过了7亿张。想想他们为了打造某种独特风格所付出的努力,如今却遭遇这种无法受到著作权法保护的情况,无疑会极大地打击创作者们的积极性。

  • AI日报:腾讯混元3D生成模型2.5版本发布;海螺推出像人物参考功能;百度上线移动端超级智能体心响App

    本文介绍了多款AI领域的新产品和技术进展:1)Kortix-AI推出开源通用AI智能体平台Suna;2)腾讯混元3D生成模型升级至2.5版本;3)海螺AI推出基于单张图像生成多角度角色图像功能;4)百度发布"心响"App整合多智能体协作;5)Nari Labs开源媲美真人的对话语音模型Dia;6)Grok新增视觉处理和多语言支持;7)Genspark推出AI幻灯片工具;8)Character.AI发布让静态图片"说话"的AvatarFX模型;9)pad.ws结合白板和代码编辑器;10)OpenBMB开源社区推出长文本生成模型"卷姬";11)腾讯推出AI阅读助手"企鹅读伴";12)OpenAI有意收购Chrome浏览器;13)字节跳动调整AI产品线布局。这些创新展现了AI技术在自动化、3D生成、语音交互、内容创作等领域的快速发展。

  • 聚首华南,2025下半年增材制造、3D 打印的顶尖展览与活动推荐

    2025年全球3D打印行业将迎来系列盛会。4月西安论坛成功举办后,下半年将迎来深圳Formnext Asia(8月26-28日)、东京论坛(9月25-26日)和法兰克福Formnext展会(11月18-21日)三大国际活动。这些平台将汇聚全球顶尖企业,展示航空航天、医疗健康、汽车工业等领域的最新技术成果,特别关注中国企业的快速成长。法兰克福展会预计吸引超900家展商,中国展商数量有望再创新高。系列活动将搭建全球产业交流平台,推动3D打印技术创新与商业应用深度融合。

  • 10倍精度升级!腾讯混元3D模型v2.5版本发布

    腾讯混元3D模型升级至v2.5版本,建模精度和贴图真实度显著提升。新版本参数体量从1B增至10B,有效面片数增加超10倍,支持1024几何分辨率。纹理系统支持4K高清贴图和凹凸细节,率先支持多视图生成PBR模型。针对动画场景优化骨骼蒙皮系统,支持非标准姿态自动绑定。新增文生/图生3D减面模型、多视图建模模板等专业工作流。混元3D v2.5已全面更新至腾讯AI创作引擎,免费生成额度提升至每日20次,并正式上线腾讯云API面向企业开放。GitHub开源版本累计Star超1.2万。

  • 曝iPhone 18 Pro内测屏下3D人脸识别:苹果迈入单挖孔屏时代

    这意味着iPhone 18 Pro系列正式迈入单挖孔屏时代,向安卓主流屏幕形态看齐。需要注意的是,安卓阵营普遍采用单挖孔 屏幕指纹识别方案,而iPhone则是采用屏下3D人脸识别方案,不支持屏幕指纹。

  • 创想三维十一周年庆典:多款新品发布,共筑3D打印新生态

    4月9日,全球消费级3D打印领军品牌创想三维在中国深圳、美国底特律两地举办“创想三维十一周年庆典暨春季新品发布会”。公司联合创始人陈春、敖丹军、刘辉林、唐京科与来自全球的行业专家、核心经销商合作伙伴、供应链合作伙伴及媒体代表共同见证品牌里程碑时刻。创想三维将持续加码核心技术创新,通过技术突破、生态共建与用户共创,持续推动3D打印技术从“小�