首页 > 业界 > 关键词  > AI模型最新资讯  > 正文

超逼真!普林斯顿大学推3D场景生成模型Infinigen

2023-06-19 15:25 · 稿源:站长之家

站长之家(ChinaZ.com) 6月19日 消息:普林斯顿大学研究人员Alexander Raistrick日前发布了一款名为“Infinigen”的开源AI模型,可以帮助人们生成逼真的3D 场景。

据了解,Infinigen 是一款基于开源建模软件 Blender 的免费开源模型,能够通过随机数学规则生成一系列自然界的“植物、动物”场景,并且可以通过输入提示词来自定义地形,并添加“云、雨、雪、雷暴、天火”等自然现象。

image.png

生成的场景例

Infinigen模型还能够作为训练数据的生成器,可提供包括“目标检测”、“语义分割”、“姿态估计”、“3D重建”、“视图合成”和“视频生成”一系列特性,可用于计算机视觉相关AI进行场景训练。Infinigen可以自动为各种计算机视觉任务生成高质量的注释,包括光流,3D场景流,深度,表面法线,全光分割,遮挡边界。

研发团队表示,他们的目标是让 Infinigen 帮助到计算机视觉以及相关领域的研究。但Infinigen模型的当下效率还有待改进,其生成一张(两个场景的双拼图像)1080P 的图像需要3.5小时。

项目论文网址:https://arxiv.org/pdf/2306.09310.pdf

项目官网:https://infinigen.org/

举报

  • 相关推荐
  • CoDA开源:可在3D场景中检测和命名新物体

    CoDA是一个端到端的开放词汇3D目标检测框架,旨在同时实现新对象的定位和分类。它主要包括两大特点:1.3D新对象发现策略:利用3D几何先验和2D语义先验联合发现场景中的新对象,生成新对象的伪标签。CoDA是一个非常创新的开放词汇3D目标检测框架,旨在解决这个领域的两个核心问题:新对象的定位和分类,具有非常高的学术价值和应用前景。

  • 0.2美元微调就能让ChatGPT彻底破防!普林斯顿、斯坦福发布LLM风险预警:普通用户微调也影响LLM安全性

    【新智元导读】微调LLM需谨慎,用良性数据、微调后角色扮演等都会破坏LLM对齐性能!学习调大了还会继续提高风险!虽说预训练语言模型可以在零样本设置下,对新任务实现非常好的泛化性能,但在现实应用时,往往还需要针对特定用例对模型进行微调。微调后的模型安全性如何?是否会遗忘之前接受的对齐训练吗?面向用户时是否会输出有害内容?提供LLM服务的厂商也需要考虑到,当给终端用户开放模型微调权限后,安全性是否会下降?最近,普林斯顿大学、IBM、斯坦福等机构通过redteam实验证明,只需要几个恶意样本即可大幅降低预训练模型的安全性,甚至普通用户的微调也会影响模型的安全性。不管真正的原因是什么,研究人员假设,如果能够在未来的对齐工作中巩固那些不太稳健的危害类别,可能能够进一步提高良性微调情况下的整体安全性。

  • Auctoria利用生成AI创建3D视频游戏模型

    波兰虚拟现实游戏开发公司CarbonStudio的联合创始人AleksanderCaban多年前观察到现代游戏设计中存在一个重要问题:手动创建视频游戏环境中的基本元素,如岩石、山丘、路径等,通常是耗时且繁琐的过程。为了解决这个问题,Caban决定开发技术来自动化这个过程。我们的团队两年前开始开发这个工具,使我们能够拥有一个可供使用的产品。

  • 创新型生成模型CityDreamer:一键生成无边界的3D城市

    关于3D自然场景生成的研究已经很多,但对于3D城市生成的研究相对较少。这是因为在城市环境中,人们对结构扭曲更加敏感生成3D城市比生成3D自然场景更为复杂。这一技术的应用前景非常广阔,将在游戏、城市规划、虚拟现实等领域发挥关键作用。

  • Kandinsky1:3.3亿参数强大模型,文本生成逼真图像

    计算机视觉和生成建模领域取得了显著进展,推动了文本到图像生成的不断发展。各种生成架构,包括基于扩散的模型,在提高生成图像的质量和多样性方面发挥了关键作用。研究人员强调了解决内容问题的需求,建议采取实时监管或强大的分类器来减轻不良输出。

  • EmojiGen:一个开源表情符号生成器网站

    EmojiGen是一个开源的表情符号生成器。它使用了先进的AI技术,可以根据用户的文字描述快速生成有趣的表情符号图片。这个开源项目也为其他开发者提供了参考,可以进行二次开发打造出更多优秀的AI应用。

  • 秒杀Midjourney!Genmo AI可3秒作画成图并且生成视频

    Genmo是一款基于人工智能的创意产品,可以通过语言描述自动生成视频、图像、3D模型等创意内容。Genmo提供多种创意工具,是内容创作者、设计师、艺术家的强大创意助手。Genmo会持续迭代升级技术,赋能更多创作者开启创造之旅。

  • 统一图像和文字生成的MiniGPT-5来了:Token变Voken,模型不仅能续写,还会自动配图了

    大模型正在实现语言和视觉的跨越,有望无缝地理解和生成文本和图像内容。在最近的一系列研究中,多模态特征集成不仅是一种不断发展的趋势已经带来了从多模态对话到内容创建工具等关键进步。更多研究细节,可参考原论文。

  • 统一图像和文字生成的MiniGPT-5来了:Token变Voken,模型不仅能续写,还会自动配图了

    大模型正在实现语言和视觉的跨越,有望无缝地理解和生成文本和图像内容。在最近的一系列研究中,多模态特征集成不仅是一种不断发展的趋势已经带来了从多模态对话到内容创建工具等关键进步。更多研究细节,可参考原论文。

  • AutoAgents:基于LLM的自动代理生成框架

    AutoAgents是一个创新性的框架,旨在通过GPT生成不同的角色,以形成协作实体,用于处理复杂任务。无需手动编写规则或代理,AutoAgents利用LLM的能力,可以根据您设定的目标生成多个专家角色代理,这些代理可以协同工作,执行复杂任务,无论是信息搜索、问题解答还是其他各种应用。6.操作:执行计划中专家角色的具体操作,如调用工具或输出结果。

今日大家都在搜的词: