超逼真！普林斯顿大学推3D场景生成模型Infinigen

2023-06-19 15:25 · 稿源：站长之家

站长之家(ChinaZ.com) 6月19日消息:普林斯顿大学研究人员Alexander Raistrick日前发布了一款名为“Infinigen”的开源AI模型，可以帮助人们生成逼真的3D 场景。

据了解，Infinigen 是一款基于开源建模软件 Blender 的免费开源模型，能够通过随机数学规则生成一系列自然界的“植物、动物”场景，并且可以通过输入提示词来自定义地形，并添加“云、雨、雪、雷暴、天火”等自然现象。

生成的场景例

Infinigen模型还能够作为训练数据的生成器，可提供包括“目标检测”、“语义分割”、“姿态估计”、“3D重建”、“视图合成”和“视频生成”一系列特性，可用于计算机视觉相关AI进行场景训练。Infinigen可以自动为各种计算机视觉任务生成高质量的注释，包括光流，3D场景流，深度，表面法线，全光分割，遮挡边界。

研发团队表示，他们的目标是让 Infinigen 帮助到计算机视觉以及相关领域的研究。但Infinigen模型的当下效率还有待改进，其生成一张（两个场景的双拼图像）1080P 的图像需要3.5小时。

项目论文网址:https://arxiv.org/pdf/2306.09310.pdf

项目官网:https://infinigen.org/

（举报）

相关推荐

关键词：

CoDA开源：可在3D场景中检测和命名新物体

CoDA是一个端到端的开放词汇3D目标检测框架，旨在同时实现新对象的定位和分类。它主要包括两大特点:1.3D新对象发现策略:利用3D几何先验和2D语义先验联合发现场景中的新对象，生成新对象的伪标签。CoDA是一个非常创新的开放词汇3D目标检测框架，旨在解决这个领域的两个核心问题:新对象的定位和分类，具有非常高的学术价值和应用前景。

CoDA
荐0.2美元微调就能让ChatGPT彻底破防！普林斯顿、斯坦福发布LLM风险预警：普通用户微调也影响LLM安全性

【新智元导读】微调LLM需谨慎，用良性数据、微调后角色扮演等都会破坏LLM对齐性能!学习调大了还会继续提高风险!虽说预训练语言模型可以在零样本设置下，对新任务实现非常好的泛化性能，但在现实应用时，往往还需要针对特定用例对模型进行微调。微调后的模型安全性如何?是否会遗忘之前接受的对齐训练吗?面向用户时是否会输出有害内容?提供LLM服务的厂商也需要考虑到，当给终端用户开放模型微调权限后，安全性是否会下降?最近，普林斯顿大学、IBM、斯坦福等机构通过redteam实验证明，只需要几个恶意样本即可大幅降低预训练模型的安全性，甚至普通用户的微调也会影响模型的安全性。不管真正的原因是什么，研究人员假设，如果能够在未来的对齐工作中巩固那些不太稳健的危害类别，可能能够进一步提高良性微调情况下的整体安全性。

ChatGPT LLM
Auctoria利用生成AI创建3D视频游戏模型

波兰虚拟现实游戏开发公司CarbonStudio的联合创始人AleksanderCaban多年前观察到现代游戏设计中存在一个重要问题:手动创建视频游戏环境中的基本元素，如岩石、山丘、路径等，通常是耗时且繁琐的过程。为了解决这个问题，Caban决定开发技术来自动化这个过程。我们的团队两年前开始开发这个工具，使我们能够拥有一个可供使用的产品。

Auctoria AI视频
创新型生成模型CityDreamer：一键生成无边界的3D城市

关于3D自然场景生成的研究已经很多，但对于3D城市生成的研究相对较少。这是因为在城市环境中，人们对结构扭曲更加敏感生成3D城市比生成3D自然场景更为复杂。这一技术的应用前景非常广阔，将在游戏、城市规划、虚拟现实等领域发挥关键作用。

CityDreamer AI头条
Kandinsky1：3.3亿参数强大模型，文本生成逼真图像

计算机视觉和生成建模领域取得了显著进展，推动了文本到图像生成的不断发展。各种生成架构，包括基于扩散的模型，在提高生成图像的质量和多样性方面发挥了关键作用。研究人员强调了解决内容问题的需求，建议采取实时监管或强大的分类器来减轻不良输出。

Kandinsky1 大模型
EmojiGen：一个开源表情符号生成器网站

EmojiGen是一个开源的表情符号生成器。它使用了先进的AI技术，可以根据用户的文字描述快速生成有趣的表情符号图片。这个开源项目也为其他开发者提供了参考，可以进行二次开发打造出更多优秀的AI应用。

EmojiGen
秒杀Midjourney！Genmo AI可3秒作画成图并且生成视频

Genmo是一款基于人工智能的创意产品，可以通过语言描述自动生成视频、图像、3D模型等创意内容。Genmo提供多种创意工具，是内容创作者、设计师、艺术家的强大创意助手。Genmo会持续迭代升级技术，赋能更多创作者开启创造之旅。

Genmo
统一图像和文字生成的MiniGPT-5来了：Token变Voken，模型不仅能续写，还会自动配图了

大模型正在实现语言和视觉的跨越，有望无缝地理解和生成文本和图像内容。在最近的一系列研究中，多模态特征集成不仅是一种不断发展的趋势已经带来了从多模态对话到内容创建工具等关键进步。更多研究细节，可参考原论文。

MiniGPT-5
荐统一图像和文字生成的MiniGPT-5来了：Token变Voken，模型不仅能续写，还会自动配图了

大模型正在实现语言和视觉的跨越，有望无缝地理解和生成文本和图像内容。在最近的一系列研究中，多模态特征集成不仅是一种不断发展的趋势已经带来了从多模态对话到内容创建工具等关键进步。更多研究细节，可参考原论文。

MiniGPT-5 Token
AutoAgents：基于LLM的自动代理生成框架

AutoAgents是一个创新性的框架，旨在通过GPT生成不同的角色，以形成协作实体，用于处理复杂任务。无需手动编写规则或代理，AutoAgents利用LLM的能力，可以根据您设定的目标生成多个专家角色代理，这些代理可以协同工作，执行复杂任务，无论是信息搜索、问题解答还是其他各种应用。6.操作:执行计划中专家角色的具体操作，如调用工具或输出结果。

AutoAgents LLM

今日大家都在搜的词：

热文

3 天
7天

超逼真！普林斯顿大学推3D场景生成模型Infinigen

CoDA开源：可在3D场景中检测和命名新物体

荐0.2美元微调就能让ChatGPT彻底破防！普林斯顿、斯坦福发布LLM风险预警：普通用户微调也影响LLM安全性

Auctoria利用生成AI创建3D视频游戏模型

创新型生成模型CityDreamer：一键生成无边界的3D城市

Kandinsky1：3.3亿参数强大模型，文本生成逼真图像

EmojiGen：一个开源表情符号生成器网站

秒杀Midjourney！Genmo AI可3秒作画成图并且生成视频

统一图像和文字生成的MiniGPT-5来了：Token变Voken，模型不仅能续写，还会自动配图了

荐统一图像和文字生成的MiniGPT-5来了：Token变Voken，模型不仅能续写，还会自动配图了

AutoAgents：基于LLM的自动代理生成框架

今日大家都在搜的词：

热文

苹果iOS18.7.1正式版更新发布重要安全修复

OPPO A6开售：售价1599元起搭载7000mAh六年长寿电池

AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型

罗永浩替小米说公道话：海报小字是行业陋习

腾讯QQ闪传功能上线支持单文件最大10GB传输

苹果iOS 26.0.1正式版发布：修复iPhone 17系列Wi-Fi、拍照等Bu

OPPO Find X9系列定档：10月16日发布

鸿蒙智行享界S9T上市13天大定破 15000 台

王腾小红书账号注销快手账号已被封禁抖音账号已私密视频号已

鸿蒙智行9月交付新车52916台：全系累计交付突破95万台

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

苹果iOS18.7.1正式版更新发布重要安全修复

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

OPPO A6开售：售价1599元起搭载7000mAh六年长寿电池

小米17系列开售5分钟破25年国产手机首销纪录

AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型

AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Co

罗永浩替小米说公道话：海报小字是行业陋习

iPhone调休闹钟上热搜苹果客服回应：需手动设置

站长商机