首页 > 业界 > 关键词  > CityDreamer最新资讯  > 正文

创新型生成模型CityDreamer:一键生成无边界的3D城市

2023-10-15 15:31 · 稿源:站长之家

站长之家(ChinaZ.com) 10月15日 消息:近年来,关于3D 自然场景生成的研究已经很多,但对于3D 城市生成的研究相对较少。这是因为在城市环境中,人们对结构扭曲更加敏感,而生成3D 城市比生成3D 自然场景更为复杂。近 ,南洋理工大学S-Lab的研究人员近日提出了一种名为CityDreamer的框架,专注于生成无边界的3D城市,这标志着3D城市生成领域的一项重大突破。

据了解,CityDreamer通过创新性地分为城市背景和建筑两个模块来解决这一难题,采用了鸟瞰视图(Bird's Eye View, BEV)作为场景表示。这两个模块都通过对抗训练采用体积渲染器(Volumetric Renderer)生成高度逼真的图像。CityDreamer 采用了一种创新的生成模型,它将建筑物的生成与其他背景对象(如道路、绿地和水域)分开处理,使用不同的模块进行生成。

数据集方面,为了提高生成的3D 城市的真实感,研究团队构建了两个数据集,即 OSM 数据集和 Google Earth 数据集,其中包含大量现实世界城市图像数据。

image.png

一个关键的挑战是,在城市中,建筑的外观多种多样,但它们通常被分配相同的类别。这导致了建筑外观的质量下降。为了克服这一问题,CityDreamer引入了生成哈希网格和周期性位置编码。哈希网格用于保持自然性和维护3D一致性,而周期性位置编码则用于处理多样性的建筑立面,这是一种简单而有效的方法。

CityDreamer的生成过程分为四个步骤:无边界城市布局生成、城市背景生成、建筑实例生成和图像融合。在无边界城市布局生成中,CityDreamer采用了无边界布局生成器(ULG)来生成可扩展的语义地图和高度场。城市背景生成模块使用哈希网格来保持自然性和维护3D一致性,通过基于体积渲染的渲染网络将三维空间特征映射到二维图像。建筑实例生成则通过基于体积渲染的渲染网络完成,观察到建筑立面和屋顶有显著的差异,因此它们分配了不同的类别标签。

实验结果显示,CityDreamer的效果明显优于其他同类方法,包括PersistentNature、SceneDreamer和InfiniCity。此外,CityDreamer还展示了出色的鲁棒性,从不同角度观察生成结果都非常令人满意。

这一创新的成果标志着3D城市生成技术的显著进展,为未来的虚拟城市和元宇宙的发展提供了有力支持。这一技术的应用前景非常广阔,将在游戏、城市规划、虚拟现实等领域发挥关键作用。

  • 论文地址:https://arxiv.org/abs/2009.00610

  • 项目地址:https://haozhexie.com/project/city-dreamer

举报

  • 相关推荐
  • SyncDreamer:从单视图图像生成多视图一致图像以实现3D重建

    3D生成领域经历了迅猛的进展,其中一个备受瞩目、在GitHubRepo上广受欢迎的项目备受关注。这个项目被认为是最为稳定和通用的,用户只需提供一张图像,模型就能自动合成多个视图并生成相应的3D模型。SyncDreamer生成的图像可以用于高质量的3D重建。

  • Auctoria利用生成AI创建3D视频游戏模型

    波兰虚拟现实游戏开发公司CarbonStudio的联合创始人AleksanderCaban多年前观察到现代游戏设计中存在一个重要问题:手动创建视频游戏环境中的基本元素,如岩石、山丘、路径等,通常是耗时且繁琐的过程。为了解决这个问题,Caban决定开发技术来自动化这个过程。我们的团队两年前开始开发这个工具,使我们能够拥有一个可供使用的产品。

  • JoJoGAN:可一键生成艺术化面部图像的深度学习模型

    JoJoGAN是一个深度学习模型,该模型可以将普通的面部图像转化为艺术化的作品,无需专业艺术家或设计师的干预。这项技术可用于各种应用领域,包括艺术创作、虚拟角色设计、社交媒体滤镜和广告营销。它的技术细节和使用指南在文章中都得到了详细介绍,为感兴趣的用户提供了宝贵的资源。

  • 中文在线推出“逍遥”万字创作大模型一键生成万字小说

    中文在线推出了一款名为“逍遥”的万字创作大模型。该模型具有一键生成万字小说的功能,并可为作者提供全生命周期的AI辅助创作工具。中文在线推出的逍遥大模型是一种创新的AI辅助创作工具,它将为作家带来更多的创作资源和便利,并提高内容生产的质量和效率。

  • 容声美食节杭州巡展 WILL无边界冰箱605探寻城市养鲜生活

    点亮品质生活,释放家居之美。容声40年为时光添金“探享鲜活人间”美食嘉年华巡展于杭州浙落下帷幕。让我们共同期待下一站无锡的到来,容声又将为我们带来怎样的惊喜呢?

  • 谷歌研究发布MediaPipe FaceStylizer 轻松生成各种风格头像

    随着增强现实技术的崛起,研究人员和消费者对结合AR的智能手机应用表现出了日益增长的兴趣。这种技术允许用户实时生成和修改面部特征,用于短视频、虚拟现实和游戏等应用。这一技术的发布标志着在设备内部生成模型方面的重要进展,为未来的应用和探索提供了更多可能性。

  • 秒懂生成式AI—大语言模型是如何生成内容的?

    备受关注的大语言模型,核心是自然语言的理解与文本内容的生成,对于此,你是否好奇过它们究竟是如何理解自然语言并生成内容的,其工作原理又是什么呢?要想了解这个,我们就不得不先跳出大语言模型的领域,来到机器翻译这里。传统的机器翻译方式是采用RNN循环神经网络。以上就是大语言模型的工作原理了,强大Transformer的实用性还不止于在自然语言处理领域,包括�

  • Auctoria 使用生成式人工智能创建视频游戏模型

    Auctoria是一家在游戏行业引领创新的初创公司,它利用先进的人工智能彻底改变了3D视频游戏资产的创建方式。这一突破是在创始人AleksanderCaban意识到手动设计视频游戏环境的基本元素既耗时又费力之后取得的。随着Auctoria的不断发展,它有潜力重塑视频游戏开发的格局。

  • 职场人不得不拥有的办公神器:亿图脑图支持思维导图一键生成PPT

    在当今竞争激烈的职场环境中,高效的工作方式和出色的沟通能力是成功的关键。为了满足职场人士的需求,在亿图脑图MindMaster最新版本v10.9.0中,推出了一项令人振奋的新功能:支持思维导图一键生成PPT。立即下载亿图脑图MindMasterv10.9.0,体验这一令人惊喜的功能,提升您的职场效率,展现专业形象。

  • Meta AI提出视频抠图新方法OmnimatteRF:结合动态2D前景图层和3D背景模型

    Omnimatte是迄今为止最有前景的视频抠图方法。它使用单应性建模背景,因此只适用于背景为平面或仅有旋转运动的视频。它也可助力构建沉浸式的虚拟环境。