首页 > 传媒 > 关键词  > 正文

AIRLOOK携手百度视觉技术部联合发布国内大空间高精度3DGS逆渲染成果

2024-02-27 14:25 · 稿源: 站长之家用户

近日,AIRLOOK与百度视觉技术部联合发布了中国地信领域的第 一个大空间高精度3DGS 解决方案,率先实现了测绘级 SfM 与3D Gaussian Splatting(后文简称:3DGS)逆渲染技术的美好融合,为行业提供更强大的显式编辑能力和更低算力需求的实时渲染能力,进一步降低开发和部署门槛,在双方的合作下,将加快创新性技术在地理信息领域的应用。

GIR重建及重光照渲染效果

打造数字孪生城市的“新引擎”

随着数字经济的快速发展,地理信息数据已经成为数字经济的重要组成部分,对于推动经济发展和提升社会治理水平具有重要意义。国家对于数字孪生城市的发展给予了高度重视。

在国家“十四五”规划等政策文件中,明确提出要打造数字孪生城市,加强城市信息模型(CIM)平台的建设和应用,推动城市治理体系和治理能力现代化。测绘级 SfM 与3DGS逆渲染技术的融合,不仅提高了城市三维重建的效率和精度,而且摆脱了传统三角格网的空间表达方式,呈现出更具质感的表现细节。

这一融合在政策层面顺应了国家对于数字孪生城市发展的战略需求,为城市规划、建设和管理的智能化提供了强有力的技术支撑。同时,它促进了地理信息产业的升级,拓展了应用领域,为城市的可持续发展注入了新的活力。

携手百度视觉技术部共筑“新地图”

AIRLOOK致力于利用三维重建与人工智能技术还原物理世界、拓宽实景三维地图应用,基于多年大规模空间数据三维重建与渲染方面的积累,有着广泛的行业落地实践经验。此前AIRLOOK已经发布与NeRF 技术深度结合的 MapStudio 编辑器,通过低代码的方式降低了行业应用的开发门槛。

依托AIRLOOK自主研发的三维重建系统所得到的测绘级SfM,和3DGS逆渲染技术相融合,极大提升了渲染质量及渲染速度,减少了模型的制作成本和算力成本,为全新的空间表达方式提供有力的支撑。将真实世界的场景以极 高的精度和逼真的效果呈现在计算机中,实现物理世界的多级刻画,为各领域的可视化需求提供强大的支持。此次双方携手,加速解决了传统三维重建方案渲染效果假、NeRF 渲染算力要求高等问题。

3DGS 全面强化创新技术应用体验

百度视觉技术部基于3DGS 这一全新的3D 内容表达方式,研发业界第 一个支持 PBR 工作流的3DGS 重建与实时渲染解决方案。在此方案中,提出端到端高精度3DGS 逆渲染方案(简称:GIR),利用视觉神经网络感知算法实现更高精度的相机位姿估计,并可基于2D 图片逆向求解出被拍摄物体的材质、颜色和光照信息,进而结合自主研发的千幻渲染引擎 V1.0,为移动端、Web 端与 PC 端全平台用户提供实时场景重光照、动画和特 效能力,创造全新的3D 体验。

此外,千幻渲染引擎亦提供3DGS-PBR 插件版本,支持行业客户保持已有业务架构(如Unreal),无缝接入3DGS-PBR 渲染能力。3DGS-PBR 的引入,让重建的3DGS 结果可无缝与其他 CG 渲染内容融合。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • JASCO:音乐生成模型,结合文本和音频条件进行控制。

    JASCO是一个结合了符号和基于音频的条件的文本到音乐生成模型,它能够根据全局文本描述和细粒度的局部控制生成高质量的音乐样本。JASCO基于流匹配建模范式和一种新颖的条件方法,允许音乐生成同时受到局部(例如和弦)和全局(文本描述)的控制。通过信息瓶颈层和时间模糊来提取与特定控制相关的信息,允许在同一个文本到音乐模型中结合符号和基于音频的条件。

  • prism-alignment:探索大型语言模型的偏好和价值观对齐。

    prism-alignment 是一个由 HannahRoseKirk 创建的数据集,专注于研究大型语言模型(LLMs)的偏好和价值观对齐问题。数据集通过调查问卷和与语言模型的多轮对话,收集了来自不同国家和文化背景的参与者对模型回答的评分和反馈。这些数据对于理解和改进人工智能的价值观对齐至关重要。

  • LoRA Studio:探索多样化的AI模型。

    LoRA Studio 是一个在线平台,提供多种AI模型供用户探索和使用。这些模型涵盖了从动漫风格到抽象艺术的不同领域,可以用于生成艺术作品、设计元素等。平台的主要优点包括模型多样性、用户友好的界面以及创意的无限可能性。

  • Unstract:无代码LLM平台,用于结构化非结构化文档。

    Unstract是一个无代码的LLM(大型语言模型)平台,它允许用户通过简单的无代码方法启动APIs和ETL管道来处理非结构化文档。它支持从多种云文件/对象存储系统中读取复杂文档,并将结构化数据写入流行的数据仓库和数据库。Unstract利用大型语言模型的能力,超越了传统的RPA(机器人流程自动化),实现了机器到机器的自动化。

  • Woy AI:2024年顶级AI工具目录

    Woy.ai是一个AI工具目录,提供2024年最新的AI工具列表。它为技术爱好者、开发者和企业提供了一个平台,以发现和利用人工智能的最新进展。

  • Sparkpage:AI驱动的新型网页,重构信息互动。

    Sparkpage 是由 Genspark 推出的革命性网页形式,致力于通过 AI 技术改善用户在线获取信息的方式。它通过内容蒸馏和整合,提供无商业影响和编辑偏见的丰富、可靠信息。内置的 AI 助手能够动态响应用户查询,提供个性化的见解和信息。

  • Helix Free User Persona Generator:生成用户画像,助力市场洞察

    Helix是一个专注于用户画像生成的在线工具,能够帮助企业或个人快速理解目标受众的特征和需求。它通过分析用户数据,生成详细的用户画像,帮助产品或服务更好地定位市场和用户。

  • Promoted:提升市场搜索、推荐和原生广告的排名

    Promoted是一个专注于市场搜索、推荐和原生广告排名的解决方案,通过先进的机器学习技术和大型语言模型搜索相关性AI技术,显著提升转化率和广告质量。它为市场平台提供了统一的搜索、推荐和广告服务,帮助企业实现更好的匹配和更高的收益。

  • Index-1.9B-Pure:轻量级大语言模型,专注于文本生成。

    Index-1.9B-Pure是Index系列模型中的轻量版本,专为文本生成而设计。它在2.8T的中英文语料上进行了预训练,与同等级模型相比,在多个评测基准上表现领先。该模型特别过滤了所有指令相关数据,以验证指令对benchmark的影响,适用于需要高质量文本生成的领域。

  • Index-1.9B-Character:19亿参数规模的角色扮演模型,支持few shots角色定制。

    Index-1.9B-Character是由Index团队自主研发的大型语言模型,专注于角色扮演领域,拥有19亿参数规模。该模型支持用户通过上传角色对话语料实现快速的角色定制,具备较高的角色一致性、对话能力和角色扮演吸引力。在CharacterEval权威benchmark评估中,整体均分排名第九,表现优于同量级模型。

  • Index-1.9B-Chat:基于19亿参数的对话生成模型

    Index-1.9B-Chat是一个基于19亿参数的对话生成模型,它通过SFT和DPO对齐技术,结合RAG实现fewshots角色扮演定制,具有较高的对话趣味性和定制性。该模型在2.8T中英文为主的语料上预训练,并且在多个评测基准上表现领先。

  • Llama3-70B-SteerLM-RM:70亿参数的多方面奖励模型

    Llama3-70B-SteerLM-RM是一个70亿参数的语言模型,用作属性预测模型,一个多方面的奖励模型,它在多个方面对模型响应进行评分,而不是传统奖励模型中的单一分数。该模型使用HelpSteer2数据集训练,并通过NVIDIA NeMo-Aligner进行训练,这是一个可扩展的工具包,用于高效和高效的模型对齐。

  • ComfyUI.org:开源AI工具,推动AI民主化。

    ComfyUI是一个开源AI模型,致力于推动AI工具的民主化和开源化。它由一个团队创建和维护,旨在为AI社区提供易于使用、安全和可靠的工具。ComfyUI支持通过各种工具,如节点管理器、节点注册表、命令行界面、自动化测试和公共文档来支持其生态系统。团队相信开源模型将在长期内胜过封闭模型,并致力于通过社区驱动的方式推动AI工具的发展。

  • Hedra:创造实验室,打造下一代人类叙事产品

    Hedra是一个创新的创造实验室,专注于将基础模型转化为产品,以驱动下一代的人类叙事技术。它提供了一个平台,让用户能够创造具有表达力和可控性的人物角色视频,并构建能够捕捉想象力的虚拟世界。Hedra的使命是通过提供完整的创意控制,让用户想象世界、角色和故事。

  • L4GM:4D重建模型,快速生成动画对象

    L4GM是一个4D大型重建模型,能够从单视图视频输入中快速生成动画对象。它采用了一种新颖的数据集,包含多视图视频,这些视频展示了Objaverse中渲染的动画对象。该数据集包含44K种不同的对象和110K个动画,从48个视角渲染,生成了12M个视频,总共包含300M帧。L4GM基于预训练的3D大型重建模型LGM构建,该模型能够从多视图图像输入中输出3D高斯椭球。L4GM输出每帧的3D高斯Splatting表示,然后将其上采样到更高的帧率以实现时间平滑。此外,L4GM还添加了时间自注意力层,以帮助学习时间上的一致性,并使用每个时间步的多视图渲染损失来训练模型。

  • Grazias:自动化收集和分享客户反馈。

    Grazias是一个免费的在线工具,用于自动化收集客户的推荐信,并集中管理这些推荐信,同时可以方便地在任何地方分享。它提供了一系列功能,包括简单的表单收集、自定义表单、自动跟进邮件以及详细的分析和图表,帮助企业更好地管理和利用客户反馈。

  • Olvy AI:客户反馈的智能管理助手

    Olvy AI是一个先进的客户反馈管理平台,它通过AI技术整合来自不同渠道的客户声音,包括调查、访谈、评论、支持票据和销售电话等,帮助企业快速获取洞察力。它通过自动化和智能化的方式,将客户反馈转化为可操作的见解,帮助企业做出更明智、更快速的决策。Olvy AI的主要优点包括提高团队生产力、节省时间、提供精准的数据驱动见解,以及保持与用户需求的紧密联系。

  • Aware:智能孕期社区应用

    Aware.ai Pregnancy App是一个为孕妇设计的智能社区应用,通过AI技术为孕妇提供个性化的社区推荐和资源。它通过匹配孕妇的背景和孕期目标,帮助她们找到合适的社区和资源,分享孕期故事和经验,并通过一对一连接获得其他孕妇的见解和建议。

  • VidAU:AI驱动的视频和音频生成平台,简化内容创作。

    VidAU AI Video & Audio Creator是一个AI驱动的视频和音频生成平台,它通过简化从构思到制作的整个内容创作过程,使得用户能够轻松创建引人入胜的视频。平台提供多种AI工具,包括视频更换、视频翻译、字幕翻译和去除、AI虚拟形象发言人以及文本转音频等功能,帮助用户提升视频内容的质量和吸引力。VidAU支持120多种语言的视频翻译,覆盖150多个国家,能够节省90%以上的视频制作时间。

  • The Prompt Report:系统性调研生成式AI的提示技术

    The Prompt Report 是一份系统性调研报告,专注于生成式人工智能(GenAI)的提示技术。它通过结合人类和机器的努力,从多个数据库中处理了4797条记录,提取出1565篇相关论文。报告提供了58种基于文本的技术,并补充了多模态和多语言技术的广泛集合。其目标是提供一个易于理解和实施的提示技术目录,并回顾了作为提示扩展的代理,包括评估输出和设计有助于安全性和安全性的提示的方法。此外,报告还应用提示技术在两个案例研究中进行了实践。

今日大家都在搜的词: