首页 > 业界 > 关键词  > 3D最新资讯  > 正文

创新3D技术Gaussian-SLAM 通过分析视频重建逼真的3D场景

2023-12-19 10:13 · 稿源:站长之家

站长之家(ChinaZ.com)12月19日 消息:Gaussian-SLAM是一项新兴技术,可以通过分析视频流中的图像来创建逼真的3D模型,从而重建现实世界场景。

通过观看一个视频,Gaussian-SLAM可以分析视频中的图像,能够理解视频中的环境布局和物体的位置。然后利用这些图像数据来创建、还原可以从各个角度观察的3D模型,重建现实世界场景。这一过程是实时渲染的,可以帮助用户在计算机上查看和探索3D虚拟环境。

image.png

论文地址:https://ivi.fnwi.uva.nl/cv/paper/GaussianSLAM.pdf

项目地址:https://github.com/VladimirYugay/Gaussian-SLAM

演示地址:https://vladimiryugay.github.io/gaussian_slam/

举例来说,如果你有一个在公园拍摄的视频,其中包括树木、长椅、小路和行人等物体。传统的视频只能提供二维视角,但是使用Gaussian-SLAM技术,我们可以分析视频中的各个物体,并了解它们在空间中的相对位置。

通过分析视频中物体的移动和视角变化,Gaussian-SLAM可以计算出这些物体在三维空间中的位置和形状。最终,这项技术可以创建一个公园的数字复制品的三维模型,使用户可以从任何角度查看公园的每个角落,包括树木、长椅和人们的活动。

Gaussian-SLAM的主要功能特点和工作原理如下:

主要功能特点:

1、光学真实的渲染:能够以高度真实的方式重建和渲染真实世界和合成场景。

2、高斯斑点场景表示:使用高斯斑点作为场景的主要表示单位,这是一种新颖的方法,与传统的点云或网格表示不同。

3、交互式时间重建:允许在交互时间内重建场景,即重建过程足够快,可以实时渲染或近实时进行。

4、适用于单目RGBD输入:针对单目RGBD(红绿蓝深度)输入数据进行优化,适用于多种场景。

Gaussian-SLAM特别针对的是RGBD摄像头的输入数据进行优化,这种摄像头除了捕捉普通的彩色图像外,还能提供每个像素点的深度信息,对于创建准确的三维场景模型至关重要。

工作原理:

Gaussian-SLAM的工作原理主要包括数据处理、3D高斯初始化、场景构建、关键帧存储与渲染以及优化与更新。通过接收RGBD关键帧输入,进行子采样并考虑颜色梯度,将采样点投影到3D空间,在这些采样位置初始化新的高斯,新的3D高斯被添加到全局地图的当前活动部分中,形成场景的一部分。输入的RGBD关键帧暂时存储,与对活动子图有贡献的其他关键帧一起,并渲染所有对活动子图有贡献的关键帧,最后计算与子图输入关键帧相关的深度和颜色损失,然后更新活动子图中3D高斯的参数。

应用场景:

Gaussian-SLAM适用于需要高度真实感和精确度的SLAM应用,如自动驾驶、机器人导航、增强现实和虚拟现实等。这项技术的出现为模拟现实世界和创造逼真的虚拟环境提供了新的可能性。

举报

  • 相关推荐
  • 苹果iOS 26普通照片秒变3D照上热搜 “空间场景”功能引热议

    苹果正式推送iOS 26系统,支持iPhone 11及以上机型。新系统引发用户吐槽,如LiquidGlass设计被指“丑出新高度”,升级后出现发烫、卡顿等问题。但“空间场景”功能广受好评,可将普通照片转换为裸眼3D效果,操作便捷,还能设为动态壁纸。不过该功能在不同屏幕上的表现存在差异,低刷屏会出现卡顿,高刷屏则效果更流畅逼真。

  • AI日报:腾讯发布混元3D 3.0模型;昆仑万维上线Agent Studio功能;阿里Qoder推出付费订阅服务

    AI日报汇总最新行业动态:腾讯发布混元3D+3.0模型,建模精度提升3倍;昆仑万维Mureka上线音乐创作功能;阿里Qoder推出付费订阅服务;VEED Fabric 1.0实现图片转视频;OpenAI发布GPT-5-Codex革新编程;全国发布AI安全治理框架2.0;Mini-o3实现超长视觉推理;上海AI Lab推出多模态模型Lumina-DiMOO;腾讯微调技术提升图像美感300%;Meta推出轻量级MobileLLM-R1;腾讯启动AI应用繁荣计划;谷歌DeepMind�

  • IFA 2025“杰出创新奖”揭晓:三星电竞显示器以裸眼3D体验引领行业变革

    三星玄龙骑士3D电竞显示器G90XF荣获2025年IFA创新奖,凭借裸眼3D技术突破行业瓶颈。该产品通过眼球追踪和视图映射算法实现无眼镜立体视觉,同时保持4K分辨率、165Hz刷新率等顶级显示性能。结合AI视频转换功能与游戏生态建设,三星正推动显示技术从二维向三维沉浸式体验跨越,重塑行业标准。

  • 7.3GHz新纪录!HiCookie再创9800X3D+技嘉X870主板超频战绩

    技嘉2025新品发布会圆满落幕,展示X3D系列主板、OLED显示器及AI+TOP等新品,并推出D5黑科技2.0和X3D鸡血模式2.0软件更新。超频大师HiCookie现场演示液氮超频,使用技嘉X870AORUS TACHYON ICE主板搭配9800X3D处理器,创下7.3GHz超频新纪录并通过CPU-Z认证。主板专为超频设计,支持D5黑科技内存优化技术,提升带宽降低延迟,适合各类玩家轻松体验高性能。

  • LV首尔开餐厅3只牛肉饺子243元:印有经典图案

    路易威登正式进军餐饮业,旗下首家餐厅Le Café Louis Vuitton于9月1日在首尔江南区清潭洞开幕。餐厅由名厨尹太均主理,主打融合韩式风味的法式料理,特色菜品包括印有品牌经典Monogram图案的牛肉饺子(约243元人民币)等。自8月开放预约以来座位迅速订满,持续火爆。品牌还通过全球合作计划,在巴黎、纽约等地拓展餐饮版图。

  • 上市13个月 连当13个月纯电A级轿车销冠!小鹏Mona M03累计交付18万台

    小鹏MONA M03上市13个月累计交付18万台,连续月交付超1万台,连续13个月获纯电A级车销量冠军。5月28日推出M03 Max版,售价12.98万-13.98万元,搭载自研视觉智能辅助驾驶方案,算力达508Tops,支持全场景智能泊车辅助,将智能驾驶价格拉低至13万级。新车配备电动掀背尾门、超600L后备厢,风阻系数0.194,百公里电耗11.8kWh,支持快充,15分钟补能200公里。凭借高性价比与智能配置,M03系列持续热销。

  • LV首尔开餐厅3只牛肉饺子243元:预约秒售罄一席难求

    ​近日,法国奢侈品牌路易威登(Louis Vuitton)在餐饮界掀起一股跨界热潮,其全球首家常设餐厅Le Café Louis Vuitton在韩国首尔江南区清潭洞的路易威登旗舰店内盛大开业。这家餐厅自8月18日启动线上预约服务以来,便迅速被抢订一空,至今预约情况依旧火爆,一席难求。 Le Café Louis Vuitton由韩国知名主厨尹太均亲自操刀,巧妙融合韩国本土风味与法式料理精髓,为食客带来别具

  • vivo X300系列四色公布 将于10月13日发布

    9月23日,vivo正式公布旗舰机型X300系列配色方案:X300 Pro提供旷野棕、简单白、自在蓝、纯粹黑四款,标准版则带来幸运彩、惬意紫、自在蓝、纯粹黑四种选择,满足用户个性化需求。该系列配备超薄直屏,Pro版厚度仅7.99mm,标准版为7.95mm,兼顾轻薄与手感。全系搭载与X200 Ultra同款的蔡司2.35x长焦增距镜,支持多种拍摄模式,覆盖风光、人像等场景,实现“望远巨炮”般拍摄体验。此外,vivo还推出银色增距镜作为时尚配饰。新品将于10月13日19:00正式揭晓。

  • 挑战最强标准版!真我GT8搭载2K直屏+骁龙8E:跑分破332万

    真我GT8系列将于10月发布,含标准版与Pro版。Pro版配备2K直屏、大R角设计、金属中框及3D超薄屏下指纹;标准版搭载骁龙8 Elite芯片。全系采用2K 144Hz苍睐屏,支持高刷新率与精准触控,峰值亮度达7000nit。安兔兔跑分332万,可流畅运行《原神》等大型游戏。首发真彩护眼低蓝光技术,提升色彩精准度64.8%,支持全亮度DC调光,兼顾性能与视觉体验。

  • 游戏行业进入拉锯战,未来3年没人能躲开这个能力

    除了《三角洲行动》可能是最大的特例 和前几年大作扎堆立项、宣发,或者新品上线即一夜爆火的热闹情况相比,如今的市场似乎颇显单调,榜单前列除了少量黑马之外,绝大部分时间都是些老面孔在角逐。 最近葡萄君和几位业内人士聊了聊,他们也颇有同感。 比如雷霆游戏的VP/CTO 生辉就表示,随着人口红利的消失、用户审美能力的快速上升,他们越来越发现:投入5亿做10

今日大家都在搜的词: