首页 > 业界 > 关键词  > 3D编辑最新资讯  > 正文

南洋理工提出全新3D编辑算法GaussianEditor 2分钟内完成3D场景增删改

2023-12-05 16:05 · 稿源:站长之家

站长之家(ChinaZ.com)12月5日 消息:近年来,3D 编辑在游戏和虚拟现实领域崭露头角,但长时间和低可控性一直是问题。南洋理工大学联合清华和商汤提出的 GaussianEditor 算法成功解决了这些问题。该算法采用了高斯溅射(Gaussian Splatting)作为3D 表示,与传统 NeRF 方法相比,实现了更高的可扩展性和编辑效率。这一突破为3D 编辑领域注入了新活力。

image.png

  • 论文地址:https://arxiv.org/abs/2311.14521

  • 主页地址:https://buaacyw.github.io/gaussian-editor/

在解决高斯溅射编辑挑战的过程中,GaussianEditor 引入了高斯语义追踪,通过在训练过程中持续识别需要编辑的高斯点,实现了精确可控的编辑。与传统静态掩码不同,高斯语义追踪通过将2D 分割掩码投影到3D 高斯点上并为每个高斯点分配语义标签,确保在训练中动态更新,有效应对模型几何形状和外观的变化。

GaussianEditor 还创新性地采用了层次化高斯溅射(HGS)表示,通过对高斯点组织成不同世代,调节了编辑过程中的流动性。这种设计在保持老世代高斯点原始状态的同时,提高了新世代高斯点的适应性,模拟了神经网络缓冲功能。

此外,GaussianEditor 提供了专门的局部修复算法,能有效消除对象与场景交界处的伪影,实现了对3D 场景的高效增删操作。

总体而言,GaussianEditor 通过解决高斯溅射编辑的关键问题,实现了对3D 场景的灵活和快速编辑。其高斯语义追踪、层次化高斯溅射表示以及增删算法的创新,使其在视觉质量、量化指标、可控性和生成速度等方面均超越了之前的工作。这一算法的开发为3D 编辑领域带来了显著的进展,为未来的虚拟现实和游戏开发提供了有力的工具。

举报

  • 相关推荐
  • AI日报:Kimi全新音频基础模型Kimi-Audio;阶跃星辰开源图像编辑模型Step1X-Edit;​夸克AI超级框上线 “拍照问夸克”

    本期AI日报聚焦多项AI技术突破与应用:1)Moonshot AI推出开源音频模型Kimi-Audio,基于13亿小时训练数据,支持语音识别等任务;2)阶跃星辰开源图像编辑模型Step1X-Edit,展现强大生成能力;3)夸克AI上线"拍照问夸克"功能,实现视觉问答;4)苹果iOS18.5将在中国推送,带来智能功能;5)谷歌发布601个生成式AI应用案例,覆盖多行业;6)微软推出深度整合Windows的UFO²自动化系统;7)OpenAI升级ChatGPT至GPT-4o版本,提升STEM领域能力;8)Ema公司推出高性价比语言模型EmaFusion;9)Liquid AI发布面向边缘设备的Hyena Edge模型;10)LemonAI推出实时音视频数字人产品Slice Live。此外,国内方面,智谱与生数科技达成战略合作推动大模型发展,宝马中国宣布新车将接入DeepSeek技术。

  • 聚首华南,2025下半年增材制造、3D 打印的顶尖展览与活动推荐

    2025年全球3D打印行业将迎来系列盛会。4月西安论坛成功举办后,下半年将迎来深圳Formnext Asia(8月26-28日)、东京论坛(9月25-26日)和法兰克福Formnext展会(11月18-21日)三大国际活动。这些平台将汇聚全球顶尖企业,展示航空航天、医疗健康、汽车工业等领域的最新技术成果,特别关注中国企业的快速成长。法兰克福展会预计吸引超900家展商,中国展商数量有望再创新高。系列活动将搭建全球产业交流平台,推动3D打印技术创新与商业应用深度融合。

  • 10倍精度升级!腾讯混元3D模型v2.5版本发布

    腾讯混元3D模型升级至v2.5版本,建模精度和贴图真实度显著提升。新版本参数体量从1B增至10B,有效面片数增加超10倍,支持1024几何分辨率。纹理系统支持4K高清贴图和凹凸细节,率先支持多视图生成PBR模型。针对动画场景优化骨骼蒙皮系统,支持非标准姿态自动绑定。新增文生/图生3D减面模型、多视图建模模板等专业工作流。混元3D v2.5已全面更新至腾讯AI创作引擎,免费生成额度提升至每日20次,并正式上线腾讯云API面向企业开放。GitHub开源版本累计Star超1.2万。

  • ​上海毅速推出第三代模具3D打印专机E3系列,引领模具制造技术革新

    导读:近年来,金属3D打印技术在模具制造领域得到了广泛的应用,模具行业正在迎来一场前所未有的技术变革,随着应用的逐渐深入,模具专用的金属3D打印机应运而生。2025 年 4 月 15 日,上海毅速激光科技有限公司(以下简称“毅速”)正式发布了其第三代模具3D打印专机系列——E3- 420 和E3-520。这一新品的推出,标志着模具制造行业向增材制造迈出了重要一步。毅速E3- 420 �

  • “奥迪助手”来了!全新AUDI车型接入豆包大模型

    2025年4月24日上海车展期间,上汽奥迪发布全新A5L Sportback和首款量产车型E5 Sportback。同时推出与火山引擎合作开发的"奥迪助手"智能交互系统,基于豆包大模型实现自然对话体验。该系统将搭载于两款新车,并同步部署在车载端和手机APP端,支持跨设备对话记录同步。火山引擎为系统提供大模型技术支持,实现语音指令控制、车辆功能讲解等智能服务,并整合抖音、汽水音乐等内容生态。上汽奥迪表示,该合作将助力品牌打造更智能、个性化的产品矩阵。

  • 3199元起!华为智能门锁2 Pro/Ultra开启预售:首次掌静脉+3D人脸识别

    华为智能门锁2 Pro、华为智能门锁2 Ultra今天正式开启预售,官方定价分别是3199 元、3699元起,国补到手价是2634.15元、3059.15元。

  • 曝iPhone 18 Pro内测屏下3D人脸识别:苹果迈入单挖孔屏时代

    这意味着iPhone 18 Pro系列正式迈入单挖孔屏时代,向安卓主流屏幕形态看齐。需要注意的是,安卓阵营普遍采用单挖孔 屏幕指纹识别方案,而iPhone则是采用屏下3D人脸识别方案,不支持屏幕指纹。

  • 可灵AI发布全新2.0模型:上线多模态视频编辑功能

    快科技4月16日消息,据报道,可灵AI在北京举行灵感成真”2.0模型发布会,正式发布可灵2.0视频生成模型及可图2.0图像生成模型。据介绍,可灵2.0模型在动态质量、语义响应、画面美学等维度保持领先;可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。3月27日,全球AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单,快手可灵1.6pro(高品质模

  • 1/8成本比肩Claude 3.7,Mistral Medium 3来了

    欧洲AI公司Mistral发布多模态新模型Mistral Medium 3,主打编程和多模态理解能力,性能达Claude 3.7的90%但成本仅1/8(输入0.4美元/百万token)。该模型在编程和STEM任务表现突出,支持企业级定制部署,已上线多个云平台。同时推出企业聊天机器人服务Le Chat Enterprise,集成第三方工具。尽管因未开源权重引发争议,其高性价比仍获业界关注。公司透露正在开发更大规模模型。

  • AI日报:腾讯混元3D生成模型2.5版本发布;海螺推出图像人物参考功能;百度上线移动端超级智能体心响App

    本文介绍了多款AI领域的新产品和技术进展:1)Kortix-AI推出开源通用AI智能体平台Suna;2)腾讯混元3D生成模型升级至2.5版本;3)海螺AI推出基于单张图像生成多角度角色图像功能;4)百度发布"心响"App整合多智能体协作;5)Nari Labs开源媲美真人的对话语音模型Dia;6)Grok新增视觉处理和多语言支持;7)Genspark推出AI幻灯片工具;8)Character.AI发布让静态图片"说话"的AvatarFX模型;9)pad.ws结合白板和代码编辑器;10)OpenBMB开源社区推出长文本生成模型"卷姬";11)腾讯推出AI阅读助手"企鹅读伴";12)OpenAI有意收购Chrome浏览器;13)字节跳动调整AI产品线布局。这些创新展现了AI技术在自动化、3D生成、语音交互、内容创作等领域的快速发展。