首页 > 业界 > 关键词  > 3D编辑最新资讯  > 正文

南洋理工提出全新3D编辑算法GaussianEditor 2分钟内完成3D场景增删改

2023-12-05 16:05 · 稿源:站长之家

站长之家(ChinaZ.com)12月5日 消息:近年来,3D 编辑在游戏和虚拟现实领域崭露头角,但长时间和低可控性一直是问题。南洋理工大学联合清华和商汤提出的 GaussianEditor 算法成功解决了这些问题。该算法采用了高斯溅射(Gaussian Splatting)作为3D 表示,与传统 NeRF 方法相比,实现了更高的可扩展性和编辑效率。这一突破为3D 编辑领域注入了新活力。

image.png

  • 论文地址:https://arxiv.org/abs/2311.14521

  • 主页地址:https://buaacyw.github.io/gaussian-editor/

在解决高斯溅射编辑挑战的过程中,GaussianEditor 引入了高斯语义追踪,通过在训练过程中持续识别需要编辑的高斯点,实现了精确可控的编辑。与传统静态掩码不同,高斯语义追踪通过将2D 分割掩码投影到3D 高斯点上并为每个高斯点分配语义标签,确保在训练中动态更新,有效应对模型几何形状和外观的变化。

GaussianEditor 还创新性地采用了层次化高斯溅射(HGS)表示,通过对高斯点组织成不同世代,调节了编辑过程中的流动性。这种设计在保持老世代高斯点原始状态的同时,提高了新世代高斯点的适应性,模拟了神经网络缓冲功能。

此外,GaussianEditor 提供了专门的局部修复算法,能有效消除对象与场景交界处的伪影,实现了对3D 场景的高效增删操作。

总体而言,GaussianEditor 通过解决高斯溅射编辑的关键问题,实现了对3D 场景的灵活和快速编辑。其高斯语义追踪、层次化高斯溅射表示以及增删算法的创新,使其在视觉质量、量化指标、可控性和生成速度等方面均超越了之前的工作。这一算法的开发为3D 编辑领域带来了显著的进展,为未来的虚拟现实和游戏开发提供了有力的工具。

举报

  • 相关推荐
  • 同比增长17%!腾讯Q2研发投入202.5亿元 混元3D大模型接连突破

    腾讯控股今日发布了截至6月30日的2025年第二季度财报。营收为1845亿元,同比增长15%,经营利润(Non-IFRS)692.5亿元,同比增18%。 财报显示,当季腾讯研发投入达202.5亿元,同比增长17%;资本开支 191.1亿元,同比增幅达119%。在持续加码AI战略的推动下,AI技术带来的效益正在加速显现。 AI高投入背景下,腾讯通过数据增强与合成技术,提升了数据的质量与多样性,并通过更有效�

  • 视源股份全栈自研机器人首次亮相世界机器人大会 定位“3D岗”生产力伙伴

    2025世界机器人大会在北京开幕,视源股份携自主研发的机器人产品参展。其工业级高性能四足机器人MAXHUB X7首次亮相,具备全天候、全地形作业能力,已在工业、电力等场景落地应用。该产品采用多传感器融合导航技术,能适应复杂环境,IP66防护等级确保极端条件下稳定运行。视源股份依托"三院一站"研发体系,构建了从算法创新到制造验证的机器人全栈技术能力。目前公司商用清洁机器人已进入欧洲、东南亚及日本市场,在大型商超批量部署。未来将持续加大研发投入,推动机器人与行业场景深度融合。

  • 昇腾赋能三维生成新突破!浙大团队实现跨模态可控3D CAD建模

    浙江大学与魔芯科技团队合作,基于昇腾平台NPU开发了首个三维模型生成算法Img2CAD。该技术突破性地将草图、图片等多模态输入通过Transformer结构高效转化为三维几何信息,无需可微渲染器,完整在NPU上实现训练和推理。研究成果可生成高精度3D模型,直接导入CAD软件编辑,已应用于3D打印、数字制造等领域。项目完成3篇论文,包括1篇中科院1区期刊和2篇CCF-A类会议论文,部分成果实现商业化落地。该技术标志着智能三维内容创作进入"低门槛、高效率、高质量"新阶段,未来将为工业设计、AR/VR等行业提供创新动能。

  • 谷歌DeepMind发布Genie 3世界模型:支持实时生成交互式3D环境

    据媒体报道,谷歌DeepMind正式发布了其新一代通用世界模型Genie 3。 该模型能够根据用户的文本提示,快速生成丰富多样的交互式虚拟环境。Genie 3不仅能够以每秒24帧的速度生成720p分辨率的高清交互式3D世界,更创新性地引入了 可提示世界事件” 功能。用户通过简单文本指令,即可实时修改虚拟环境,显著提升了沉浸感与创造力。 DeepMind视Genie 3为迈向通用人工智能(AGI) 的�

  • 腾讯混元3D世界模型在魔搭社区开源首发

    7月27日,腾讯混元3D世界模型1.0在魔搭社区开源首发。这是业界首个开源的沉浸式3D世界生成模型,支持文字/图片输入快速生成完整3D场景,将原本需要数周的建模时间缩短至几分钟。该模型显著提升了游戏开发、VR、数字内容等领域的创作效率,开发者可免费下载体验,还能通过魔搭社区提供的4000+MCP服务和调试工具进行优化训练。作为中国最大AI开源社区,魔搭已汇聚500+机构、7万+模型,覆盖36个国家1600万开发者。此前腾讯开源的混元MoE模型Hunyuan-A13B也在该社区首发。

  • 昆仑万维UniPic 2.0“小钢炮”模型炸场,一个模型搞定理解+生成+编辑

    大模型又迎来新一波的迭代周期。 近日,从Open AI发布GPT-5,到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周,连续5天每天发布一个新模型,而8月13日发布的,正是其本周发布的第三款模型——多模态统一模型UniPic2.0。 UniPic2.0主打的是,在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力

  • OPPO Find X9参数曝光:3D超声波指纹终于下放

    具体来说,OPPO Find X9标准版将旗舰级的3D超声波指纹模块下放至标准版,这一功能在去年发布的OPPO Find X8系列机型中,只有X8 Ultra超大杯才搭载,其余机型包括X8、X8s、X8s 、X8 Pro均搭载短焦指纹识别,在解锁体验方面存在一定的短板。 据悉,目前的旗舰机型普遍采用了3D超声波指纹模块,相比短焦指纹模块,超声波指纹方案更加安全易用,其优点包括:穿透性强,抗水渍、污渍

  • AI日报:腾讯混元开源Hunyuan-GameCraft;最强图像编辑器nano-banana发布;字节开源Agent专用模型 M3-Agent-Control

    本文介绍了AI领域最新动态:1)腾讯开源Hunyuan-GameCraft框架,可快速生成高质量游戏视频;2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext;3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型;4)Kimi将推出PPT生成功能;5)阿里1688将上线"诚信通AI版"会员服务;6)苹果智能家居中心推迟至2026年发布;7)万兴科技接入GPT-5;8)全球AI独角兽达498家,总估值2.7万亿美元;9)谷歌为Slides和

  • 诚志生命D-核糖荣获“FHE同心奖”,创新引领健康食品产业发展

    2025年2月17-20日,博鳌健康食品科学大会(FHE2025)在海南博鳌召开。会议聚焦"科技创新与科学循证",围绕食品法规、新技术、药食同源等六大板块展开研讨。诚志生命科技携核心产品D-核糖参展并获"FHE同心奖",其临床研究显示D-核糖能显著减少马拉松运动员心肌损伤,提升完赛成绩。公司作为D-核糖全球知识产权持有者,展示了包括D-核糖冲剂等系列营养健康产品。诚志生命成立于2000年,是专注于合成生物学研发的国有控股高科技企业,未来将持续加大D-核糖等核心产品的迭代升级,推动"科技+健康"双驱动发展。

  • 硅基智能完成数亿元D轮融资,司马华鹏:要从卖工具到卖结果

    南京硅基智能科技完成数亿元D轮融资,由嘉兴高新区产业基金投资。资金将用于核心技术研发和产品市场化应用。公司聚焦AIGC数字人技术,已服务超5000家企业,年营收达数亿元。其新一代多模态大模型DUIX ONE提升了人机交互真实感,并推出"DUIX Inside"战略,为开发者提供标准化API服务。公司还探索"按效果付费"新模式,从卖工具转向卖结果。硅基智能计划在全球1

今日大家都在搜的词: