首页 > 业界 > 关键词  > LangSplat最新资讯  > 正文

LangSplat:一种基于3D高斯技术提高3D语言查询交互任务效率

2024-01-18 10:59 · 稿源:站长之家

划重点:

1. LangSplat是一种基于传统3D高斯技术的人工智能方法,用于在3D环境中进行开放式语言查询,以解决当前方法在处理速度和准确性方面的限制。

2. 该方法使用了独特的3D语言领域构建和语言嵌入技术,通过场景级语言自动编码器减少内存使用,并通过Segment Anything Model(SAM)解决复杂场景中的点模糊问题。

3. LangSplat在实验证明,相较于其他先进解决方案,如LERF,具有更快的处理速度(199倍提速)和在开放式3D语言查询任务中更高的性能,展示出更快的渲染速度和改进的精度。

站长之家(ChinaZ.com)1月18日 消息:人与计算机的互动中,为用户与3D环境进行沟通创造方式变得越来越重要。开放式语言查询在3D中的应用包括机器人导航和操作、3D语义理解以及编辑,因此吸引了研究者的关注。然而,当前方法在处理速度和准确性方面存在一定限制。

为了克服这些限制,来自清华大学和哈佛大学的研究人员开发了一种名为LangSplat的方法。与使用神经辐射场(NeRF)不同,研究人员采用了传统的3D高斯喷射技术。该方法首先构建一个3D语言领域,以在三维空间内生成精确高效的开放式词汇查询。每个查询都被分配一个独特的语言嵌入。

该技术使用基于图块的泼溅技术进行特征渲染。LangSplat 的独特之处在于它可以生成准确的语言特征,而无需经过计算成本高昂的过程。为了确保不同观点的一致表示,研究人员通过从各种训练角度捕获的图像块派生的 CLIP 嵌入进行监督。

image.png

此外,为了提高内存使用效率和渲染效率,研究人员使用了场景级语言自动编码器。这种方法将高维CLIP嵌入压缩成一个较低维的潜在空间,然后在解码过程中生成最终的语言嵌入,从而减少了LangSplat对CLIP嵌入的直接学习,降低了内存需求。最后,研究人员通过使用Segment Anything Model(SAM)的语义层次结构来解决复杂场景中常见的点模糊问题。这使得LangSplat能够为环境中的每个点分配精确的CLIP嵌入,从而提高了模型的准确性。

image.png

LangSplat的实验评估表明,相对于其他最先进的解决方案如LERF,LangSplat在处理速度上具有明显优势,提高了在开放式3D语言查询任务中的性能。

总的来说,LangSplat通过创新地使用3D高斯飘逸、场景级语言自动编码器和基于SAM的蒙版,是发展3D语言领域的重要一步。随着研究人员进一步关注框架的准确性和速度,LangSplat有望重新塑造在三维空间中与信息进行交互和查询的方式。

论文网址:https://arxiv.org/abs/2312.16084

项目网址:https://langsplat.github.io/

举报

  • 相关推荐
  • 美团发布高效推理模型LongCat-Flash-Thinking:部分性能接近GPT5

    9月23日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时,性能更强大、更专业,在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力,扩展了形式化定理证明能力,成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出,多项基准测试成绩领先开源及闭源顶尖模型,已在HuggingFace、Github全面开源。

  • AI日报:美团发布推理大模型LongCat-Flash-Thinking;阿里Wan-Animate开源;字节推豆包翻译大模型

    AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking;阿里开源Wan-Animate模型革新AI视频生成;字节跳动发布豆包翻译模型,支持28种语言互译;华为与浙大联合推出安全大模型DeepSeek-R1-Safe;阿里云即将发布跨模态模型Qwen3-Omni;xAI推出计算成本降低98%的Grok4Fast模型;YouTube发布多项AI创作辅助功能;IBM推出轻量级文档处理模型Granite-Docling-258M;中科院发布类脑大模型SpikingBrain实现百倍速度突破;OpenAI将推出仅限Pro用户的计算密集型新功能。

  • 掌控隐私安全 Galaxy AI助用户轻松管理个人数据

    三星Galaxy AI通过两大关键举措强化隐私安全:一是将防护机制融入AI体验,从源头保障用户数据安全;二是运用AI技术强化移动设备安全防护体系。通过透明化设置与用户自主选择权,让用户清晰了解数据使用方式并掌握控制权,所有数据均本地处理不上传云端。结合Knox防护机制和直观的隐私设置界面,为用户提供全方位的数据保护与自主管理能力。

  • 智驾终局:VLA与WA的“强脑”之争

    当理想i8在暴雨中的山区公路上自动识别出被冲垮的路肩,平稳减速并规划出绕行路线时;当小鹏P7Ultra仅凭视觉传感器就精准避让了横穿马路的流浪猫与突发变道的货车时,智能驾驶行业悄然迎来了一场技术革命的临界点。 新能源汽车的市场淘汰赛已进程过半,从电池续航、充电速度到座舱智能化,竞争之下市场早已进入红海,甚至智驾能力也正从争议不断的“加分项”转变�

  • 三星Galaxy Tab S10 Lite:为你开启多彩校园「星」生活!

    三星Galaxy Tab S10 Lite平板电脑是新学期学习的理想助手。它配备10.9英寸大屏,支持S Pen触控笔,提供流畅书写体验。多任务处理功能可同时运行多个应用,提高学习效率。轻巧便携设计适合校园使用,Vision Booster技术确保户外清晰显示。内置AI功能可快速搜索解题,是课堂笔记、资料查阅的得力工具。

  • 三星Galaxy S10 Lite:为你开启多彩校园「星」生活!

    新学期开启,三星Galaxy Tab S10 Lite平板电脑凭借10.9英寸大屏、轻巧便携设计和S Pen触控笔,成为学习好帮手。支持多任务分屏、数学求解器、即圈即搜等功能,提升学习效率。高颜值外观搭配丰富配色,适合校园使用,助力规划时间、掌握知识,让新学期更精彩。

  • 同传翻译 流畅交流 三星Galaxy Buds3 FE出境游必备

    十一假期临近,三星Galaxy Tab S11系列平板与Galaxy Buds3FE等智能新品成为旅行好帮手。Tab S11通过大屏与AI功能简化行程规划、购票等准备工作,支持智能拖拽分屏提升效率;Buds3FE则提供实时翻译功能,解决出境游语言障碍。两者结合让旅行更轻松,回归纯粹享受。

  • 锐捷WLAN产品出货量第一,磐石无线覆盖千行百业

    IDC报告显示,锐捷网络在2025年第二季度中国企业级WLAN市场出货量排名第一。其“磐石无线”方案通过技术创新,提供稳定可靠的无线连接,解决传统Wi-Fi在稳定性、抗干扰等方面的不足。方案覆盖医疗、企业、教育等多个行业,针对不同场景提供定制化解决方案,如医疗行业的零漫游、企业办公的高密度接入等,助力各行业数字化转型。锐捷持续以技术突破传统无线网络局限,为用户提供智能可靠的无线连接体验。

  • 三星正式向更多Galaxy设备推送Samsung One UI 8更新

    三星电子正式推送One UI 8更新,为Galaxy用户带来增强的多模态AI功能,包括个性化建议、实时窗口、即时简报等智能体验。新系统优化了不同设备形态的交互,结合Knox安全架构保护隐私,并支持实时翻译、游戏辅助等实用工具。9月18日起中国用户可优先升级,年底前将扩展至更多机型。

  • 囤LABUBU的黄牛哭了:根本没人接盘

    曾经一娃难求的LABUBU目前在二手交易平台全线下跌。 在二手交易平台闲鱼上,LABUBU的挂售数量明显增加,卖家们纷纷降价,有的卖家标注亏本卖”、求回血”等字样。 目前不少黄牛已经暂停收货LABUBU,一位黄牛表示,我从事潮玩转手已经两年了,LABUBU一直是硬通货,但这次市场反应完全出乎意料,我手里还压着没有出手,估计要亏好几千。 另一方面,由于价格下跌,不少�

今日大家都在搜的词: