首页 > 业界 > 关键词  > LangSplat最新资讯  > 正文

LangSplat:一种基于3D高斯技术提高3D语言查询交互任务效率

2024-01-18 10:59 · 稿源:站长之家

划重点:

1. LangSplat是一种基于传统3D高斯技术的人工智能方法,用于在3D环境中进行开放式语言查询,以解决当前方法在处理速度和准确性方面的限制。

2. 该方法使用了独特的3D语言领域构建和语言嵌入技术,通过场景级语言自动编码器减少内存使用,并通过Segment Anything Model(SAM)解决复杂场景中的点模糊问题。

3. LangSplat在实验证明,相较于其他先进解决方案,如LERF,具有更快的处理速度(199倍提速)和在开放式3D语言查询任务中更高的性能,展示出更快的渲染速度和改进的精度。

站长之家(ChinaZ.com)1月18日 消息:人与计算机的互动中,为用户与3D环境进行沟通创造方式变得越来越重要。开放式语言查询在3D中的应用包括机器人导航和操作、3D语义理解以及编辑,因此吸引了研究者的关注。然而,当前方法在处理速度和准确性方面存在一定限制。

为了克服这些限制,来自清华大学和哈佛大学的研究人员开发了一种名为LangSplat的方法。与使用神经辐射场(NeRF)不同,研究人员采用了传统的3D高斯喷射技术。该方法首先构建一个3D语言领域,以在三维空间内生成精确高效的开放式词汇查询。每个查询都被分配一个独特的语言嵌入。

该技术使用基于图块的泼溅技术进行特征渲染。LangSplat 的独特之处在于它可以生成准确的语言特征,而无需经过计算成本高昂的过程。为了确保不同观点的一致表示,研究人员通过从各种训练角度捕获的图像块派生的 CLIP 嵌入进行监督。

image.png

此外,为了提高内存使用效率和渲染效率,研究人员使用了场景级语言自动编码器。这种方法将高维CLIP嵌入压缩成一个较低维的潜在空间,然后在解码过程中生成最终的语言嵌入,从而减少了LangSplat对CLIP嵌入的直接学习,降低了内存需求。最后,研究人员通过使用Segment Anything Model(SAM)的语义层次结构来解决复杂场景中常见的点模糊问题。这使得LangSplat能够为环境中的每个点分配精确的CLIP嵌入,从而提高了模型的准确性。

image.png

LangSplat的实验评估表明,相对于其他最先进的解决方案如LERF,LangSplat在处理速度上具有明显优势,提高了在开放式3D语言查询任务中的性能。

总的来说,LangSplat通过创新地使用3D高斯飘逸、场景级语言自动编码器和基于SAM的蒙版,是发展3D语言领域的重要一步。随着研究人员进一步关注框架的准确性和速度,LangSplat有望重新塑造在三维空间中与信息进行交互和查询的方式。

论文网址:https://arxiv.org/abs/2312.16084

项目网址:https://langsplat.github.io/

举报

  • 相关推荐
  • 何小鹏首次披露物理AI巨大进展 发布第二代VLA大模型

    小鹏汽车在2025科技日发布第二代VLA大模型,颠覆传统“视觉-语言-动作”架构,实现端到端直接输出动作指令,开创物理模型新范式。该模型具备动作生成与物理世界理解能力,参数规模达数十亿级,训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载,推动智驾技术显著进化,同步发布“小径NGP”功能,复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示,大模型将成为物理AI世界的操作系统,并宣布与大众汽车达成战略合作,共同推进智能出行发展。

  • 锐我科技正式获得Gala授权 《飞飞:无限宇宙》即将启程

    国家新闻出版署日前公布新版号,经典游戏《飞飞》续作《飞飞:无限宇宙》国服获批。该游戏由GALA研发、锐我科技独家代理运营,将实现三端互通,继承原版飞行系统、人物形象和社交玩法,并优化画面与内容。运营团队正全力推进本地化适配及测试筹备,预约站已上线,玩家可关注官方信息获取测试资格。

  • 三星Galaxy Z Fold7以创新AI体验实现全场景“一步智联”

    三星Galaxy Z Fold7通过Galaxy AI与多模态技术深度融合,重新定义智能手机价值。其极致轻薄折叠设计结合8英寸沉浸屏,搭载升级版Bixby实现语音、文本、视觉的智能交互,支持多任务并行处理。"即圈即搜"简化信息获取,AI助手能转录音频、生成摘要、规划行程,并具备专业影像编辑能力。从办公到生活场景,该设备以直观操作提升效率,成为用户可靠的智慧伴侣。

  • 何小鹏:大众将成小鹏第二代VLA首发客户

    在今日举办的2025小鹏科技日”发布会上,小鹏汽车董事长何小鹏官宣第二代VLA。 他还重磅宣布称,大众汽车成为了小鹏第二代VLA首发客户,同时小鹏自研的图灵AI芯片也获得大众定点。 据悉,第二代VLA也即小鹏首个量产物理世界大模型,既是动作生成模型,也是理解和推演的物理世界

  • AI日报:美团LongCat-Flash-Omni发布;Qwen3-Max上线深度思考功能;百度“文心”5.0重磅回归

    本期AI日报聚焦多领域技术突破:美团发布全模态交互模型LongCat-Flash-Omni;阿里通义千问Qwen3-Max上线深度思考功能;百度文心5.0升级多模态生成能力;谷歌确认Gemini3年内发布并整合至苹果Siri;OpenAI向多国开放Sora2视频工具;云存储与AI开发工具持续优化,展现行业加速迭代态势。

  • 学生可享额外优惠!购三星Galaxy Z Flip7满足你在校园的多样需求

    三星Galaxy Z Flip7双十一期间推出学生专属优惠,折叠设计搭配4.1英寸智能外屏,便于课间快速处理日程和消息。内置Galaxy AI功能,支持文件整理、实时翻译及演讲辅助,提升学习效率。影像系统配备5000万像素双摄和自由拍摄模式,轻松捕捉校园生活。提供珊瑚红等四款配色,学生认证可享额外400元优惠,活动期间还提供保价服务。

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

  • 健康生活从饮食开始 三星Galaxy Watch抗氧化指数体验解析

    三星Galaxy Watch8推出革命性抗氧化指数功能,通过手腕实时测量类胡萝卜素水平。该技术将实验室级传感器微型化,用户仅需5秒扫描即可获得精准数据,将日常饮食转化为可量化指标。类胡萝卜素作为关键抗氧化物质,能有效反映果蔬摄入量,帮助用户追踪长期营养状况。结合睡眠、压力等综合数据,该功能为健康老龄化提供全面洞察,重新定义可穿戴设备在预防性医疗中的角色。

  • AI焕新生活 三星Galaxy S25系列双11惊喜福利放送中

    双11是换机良机,三星Galaxy S25系列以旗舰性能与Galaxy AI赋能成为优选。该系列提供三款机型:S25主打轻巧便携,S25+兼顾大屏与均衡配置,S25 Ultra专注专业影像与强悍性能。全系搭载专业影像系统,支持AI编辑工具;集成实时简报、Bixby跨应用执行及多场景翻译等智能功能,搭配双11专属优惠,助力高效生活与创作体验。

  • 双十一智能手表怎么选?这几款三星Galaxy Watch千万别错过

    双十一选购智能手表时,三星Galaxy Watch系列提供多样选择:Galaxy Watch8设计轻盈简约,适合日常佩戴;Watch8 Classic采用经典旋转表圈,风格优雅百搭;Watch Ultra则主打坚固耐用,专为户外运动设计。三款均搭载全面健康监测功能,包括睡眠分析、跑步教练指导及身体成分测量,帮助用户提升生活质量。根据个人审美与需求,可轻松挑选心仪款式。

今日大家都在搜的词: