HaLo-NeRF：学习几何导向语义以探索无约束照片集

2024-04-29 11:39 · 稿源：站长之家

站长之家（ChinaZ.com）4月29日消息:HaLo-NeRF是一款创新的系统，它结合了场景的神经表示和描述场景语义区域的文本，以实现对大型地标场景的深入理解和探索。该系统利用最新的视觉和语言模型，特别针对地标场景的语义理解进行了优化，将场景的视觉信息与描述性文本紧密相连。

HaLo-NeRF的关键特点包括:

语义区域定位: 系统能够准确地定位与建筑地标相关的各种语义概念。
超越传统模型: HaLo-NeRF的结果超越了其他3D模型和强2D分割基线。
利用互联网数据: 系统通过分析大型互联网数据集，包括类似地标的图像和弱相关的文本信息，来增强模型的细节知识。
3D兼容的分割指导: 利用场景视图之间的对应关系来启动空间理解，并为3D兼容的分割提供指导。
立体场景表示: 最终形成立体的场景表示，为数字化探索大型旅游景点提供了新的可能性。

先前工作的局限性:

以往的研究主要集中在几何重建和可视化上，而没有充分利用语言在提供导航和细粒度理解方面的语义界面作用。此外，受限的3D领域中的方法虽然利用了视觉和语言模型，但在处理无约束照片集合时面临挑战，因为它们缺乏对建筑领域的专业知识。

HaLo-NeRF的创新之处:

HaLo-NeRF通过在互联网上大规模的图像数据中使用场景视图之间的对应关系，提供了语义的空间理解指导。这不仅增强了模型对建筑地标的专业知识，还提供了3D兼容的分割，为形成立体场景表示奠定了基础。

应用前景:

HaLo-NeRF系统在数字化探索大型旅游景点方面具有巨大潜力，它为互联网图像集合的探索提供了一种新的语义理解方法。

论文地址:https://huggingface.co/papers/2404.16845

（举报）

相关推荐

关键词：

HaLo-NeRF

登顶！华为OceanStor A系列存储再登MLPerf全球性能之巅

2025年8月5日，华为OceanStor A系列存储联合济南超算研究院在MLPerf® Storage v2.0基准测试中斩获多项全球第一。在3D U-Net训练场景下，OceanStor A800以698GiB/s带宽刷新全球记录，支持255张H100 GPU；A600每U带宽达108GiB/s。新增的Checkpointing测试中，华为存储在Llama3模型场景下读写带宽领先。该测试涵盖26家厂商，验证了存储系统对大规模AI算力的支撑能力。华为通过架构创新实现EB级扩展、99.999%高可靠，并推出128TB大容量SSD，能效低至0.7W/TB，持续推动AI大模型训练与推理场景的技术突破。

AI性能评测 MLPerf Storage
3节点集群带宽突破 513GBps 焱融存储再度登顶MLPerf Storage 全球榜单

2025年8月4日，MLCommons®发布最新MLPerf® Storage v2.0基准测试结果。中国厂商焱融科技的全闪存一体机F9000X表现突出：在3D-Unet模型测试中以三节点存储集群实现513GB/s总带宽，刷新全球纪录；在ResNet50、CosmoFlow等所有模型测试中均领先，登顶性能榜单。新版本新增Checkpoint工作负载测试，覆盖模型存档等实际场景。测试显示F9000X在分布式和单节点场景均表现优异，其中Llama3-70B模型测试

MLPerf 存储性能焱融科技
内外双屏随心定义快用Good Lock“打扮”你的三星Galaxy Z Flip7

三星Galaxy Z Flip7折叠屏手机凭借精致设计和出色体验获得消费者青睐。文章重点介绍了通过"Good Lock"应用深度定制手机的方法：1)Home Up和主题公园提供主屏幕布局和主题综合定制；2)LockStar可自定义锁屏界面，添加常用APP快捷入口；3)Keys Cafe打造个性化键盘效果；4)ClockFace为外屏时钟添加文字/图片/GIF动图；5)MultiStar新增FlipShot功能，为自拍用户提供动态背景特效。这些工具让用户能根据个人喜好，从界面布局到细微功能进行全面定制，将手机打造成彰显个性的专属设备。

三星Galaxy Z Flip7
荐“治愈系”日本留学生@树莓。衮如何靠摆烂vlog让400万粉丝追更？

在叠满美颜滤镜和“人均天花板”的抖音精选，一个画风格外清奇的账号杀出重围。镜头前的女孩素面朝天，打着哈欠伸懒腰，甚至毫不介意露出微胖的小肚腩。她自嘲“留学的留是留级的留”，在vlog中记录赶电车迟到时的气急败坏、听不懂课的一脸懵、甚至被黑心中介坑骗的委屈。

抖音留学生活日常vlog
全新小鹏P7正式亮相：跑车级黄金车身比例纯平发光LOGO

全新小鹏P7今晚正式亮相，官方称其拥有同级最好的比例姿态。全新小鹏P7拥有极致的姿态表现，其宽高比达1.40，长高比为3.57，轮高比是0.52，这样的跑车级黄金车身比例，使其在视觉效果上甚至超越了保时捷Panamera（帕梅）。 1407mm的超低车高，营造出强烈的贴地飞行既视感。而142mm高通过性离地间隙，在保证车辆行驶稳定性的同时，还能从容应对一些复杂路况。在宽体进化

小鹏P7 跑车级比例车辆操控
ColorOS 16 Beta开启尝鲜招募首批机型含一加13等

今日，ColorOS开启Beta测试版本招募，数码博主数码闲聊站”透露，此次Beta测试为全新ColorOS 16。本次招募首批机型为一加13、一加13T、OPPO Find X8系列、OPPOFind N5，每款机型均招募300人，符合机型条件的可在8月12日17:00之前报名。

ColorOS Beta测试系统更新
WEEX亮相里约热内卢Blockchain.RIO：以社区为核心驱动全球化进程

拉美地区Web3盛会Blockchain.RIO在巴西里约热内卢成功举办，WEEX交易所作为铂金赞助商亮相。WEEX首席运营官Andrew发表主题演讲，重点介绍WXT经济设计理念和平台生态发展战略，强调"流动性建设与平台生态发展"的运营思路。此次活动标志着WEEX全球化战略在拉美市场的深化推进，通过"技术稳健、社区参与、合规发展"三位一体策略构建品牌竞争力。WEEX将持续强化本地�

Web3 Blockchain.RIO WEEX交易所
微云全息（NASDAQ: HOLO）提出基于LSTM加密货币价格预判技术：投资决策的智慧引擎

文章探讨了区块链技术兴起背景下加密货币价格预测的挑战。由于加密市场缺乏监管、波动剧烈，传统预测方法效果不佳。微云全息(NASDAQ:HOLO)提出基于LSTM神经网络的价格预测技术，通过收集清洗多维度交易数据，构建深度学习模型，显著提高了预测准确性。相比传统方法，该技术能更好捕捉价格长期依赖关系，为投资者提供个性化预测服务。未来将结合强化学习、生成对抗网络等新技术，进一步提升预测精度。

区块链加密货币金融预测
荐AI日报：可灵2.1推出全新首尾帧功能；昆仑万维上线AI音乐模型Mureka V7.5；腾讯云推出AI开发工具CloudBase AI CLI

本文介绍了AI领域最新动态：1)快手可灵2.1推出首尾帧功能，提升视频生成效果；2)昆仑万维发布Mureka V7.5音乐模型，优化人声表现；3)腾讯云推出AI开发工具CloudBase AI CLI，可减少80%编码量；4)海外新品MuleRun通过虚拟机和AI Agent带来创新游戏体验；5)Meta开源DINOv3视觉模型，无需标注即可实现卓越性能；6)宇树科技人形机器人H1获1500米赛跑金牌；7)谷歌Gemini新增记忆功能和隐私聊天模式；8)香港大学开源OpenCUA框架，打造个性化电脑助手；9)OpenAI考虑在ChatGPT引入广告；10)谷歌发布超小型开源模型Gemma 3 270M，支持手机端运行。

AI日报快手可灵视频生成
荐10后小孩靠做饭Vlog涨粉百万，戳中了哪些流量密码？

见惯了打工人的生活日常，你见过小学生的放学做饭日常吗? 近期，一批10后“小孩哥”“小孩姐”凭借做饭Vlog在网络上刷屏，他们娴熟的厨艺与稚嫩的外表形成强烈反差:10后小女孩站在灶台前动作娴熟地颠勺翻炒，上二年级的小男孩在菜市场熟练地和摊主讨价还价，回家后做出三菜一汤…… 这种反差感极强的场景，正通过短视频平台持续发酵，单个视频甚至收获超500万的

小学生做饭儿童Vlog 反差萌

今日大家都在搜的词：

热文

3 天
7天

HaLo-NeRF：学习几何导向语义以探索无约束照片集

登顶！华为OceanStor A系列存储再登MLPerf全球性能之巅

3节点集群带宽突破 513GBps 焱融存储再度登顶MLPerf Storage 全球榜单

内外双屏随心定义快用Good Lock“打扮”你的三星Galaxy Z Flip7

荐“治愈系”日本留学生@树莓。衮如何靠摆烂vlog让400万粉丝追更？

全新小鹏P7正式亮相：跑车级黄金车身比例纯平发光LOGO

ColorOS 16 Beta开启尝鲜招募首批机型含一加13等

WEEX亮相里约热内卢Blockchain.RIO：以社区为核心驱动全球化进程

微云全息（NASDAQ: HOLO）提出基于LSTM加密货币价格预判技术：投资决策的智慧引擎

荐AI日报：可灵2.1推出全新首尾帧功能；昆仑万维上线AI音乐模型Mureka V7.5；腾讯云推出AI开发工具CloudBase AI CLI

荐10后小孩靠做饭Vlog涨粉百万，戳中了哪些流量密码？

今日大家都在搜的词：

热文

REDMI Note 15系列定档将于8月21日发布

苹果正式入驻小红书 iPhone 17系列下月发布

华为余承东官宣：鸿蒙智行首款旅行车享界S9T今日开启预售

REDMI Note 15 Pro+外观公布：配备全等深微曲屏幕与机身

享界S9T开启预售：32.8万起华为鸿蒙智行旗下首款旅行车

真我15系列官宣9月发布号称轻薄影像神器

曝iPhone18标准版推迟到2027年折叠屏与Pro系列率先登场

AI日报：腾讯推音效生成工具AudioGenie；阿里推智能体WebWatch

转战播客赛道！罗永浩微博改名“罗永浩的十字路口”

REDMI Note 15 Pro系列支持IP66/IP68/IP69/IP69K

苹果iOS 18.6.1正式版发布：美版Apple Watch血氧功能上线

AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-

全球首款女团机器人10580元拍出接入京东Joy Inside智能体

REDMI Note 15系列定档将于8月21日发布

AI日报：可灵2.1推出全新首尾帧功能；昆仑万维上线AI音乐模型M

华为MatePad Air 12英寸2025发布：售价2799元起

苹果正式入驻小红书 iPhone 17系列下月发布

REDMI Note 15 Pro系列官宣下周发布

阿里小号宣布暂缓停服：可继续正常使用

华为MatePad 11.5 S官宣8月15日发布

站长商机