首页 > AI头条  > 正文

全球首个跨本体全域环视导航大模型 NavFoM 发布

2025-11-05 11:33 · 来源: AIbase基地

近日,银河通用联合北京大学、阿德莱德大学和浙江大学等团队,推出了全球首个跨本体全域环视的导航基座大模型 ——NavFoM(Navigation Foundation Model)。这一创新性模型旨在将不同的机器人导航任务整合到一个统一的框架中,包括视觉与语言导航、目标导向导航、视觉追踪以及自主驾驶等多种应用场景。

image.png

NavFoM 的特点之一是其全场景支持能力,不论是室内还是室外场景,模型都能够在未见过的环境中实现零样本运行,无需额外的建图或数据采集。这意味着用户可以更加便捷地应用该技术于多种环境中,而无需繁琐的准备工作。

此外,NavFoM 还具备多任务支持功能,能够通过自然语言指令实现目标跟随和自主导航等任务。这一设计使得不同机器人能够快速适配,从机器狗到无人机、从轮式人形到汽车等不同尺寸的机器人均能在这一框架下高效运作。

在技术层面,NavFoM 引入了两个关键创新:首先是 TVI Tokens(Temporal-Viewpoint-Indexed Tokens),使模型具备理解时间和方向的能力;其次是 BATS 策略(Budget-Aware Token Sampling),这允许模型在计算资源有限的情况下依然表现出色。

image.png

值得一提的是,NavFoM 还构建了一个庞大的跨任务数据集,包含约八百万条跨任务、跨本体的导航数据,此外还包括四百万条开放问答数据。这一训练量是以往工作的两倍,使模型具备更强的语言与空间语义理解能力。

NavFoM 的发布标志着机器人导航领域的一次重大进步,开发者可以基于这一模型,通过后续训练,进一步发展出符合特定需求的应用模型。

划重点:

🌟 NavFoM 是全球首个跨本体全域环视导航大模型,能够统一多种机器人导航任务。

🏞️ 模型支持室内外场景的零样本运行,无需额外建图和数据采集。

💡 引入 TVI Tokens 和 BATS 策略,提升模型在理解时间、方向及算力受限情况下的表现。

  • 相关推荐
  • 机器人“全能导航大脑”来了!银河通用发布NavFoM大模型

    银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM,实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用,通过统一“视频流+文本指令→动作轨迹”范式,融合800万条跨任务导航数据,在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施,为规模化商业落地奠定关键基础。

  • 北汽元境智能正式发布 车辆升级“全域智能体”

    10月28日,北汽极狐全新阿尔法T5上市发布会举行,北汽集团正式发布“北汽元境智能”技术架构。该架构覆盖从底层到体验、从真实到仿真世界的技术体系,实现研发到量产落地,展现北汽在智能网联汽车领域的最新成果。其核心为“全域融合”,通过三大层次——舱驾融合、跨生态AI融合、真实与虚拟世界融合,打破技术边界,提升智能驾驶与座舱体验。同时推出元境智驾和元境智舱两大产品,覆盖L2至L4全阶智驾,并强调安全开发理念,累计测试超5000万公里。北汽以开放平台与伙伴合作,推动智能出行技术进化。

  • 易鑫正式发布汽车金融行业首个Agentic大模型

    易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿,响应延迟低于200毫秒,支持语音实时交互,单卡吞吐达370 tokens/秒,可提升获客、风控与运营效率,解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台,研发投入超20亿元,率先实现AI全场景应用,将持续推动智能汽车金融生态建设。

  • 全球17连冠后,海尔冰箱发布AI+新鲜方案开启新赛道

    海尔冰箱在行业百年发展中持续创新,面对市场增量收窄挑战,推出“AI+新鲜”方案,以AI科技赋能保鲜技术。其磁控全空间保鲜科技获国家科技进步奖,实现肉类冷藏10天仍鲜嫩,海鲜冷冻60天风味如初。AI系统能识别超3500种食材并智能推荐存储位置,生成个性化保鲜方案,高效净化异味与有害物质。凭借全链路研发优势、全球领先的专利数量和智能制造工厂,海尔冰箱在2025年实现多项行业第一,持续引领智能化、个性化转型,助力行业升级。

  • 谣言止步!巨量千川直播全域推广真相速递,大促投放不踩坑

    今年双11第一阶段,超八成商家和七成达人选择直播全域推广抢占流量先机,实现GMV爆发式增长。针对“效果无保障”“转化差”“调控不灵活”等质疑,官方解读指出:该推广模式能精准触达目标人群,通过智能调控提升投放效率,达人合作效果显著,有效破除不实传言。

  • 登榜LMArena!文心大模型5.0-Preview文本能力国内第一

    11月8日,文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出,超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容;复杂长问题理解适用于学术问答、报告分析等任务;指令遵循能力支持智能助理、代码生成等场景,为多领域内容生产提供高效支撑。

  • 首个AI“全面落地”的双11,有什么不一样?

    2025年双11来到了它的17岁,以人来类比,过了蛇年就告别了青少年,进入它的青年时代。大多数人认为今年双11会在平淡中度过,但星图数据显示,仅截至10月31日,双11大促全网累计销售额就达到10026亿元人民币。 天猫仍居综合电商平台榜首位置,京东紧随其后,抖音位列第三。以这个快速上扬的曲线推演,今年双11大促对消费的拉动,将远超其他时间节点。 它在步入青年时�

  • AI日报:广电整治AI动画乱象;360发布大模型安全白皮书;百度推出小度AI眼镜Pro

    国家广电总局宣布自2026年3月起全面整治AI生成内容,要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》,提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro,集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX,实现文本化语音编辑。Grok新增纯文本生成视频功能,17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠,并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型,优化开发者体验。

  • “进博会是全球创新落地中国的桥梁”

    进博会八年来溢出效应持续扩大,成为全球创新对接中国机遇的重要平台。三星作为连续八年参展的企业,通过进博会展示前沿技术并转化为商品,涵盖折叠屏手机、AI家电、半导体等领域。本届展会以人工智能为核心,推出智能指环、AI家庭解决方案等创新产品,推动产业高端化、智能化发展。同时,三星加大在华投资,优化供应链布局,带动本土产业链升级,实现与中国市场深度融合、共同成长。

  • 全球“双11”热潮席卷俄罗斯!即将引爆Yandex Market平台流量!

    2025年俄罗斯电商旺季即将开启,中国“双十一”购物节已发展为全球商业盛事。俄罗斯电商平台Yandex Market将“双十一”作为重要促销节点,数据显示2024年其销售额同比增长1.4倍,订单量增长1.7倍。平台将于11月29日在深圳举办品牌峰会,发布招商、物流及流量政策重大调整,并邀请胡锡进分享俄罗斯电商机遇。俄罗斯电商旺季持续4个月,占全年销售额一半以上,成为跨境卖家重要增长机会。

今日大家都在搜的词: