首页 > 传媒 > 关键词  > 悠然无界大模型最新资讯  > 正文

深度解读丨悠然无界大模型BLM-1.0:跨空间、跨任务与跨本体泛化的里程碑

2025-09-30 20:10 · 稿源: 站长之家用户

       9月28日,悠然无界大模型BLM-1.0完成迭代升级,并同步全面开源模型权重、训练代码与评测基准。

该模型在统一模型内实现跨空间迁移、跨任务学习与跨本体泛化能力,它能在保留原生指令跟随能力的前提下无缝迁移到跨本体机器人控制,以单一模型覆盖多种本体,实现跨本体知识共享与一致性控制,并在空间理解、空间推理和空间执行三类评估基准上综合超过同体量SOTA方法。

一、背景与愿景:空间智能的“无界”探索

在工业制造、智慧城市、服务机器人等场景中,AI面临着两大核心挑战:

数字与物理的断层:传统大模型擅长处理语言与视觉信息,但难以在真实物理世界中输出高频、精准的控制指令。

任务与设备的碎片化:不同机器人、不同任务之间模型无法迁移,往往需要重复开发,效率低且成本高。

为解决上述问题,考拉悠然提出“空间智能”战略,并以悠然无界大模型BLM-1.0为核心技术突破口,致力于打造统一的空间基础模型。这意味着:

数字世界中积累的知识能够迁移至真实物理世界;模型可跨场景、跨任务共享认知与策略;单一模型即可实现对多种机器人平台的统一控制。

二、悠然无界大模型BLM-1.0:从多模态理解到空间智能

悠然无界大模型BLM-1.0是一种以多模态世界模型为核心的智能体系统,聚焦于“空间理解—空间推理—空间执行”三大任务目标,实现数字空间与物理世界的知识共享和能力促进。

该模型通过融合视觉、语言、动作等多模态信息,构建出统一的感知、推理与动作预测机制,打通从多模态输入理解到具身行为控制的完整链路。

在整体架构上,BLM-1.0围绕通用智能体的构建目标,推动从静态感知向动态交互、从任务专用向任务泛化的能力跃迁;同时,模型具备高度扩展性与跨场景适应性,能够稳定支持多类型任务与异构本体间的协同操作。

三、BLM-1.0核心理念:三大“无界”能力

悠然无界大模型BLM-1.0的命名寓意着“Boundless”,体现其三大突破:“空间无界—任务无界—本体无界”。

空间无界:BLM-1.0将数字空间中获得的知识迁移至物理世界,进而驱动真实环境下的感知融合、空间推理与机器人控制。这打通了语言与现实的表示鸿沟,实现机器人感知与控制一体化,为模型在具身场景中的应用奠定了基础。

任务无界:BLM-1.0能够在多种任务之间建立语义对齐关系,实现知识和策略的共享与转移。以具身问答为例,模型不仅能识别物体关系和可供性,还能理解任务中的因果结构,从而提升其在长时规划与复杂任务中的决策能力。

本体无界:BLM-1.0在面对不同类型的机器人本体时,仍能保持一致的任务理解与动作生成能力。通过对不同本体的潜在行为模式进行对齐,模型实现了统一的策略表达,支持跨平台的泛化控制与协同操作。从而单一模型控制不同硬件,降低跨平台开发成本。

通过这三大能力,BLM-1.0实现了从“看懂世界”到“协作世界”的完整闭环。

四、技术架构:简洁而强大的双模块设计

BLM-1.0采用“多模态语言模型+扩散式控制头”的简洁结构,将感知与推理与动作控制解耦又紧密协作:

多模态语言模型(MLLM)

负责数字空间的任务,如视觉-语言问答、空间推理等。

输出对场景、任务与意图的高层语义表示。

扩散式控制头

处理物理空间对多种异构机器人的高频控制任务。

将语言模型输出的意图表示,结合实时状态信息,生成连续、精细的机器人动作序列。

整体系统由数据驱动、知识引导与物理约束三项机制共同支撑,覆盖从语言理解到动作生成的完整链路。该结构在保持泛化能力的同时,也确保了系统在多任务、多环境和多本体场景下的执行稳定性与策略一致性。

BLM-1.0采用双阶段训练新范式,使模型既能在数字世界中完成复杂的认知推理,又能在物理世界中精确操控真实机器人。

阶段-1设计具身指令对齐策略,实现原生指令跟随与具身推理的深度融合;

阶段-2提出意图桥接机制,结构化提取多模态语义意图并精准映射至控制模块,打通从理解到执行的闭环路径。

五、数据体系:跨空间、跨本体的训练基石

BLM-1.0提出了全新的跨本体数据合成管道,融合高层意图规划与闭环执行采集,合成大规模高质量机器人数据,构建了覆盖数字与物理两个维度的大规模跨本体数据体系:

数字空间数据

约400万条常规多模态问答数据,确保模型具备良好的语言对齐与多模态指令遵循能力。

150万条空间推理数据,提升模型在三维环境中的理解与推理能力。

5万条空间问答数据。

物理空间数据

基于ManiSkill 平台构建的机器人操作数据,用于支撑跨本体执行能力。

覆盖4种机器人本体×6大任务(如抓取、推送、堆叠、放置、拉动、立柱等)。

通过高层意图规划与闭环执行采集,BLM-1.0保证了数据的多样性与高质量,使其具备跨场景、跨平台的泛化能力。

六、性能表现:全面刷新行业基准

作为首个同时覆盖数字空间与物理空间的统一空间基础模型,悠然无界大模型BLM-1.0支持基础多模态问答、具身问答、空间推理和跨本体机器人操作四类核心任务,在空间理解、空间推理、空间执行三大核心能力上实现突破:在数字空间刷新六项评测基准,在物理空间实现四本体统一控制并刷新了六项任务基准。

数字空间:理解与推理全面领先

BLM-1.0在六大数字空间评测中,包含具身任务推理、导航规划、功能性推理、空间关系理解、属性识别、目标定位、可供性推断任务中平均得分64.88,超越包括GPT-4o 在内的主流模型。

在RoboVQA 任务中表现突出,具身任务推理能力显著提升。

在EgoThink 的“位置预测”“物体属性识别”“情境推理”等子任务中表现稳健。

在ShareRobot 中“正向功能判断”“规划步骤生成”“上下文规划”子任务得分达73.29、60.49、71.22,展现强任务规划能力。

亮点数据:

ShareRobot 任务中“上下文规划”得分85.73,较同类模型提升近30%。

HoloAssist 任务中,多步复杂操作推理准确率领先11%。

物理空间:四种机器人统一控制

物理空间基准测试时,BLM-1.0在跨4种机器人本体(Panda、xArm-6、xArm-7、WidowX AI)各6大不同难度的操作任务中,平均得分达75.83%,超越主流 VLA 模型,验证了 BLM-1.0的跨本体泛化能力。

在Panda机器人的“PushCube(推送立方体)”“PullCube(拉动立方体)”任务中,成功率达100%;在xArm-6机器人的“StackCube(堆叠立方体)”任务中,成功率达86%,显著优于同类模型。

测试示例1| 空间理解与动作推理

在机器人操作场景任务中,BLM-1.0展现出卓越的空间理解与任务规划能力。如图所示,模型需要判断机器人熨烫衣物过程中下一步最合理的动作。

BLM-1.0:正确推理出应压平衣物右侧,选择了C选项,逻辑完整、推理链清晰。

其他模型:未能正确理解任务状态,输出错误答案。

这体现了BLM-1.0在复杂任务分解与跨模态推理方面的领先优势。

测试示例2| 自然语言指令理解

在自由问答任务中,模型需要根据第一视角图像生成准确的空间导航路径。

BLM-1.0:输出的路径规划与真实答案完全一致,评分1.0,能够精确描述“直行→ 右转→ 左侧出口”的完整步骤。

其他模型:回答偏离目标路径,或仅给出模糊指令,评分明显较低。

这表明BLM-1.0具备高水平的环境感知与自然语言理解能力,可广泛应用于服务机器人、导航等场景。

七、应用落地:从工业到服务场景

目前,BLM-1.0已成功应用于多种机器人场景。

智慧文旅:成都世运会期间,联合成都交投信息研发的智能导览机器狗,依托模型空间理解与交互能力,为世运村的运动员提供个性化导览服务。

零售场景:与长虹集团合作研发的展厅/卖场导购机器人,通过模型的“空间感知+主动服务”能力,提升消费场景交互效率。

工业智造:在工业设备安装场景中,BLM-1.0结合UU Holo Glass O1AR工业眼镜,可实时投射安装指引、生成操作指令,将复杂设备的安装返工成本与监督人工成本均下降80%,使作业新标准在24小时内快速同步,并能助力新手在当日掌握基础业务,实现快速上岗。

八、全面开源:共建空间智能生态

BLM-1.0现已面向全球开源,模型权重、训练代码与评测基准全部可用,推动全球开发者与科研机构共同创新:

九、结语:迈向无界未来

悠然无界大模型BLM-1.0的发布不仅是一项技术突破,更是空间智能发展的里程碑。从数字空间的理解与推理,到物理空间的精准执行,BLM-1.0展示了 AI 驱动未来产业变革的无限可能。

悠然无界大模型,让AI从“看到世界”到“协作世界”,开启空间智能无界时代!

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 智元×火花机器人攻克复杂环境集群控制,机器狗方阵演绎精准协同闪耀广州灯光节

    2025年广州国际灯光节上,智元机器狗D1+EDU方阵完成行业首次大型文旅活动机器狗集群协同展演。通过精准步态控制实现方阵变换、同步舞蹈等高难度动作,智能灯带与光影实时联动形成"光河""星空"等视觉效果。该方案攻克了开放场景下多机协同控制技术瓶颈,形成可复制的标准化解决方案,为机器狗在开业典礼、主题展会等场景的规模化应用提供路径,有效破解集群协同难、环境适应性差等行业痛点。

  • 慧辰股份的AI应用破圈 发布机器人智脑“X”平台赋能让硬件更智能

    慧辰股份发布AI战略,聚焦垂直领域打造“专才”而非“通才”AI产品。其四大智能体包括:Data Agent重塑数据分析交互,让业务人员用自然语言分析内外数据;垂直行业数据洞见智能体,专攻非结构化数据价值挖掘;市场需求研判智能体,辅助销售团队把握商机;数字员工管理平台,规模化部署AI应用。通过将AI技术与行业Know-How深度结合,该公司推动AI从“炫技”走向“赋能”,成为产业数字化转型的基础设施。

  • 打破乐器边界:AeroBand空气吉他助力机器人高交会开唱

    2025年11月14日,第二十七届中国国际高新技术成果交易会在深圳开幕。全球智能乐器品牌AeroBand空气乐队携智能乐器亮相,重点展示其明星产品AeroBand空气吉他。该产品是全球首款手自一体智能吉他,曾获2023年红点设计奖,具备手自一体、律动伴唱、APP互动学习及无痛硅胶弦等功能。展会现场,机器人化身演奏家与音乐人同台献艺,引发观众热烈反响。AeroBand通过科技重塑音乐全链路体验,致力于打造新一代智能乐器生态系统,让音乐学习更自由、创作更高效、表演更具突破性。

  • 小米超级小爱AI大模型推出随心修图功能

    小米宣布超级小爱AI大模型推出随心修图功能,用户只需一句话即可轻松修出具有大片质感的照片。该功能有两种使用方式:在相册大图页面直接唤醒AI或通过应用上传照片并输入指令。使用需满足版本要求:超级小爱需v7.8.50及以上,相册编辑功能需v2.1及以上,相册本身需v4.3.0.30及以上。目前仅限Xiaomi HyperAI机型支持在相册大图页使用。超级小爱于2024年12月面向正式版用户开放升级,支持全局多模态交互和自然语音搜索,提升使用体验。

  • 机器人“全能导航大脑”来了!银河通用发布NavFoM大模型

    银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM,实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用,通过统一“视频流+文本指令→动作轨迹”范式,融合800万条跨任务导航数据,在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施,为规模化商业落地奠定关键基础。

  • 从“主动预防”切入,首款家庭具身机器人开启一场大规模社会实验

    星动力公司推出首款家用具身智能机器人星动力H1,通过“千台臻享计划”招募1000个体验家庭,开展大规模用户共创活动。该产品定位“主动预防”健康管理,集自主移动、精细操作、环境感知与人机协同于一体,致力于成为家庭智能伙伴而非单一功能设备。此举旨在探索具身智能在非标准化家庭场景中的可行性,通过真实用户反馈持续优化产品,为人机协同模式提供实践样本。

  • Billus AI高交会全球首发多模态大模型 以AI Agent重构创意产业文明进化路径

    2025年11月15日,Billus AI在高交会首发多模态大模型Billus0.57EDIT及“超级员工智能体”初阶版,依托自研生存式大模型与AI Agent技术,打破创意领域垂直局限,构建覆盖文创、时尚、艺术等全场景智能创作生态。该模型通过自然语言指令直达创意成果,实现从平面图到施工图的全流程高效生成。同时,Billus AI同步打造“创意设计超级员工+产业链智能体”体系,探索生成式创意与供应链智能推荐的新商业路径,助力行业从“经验驱动”向“数据智能”跃迁。

  • AI效果涌现:无人驾驶打开“移动的生活空间”

    AI普惠,从梦想走进现实。 近年来,中国的AI落地突飞猛进,智能体成为最受青睐的AI原生应用发展方向、数字人成为企业降本增效的利器、AI搜索成为大众最佳的上网伴侣…… 不难看出,中国AI正在深挖场景价值。 对此,彭博社前不久发表了《硅谷有多少技术建立在中国AI基础之上》一文,坦承中国AI正在吸引全球用户,获得硅谷的青睐。 作为全球为数不多拥有全栈AI技术�

  • 人形机器人让小鹏走上了神坛

    这场由机器人引爆的重估,效果或许超乎小鹏汽车董事长兼CEO何小鹏的预料。 IRON登场那几天,全网都在找拉链,还有批评声指出,何小鹏在演戏。这种不信任,恰恰是市场对小鹏,乃至所有中国车企的刻板印象:会堆料、会营销,但搞不定具身智能这种真科技。 市场越是质疑里面藏人,那把最终亮出的剪刀就越有分量。何小鹏要的,本就不是一句“信了”,而是一个迫使资�

  • 联合国向善机器人青少年挑战 首次登陆中国

    国际电信联盟与联合国粮农组织联合发起的“2025-2026国际电联机器人向善青少年挑战赛”在中国启动。这是联合国官方支持的青少年人工智能与机器人活动首次在华举办,标志着中国青少年科技创新教育与国际标准全面接轨。赛事以“粮食安全”为主题,邀请全球10-18岁青少年设计机器人应对农业挑战,探索AI在智慧农业等领域的应用。中国区活动由复旦大学等承办,将于2026年3月在上海举行总决赛,优胜队伍将代表中国参加全球峰会。活动旨在培养青少年科技向善理念,通过实践提升创新能力与全球视野。

今日大家都在搜的词: