首页 > 传媒 > 关键词  > 正文

让机器人懂得人类“常识”,3D语义地图能做到吗?

2023-08-11 10:29 · 稿源: 站长之家用户

机器人需要一张保姆级地图。

随着机器人的智能化技术不断迭代,对于复杂的行为决策、人机交互等任务仅感知环境的空间几何信息已无法满足要求,它需要让机器人能够像人一样,懂得环境中的物体类别及其位置,即环境的语义信息。以扫地机器人为例,一个清扫餐桌底部的任务便要求它需要知道目标的类别和位置。然而目前主流的传统2D栅格地图、拓扑地图虽然能够描述环境中存在的障碍物几何特征及其环境结构信息,但却缺乏机器人用于理解环境、人机/物机交互等业务逻辑的高层次语义信息,相反,3D语义地图不仅包含物体及环境的结构信息,还有物体类别、功能属性等“常识”性信息,可以说是机器人的保姆级地图。

从技术角度而言,3D语义地图的地图模型是针对真实场景的三维环境重构,包含区域性场景信息及场景中每个独立物体的属性、空间中的三维模型、位姿信息等,使机器人在语义层次上理解环境信息,模仿人类大脑对环境理解的方式,从而为实现更高层次的智能化操作提供信息支持。

如何构建3D语义地图?

要构建3D语义地图,前提是需要提取出你所需要的物体特征,并进行语义切割。INDEMIND在实现构建3D语义地图中,采用了立体视觉技术路线,通过对双目视觉传感器获取到3D视觉点云信息进行点云聚类,并结合边缘端的嵌入式深度学习和VSLAM算法,输出个体性物体语义和区域性场景语义,从而实现3D语义地图构建。

在真实场景中,无论是家庭、公司还是超市,大多拥有着 3 个及 3 个以上的细分场景,且这些场景大多有着相似性,当机器人收到指定房间作业任务后如何快速准确地理解房间的功能属性,找到对应房间,并能根据不同房间的功能属性进行个性化作业还需要极 高的场景理解准确度。

因此,INDEMIND是根据输出的区域性场景语义和个体性物体语义二者融合的方式实现场景理解。首先,根据获取到的区域性场景语义信息,进行整体特征识别;其次,会根据个体性物体语义识别,对场景中一系列独立个体信息进行识别,并作为场景特征标志,最终通过二相叠加判断,实现准确稳定地场景理解。

在实际表现中,应用3D语义地图的机器人,结合INDEMIND VSLAM算法和智能决策引擎,在AI识别、智能避障、指令智能作业、人机/物机交互等方面均有优异表现。

在AI识别和避障方面,基于3D语义地图,能够快速提取环境中各类图像特征,结合深度学习可立体识别行人、动物、固定/移动物体等个体性障碍物,以及楼梯、自动扶梯等危险场景,避免危险情况发生,这种结合物体3D信息的识别和避障效果的稳定性、准确率都得到显著提升。同时,通过识别到与显示匹配的障碍物3D信息,机器人还可做出类似人类规避动作的精细化操作,能够让机器人有预判、有策略的实现主动避障。

image.png

障碍物检测示意

在交互和智能作业方面,3D语义地图通过对场景中独立个体、房间信息做语义识别及物体分割,机器人懂得人类“常识”后,便能实现高层次的交互逻辑,配合INDEMIND自研的自然语言交互技术,可通过语音、手势、动作等指令,命令机器人进行安全、搜寻、跟随、自主寻路、定向清扫等多种智能作业逻辑。以定向清扫为例,发布语音命令:“清扫一下卧室”可被识别为针对地图上识别到的卧室区域进行一次规划清扫,告别粗糙的交互体验。

目前,3D语义地图技术已应用到INDMEIND推出的家用机器人导航方案「家用机器人AI Kit」和商用机器人导航方案「商用机器人AI Kit」中,两种方案的市场表现均得到了客户的广泛认可。

值得一提的是,两种方案由于采用视觉技术路线,在成本方面相对于竞品均有着明显优势。「家用机器人AI Kit」在实现同等水平的技术效果的同时,成本只有激光雷达融合方案的1/3,且激光视觉融合方案虽然也能获取到场景中的语义信息,但受限于传感器限制,事实上只能识别到物体的二维信息,无法构建3D语义地图。「商用机器人AI Kit」相比激光雷达方案,成本下降了60-80%,机器人开发成本最 低可以下探到 2 千元以内,包含导航和电池的完整底盘成本则可以下探到 5 千元以内,显著降低机器人的开发成本和周期。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 高德地图上线AR打卡功能:实现3D立体打卡 生成专属打卡视频

    阿里巴巴旗下高德地图正式上线创新AR打卡功能,通过深度整合AI技术与地图服务,为用户带来虚实融合的沉浸式打卡体验,无缝连接现实世界。 该功能依托前沿AI空间融合技术,突破传统二维地图限制,首创3D立体打卡。用户打开最新版高德地图App,点击右上角 ”号即可轻松开启AR之旅。 支持图片、视频、趣味AR道具及虚拟形象等多种打卡形式,完成打卡后系统将自动生成并

  • 普渡机器人发布AI扫吸推机器人PUDU MT1 Vac,重新定义智能吸尘新标准

    普渡科技7月15日发布AI扫吸推机器人PUDU MT1Vac,专为大面积吸尘场景设计。产品采用双独立风道系统,吸尘效率提升200%,配备20L超大容量尘污分离系统,单次作业可覆盖1000㎡酒店地毯清洁需求。机器人具备55cm超宽吸尘宽度,集成HEPA级过滤系统,能识别不同地面材质自动调节吸力。搭载激光SLAM+视觉VSLAM融合定位系统,适应酒店、商超等复杂场景。该产品填补了大容量高效吸尘机器人市场空白,推动行业智能化升级。

  • 对话五条人AI MV主创:究竟是人带着AI飞,还是AI带着人类飞

    五条人的美学坐标,锚定在一些具体的意象上,比如县城、故事、人字拖,以及那个标志性的红色塑料袋。他们的音乐与视觉,植根于一种生猛、市井、充满“塑料感”的现实肌理之中。 这样一个极具草根性与现实质感的乐队,与当下最前沿的AIGC技术相遇,结果会是什么? 答案可能就在他们最新专辑同名曲《地球恋曲》的官方MV里。 身着银色宇航服的二人,背着一个巨大的�

  • 空调行业跟风较上劲 !海尔风随人动、避人吹,格力也推出空调机器人

    2025年上半年空调市场持续火热,线上销售额同比激增50%,线下增长16%。美的、格力、海尔三大品牌占据约70%市场份额,并在"送风体验"创新领域展开激烈竞争。海尔推出"聪明风系列"应用AI人感防直吹技术,实现"风随人动";美的升级无风感技术,内置毫米波雷达2.0系统;格力则推出"空调机器人控制"专利技术,通过多模态模型动态调节送风。三大巨头通过技术创新保持市场优势,上半年份额出现细微波动(海尔+0.7%、美的+0.1%、格力-1.4%),显示行业竞争持续升级。

  • 智慧养老再升级!海尔养老机器人矩阵亮相老博会

    文章主要探讨了在人口老龄化背景下,传统养老服务模式面临人力依赖重、效率低等挑战,科技赋能成为破局关键。海尔在2025年青岛国际康养产业博览会上展示了一系列AI产品,包括衣物洗护机器人、助行机器人等,系统化呈现了科技赋能居家养老的可行路径。其中,海尔智能衣物洗护机器人能实现从洗衣到收纳的全流程自动化,减轻老年人负担;AI运动外骨骼机器人W1则通过柔性算法等技术,帮助老年人稳健行走。文章强调,智慧养老不仅要解决显性问题,更要关注不易察觉的生活痛点,海尔以"无人家务"为方向,加速布局家庭服务机器人场景应用,推动养老从"被动辅助"向"主动赋能"转型,为构建更高效、人性化的智慧适老新方案提供科技支撑。

  • 国内首个!高德地图正式上线多语言地图:新增14种语言

    日前,高德地图正式上线多语言地图,在原有的中英文基础上,新增多达14种语言。 这14种语言包括西班牙语、葡萄牙语、法语、德语、泰语、日语、韩语、土耳其语、意大利语、俄语、阿拉伯语、马来语、印尼语、越南语。 此次多语言版的推出,使更多非英语国家的用户也能享受高德地图提供的优质出行服务。 高德地图多语言版实现了产品界面与地理信息的多语种适配,�

  • LiblibAI 重磅发布「星流 Agent」:中文语义 + 图片视频3D全能生成,中国最强设计 Agent

    LiblibAI推出Lovart中文版"星流Agent",这是一款专为中国市场深度优化的AI设计工具。该产品在保留Lovart全球版"生成-编辑-排版-交付"全链路能力基础上,针对中文语义、国风审美和本土使用场景进行了全面重构。星流Agent支持从创意构思到设计交付的全流程自动化,可处理平面设计、视频生成和3D建模等跨模态创作,内置符合中国文化的视觉风格库。该产品的推出标�

  • INDEMIND:停止堆功能,扫地机器人需要回归第一性原理

    文章批评当前扫地机器人行业过度追求"花哨"功能而忽视核心清洁能力的问题。厂商为差异化竞争不断叠加视频通话、机械手等创新功能,却导致产品复杂化、故障率上升,用户体验未获实质提升。指出行业应回归本质,聚焦感知、规划、决策三大核心能力升级,解决避障不佳、覆盖率低等基础痛点。介绍INDEMIND公司通过立体视觉技术构建三维语义地图,实现厘米级障碍

  • 从“形态自由”到场景适配智元灵犀X2-N重塑机器人移动边界

    上海智元公司7月7日发布灵犀X2-N人形机器人,创新采用轮足双形态自由切换技术,突破传统机器人移动方式局限。该机器人能在1秒内完成形态转换:足式状态下可稳定负重12公斤上下台阶;轮式模式下能高效穿越复杂地形。六自由度机械腿结构配合平滑步态控制,确保切换快速稳定。产品线覆盖办公、展览等多场景需求,价格从十几万至三四十万元不等。这一突破性设计推动人形机器人从"能移动"向"会适应"跨越,为行业发展提供新技术范式。

  • 中科新松推人形机器人双机,自主移动+柔顺控制赋能智造升级

    2025年机器人赛道持续升温,中科新松推出两款人形机器人"睿可MR73A"和"睿可MR73B"。MR73A侧重交互与灵巧操作,具备27个自由度的双臂系统,支持语音交互和AI视觉技术;MR73B聚焦高效物流搬运,具备智能升降和自主导航能力。两款产品突破传统工业机器人局限,强调移动性、环境感知与人机协作,瞄准工业4.0柔性制造和商业服务场景。中科新松通过核心技术平台实�