首页 > 传媒 > 关键词  > 正文

扫地机器人,不相信视觉导航

2023-10-27 10:51 · 稿源: 站长之家用户

不可置否,激光雷达已经成为扫地机器人的“耶路撒冷”。

导航技术的从无到有

回顾扫地机器人的兴衰,本质是导航技术的从无到有、从弱到强、从少到多,而在这个过程中,激光雷达无疑发挥了无可替代的作用。 2010 年,首先台搭载激光导航技术(LDS SLAM)的扫地机器人Neato问世,它可以通过激光雷达反射计算障碍物的距离并进行环境地图构建,标志着扫地机器人从随机式清扫进入了规划式清扫时代。

十几年间,激光导航技术不断迭代,算法越来越完善,激光雷达的性能越来越强,成本也再不断下探,其精度高、反应快、稳定性高的优势让它成为了当下最成熟的导航技术。对于消费者而言,是否是激光导航,也是判断产品好坏的关键指标。

然而,正如激光导航替代随机式导航,导航技术又在发生新的革新,只是这一次是回到了机器人能够称之为“人”的原点,智能化。同时,大语言模型的兴起,更让智能化愈演愈烈。

人们对机器人的要求不再只是程式化的规划清扫每一块区域,它需要能够知道自身所处什么环境,懂得环境中的各种物体,并能通过人机交互或自主决策,完成跟随、自主寻路、定向清扫等各种智能逻辑。想象一下,简单一句“清扫一下餐桌周围”,机器人便能跑到餐桌区域进行一次规划清扫,自动处理油渍残渣,才应是真正的解放双手。

视觉、激光融合,谁才是未来?

能看“懂”环境,“眼睛”无疑是关键,然而激光导航受限于传感器属性,点云无法区别纹理信息,不具备场景辨识能力,在智能决策和智能交互方面存在天然缺陷。而这时,视觉技术出现在了厂商们的视野内。

视觉技术可以获取更多丰富的纹理信息,拥有强大的场景辨识能力。双目视觉导航通过双目采集到的2D环境信息,经过算法处理生成的3D环境地图,拥有丰富的语义信息,不仅可解算出机器与障碍物的距离,还有它的体积以及属性信息,这对实现智能决策和交互提供了充足的前提条件。然而更丰富的技术效果也意味着更高的开发难度。

由于视觉导航数据处理量巨大,对算力要求很高,且容易受环境光照、参照物的特征信息以及扫地机器人硬件条件等因素影响,算法开发难度很高,也因此导致现有的不少视觉导航方案有着精度低、稳定性不足的缺点,使得视觉一直给人不靠谱的刻板印象,且主要应用于低端产品。

没有人能够忽略视觉表现出的巨大潜力,既然纯视觉不行,如果加到激光导航里呢?

事实证明方法是可行的,融合导航方案显著提升了机器人的感知能力、避障能力和决策能力,从首批融合导航扫地机器人石头T7Pro &科沃斯地宝T8 出现,便打破了长期同质化严重的竞争局面,在消费市场中受到了消费者的广泛认可。在这之后,这类融合导航技术基本成为了高端机型的标配。

但融合导航方案并非没有缺点,成本高、开发难度大,随着传感器不断做加法,不仅对局促的机器人空间带来挑战,同样系统复杂度也明显提高,由此造成更多冗杂的运算压力,而不断提升平台算力,只会导致成本进一步提升。在当下消费紧缩,市场价升量跌的背景下,无疑会加大厂商的运营压力。

视觉能否正名?

技术研发从来没有一帆风顺,每一次迭代都步步维艰,激光导航如此,视觉导航同样需要如此,而行业中也从不缺少吃螃蟹的人。

如何解决视觉导航的精度和稳定性问题,INDEMIND进行了长达 5 年的死磕,并推出市面上新款真正意义上的纯视觉导航方案「家用机器人AI Kit」。

「家用机器人AI Kit」以INDEMIND自研的INDEMIND OS Lite家用机器人AGI系统为核心,搭配面向家用小型机器人专门研发的一体化立体视觉模组,可实现家用机器人导航定位、智能避障、路径规划、决策交互等核心功能,是包含软硬件的ALL IN ONE解决方案。

首先,现有的视觉导航方案在算力上大多需要TX2 及以上,甚至PC级算力需求,对CPU、GPU或NPU、内存均有较高要求,虽然摄像头成本较低,但无形中又增加了成本。而INDEMIND为此研发了多种轻量化技术,轻量化VSLAM(基于深度学习特征的SLAM架构)

、轻量化Depth(基于深度学习特征匹配的Depth)、轻量化深度学习模型(底层算子自研、剪枝、量化),同时还在硬件上,对于视觉处理采用NEON加速、GPU加速、DSP加速等方式,提升计算性能,显著降低算力要求。目前,INDEMIND视觉导航技术搭载 4 核A53/A55 级别芯片即可满足需求,能够适配如RK3566(全解决方案情况下,双目视觉多传感器融合SLAM、双目Depth、物体识别及整机完整SDK)。

同样对于影响较大的环境光照问题,INDEMIND开发了一套系统化环境补光策略,包含主动式环境补光配置和光照变化条件下的建图策略,在实际表现中,面对强光直射、无光源、昏暗等特殊光照环境均能无差异工作,满足全天候作业要求。

在实际表现中,搭载「家用机器人AI Kit」的扫地机器人,导航精度已实现相对定位精度<1%,姿态精度<1°,媲美激光雷达。

而基于独有的立体视觉技术,机器人可以识别物体、人、动物及空间语义,根据扫地机器人家庭应用场景需求,目前定义识别鞋、插线板等多种物体,且识别类别可根据特定需求调整和训练。同时配合智能决策引擎技术,机器人能够有策略的实现智能避障(如根据障碍物不同做出不同规避距离),且在交互上,可通过语音、手势、动作等自然语言指令,命令机器人进行安全、搜寻、跟随、自主寻路、定向清扫等多种智能逻辑。

从产品策略而言,堆料是高端产品的有效策略,但却并非多功能,同时容易陷入内卷难以自拔,能够成就高端的永远是体验。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • 扫地机器人哪个牌子好?全网十大扫地机器人评测

    最近几年扫地机器人新品牌型号层出不穷,各种高端功能植入更是刷新用户眼界,想要找到真正适合自己家庭的机器可还真不是件容易的事,扫地机器人哪个牌子好?全网十大扫地机器人评测你一定要看!1.斐纳TOMEFON斐纳TOMEFON是在德国销量名列前茅的扫地机器人品牌,母公司拥有四十多年的室内清洁领域服务经验,其最新款式做了9项全新技术升级,不仅可以记忆更多的地图更换新房型不需要重新建图清扫全屋速度更快还拥有全局分区规划功能,在清扫大户型房间的时候可以自主将房间划分成若干版块然后逐一清扫,配合及时清洗拖布的话就不会将灰尘带到全屋了;斐纳TOMEFON还拥有非常高端的智能配置,可以做到清洁全屋无误撞,这对于配置了高端家具和高端大理石、实木地板的用户言更为合适,无论家里地形多复杂用斐纳TOMEFON扫地都能做到不磕碰撞坏家具和边缘扫脚,小至0.5厘米的空隙、椅子腿四周都能转着圈深入清理到位,用起来真的很省心;斐纳TOMEFON的使用成本还非常之低,终生免费提供耗材的服务真的能让用户用起来不心疼;最后斐纳TOMEFON还拥有一年故障直接换新,主机保修三年的售后承诺,就连电池都给保修一年,这就更让消费者买着放心用起来安心了。2.iRobotiRobot是全球知名的扫地机器人品牌,最大的优势就是智能配置高端,最大处理能力可以在一分钟内分析23万个以上的数据点,对于复杂地形例如厚窗帘、床底、异形家具的清洁效果到位。10.海尔海尔扫地机器人因为有了母品牌的加持无论是功能植入、售后品质都得到了保证,如果想省心可以放心入。

  • 哪里脏扫哪里,脏污识别将成扫地机器人下一个“卷”点?

    让“人工式”清洁成为可能。同质化竞争中的下一个“卷”点?对于扫地机器人言,脏污识别并非是个新概念,从2022年开始就有厂商提出,只是相较于其它方面的“内卷”,厂商们最初对它的重视程度并不高,目前脏污识别的识别率和类型也都不太理想。相较于激光融合方案,成本只有其1/3,且功能表现也有着明显提升,可广泛应用于家用扫地、陪护、教育、玩具等家用机器人。

  • 扫地机器人哪个牌子好?智能时代热销机型十大品牌

    家里所有的电器几乎都植入了人工智能模块,但是人工智能植入更多就代表机器的清洁效果更好吗?扫地机器人哪个牌子好?智能时代热销扫地机器人的十大排名也许最能说明问题:1.斐纳TOMEFON斐纳TOMEFON是在德国销量领先的扫地机器人品牌,同时也是一款人工智能植入恰到好处的扫地机器人。斐纳TOMEFON配置了第四代LDS激光雷达导航系统、红外接受传感器、悬崖传感器、碰撞传感器的设计,在遇到障碍物时不会直接撞上去也不会为了躲避磕碰出现清洁盲区是会减速缓慢靠近障碍物然后绕圈清洁,既不会留下清洁盲区也不会磕碰撞伤家具,清洁过程特别贴心;斐纳TOMEFON还拥有全局规划智能,在清洁大空间的时候能自主的将清洁区域划分成若干小版块然后逐一清扫,这样的优点就是不会将灰尘垃圾带得全屋都是,特别能保证清洁效果、保护高端地板;斐纳TOMEFON还拥有可以深入地板缝隙4毫米的可浮动胶刷设计,对地板缝隙灰尘的深度清理效果特别到位,既可容纳大块灰尘垃圾快速通过,也不会让地板缝隙累积陈年积尘,深度的清洁效果真的特别贴心;斐纳TOMEFON用起来还特别省心舒适,厂家终生免费提供耗材使用成本极低,因为配置着声学级别的降噪材料可以将湿拖噪音压缩至40分贝以下,无论是休息还是学习时使用都不会影响任何人,像这样一切配置都恰达好处的扫地机器人真的很受用户欢迎。10.德尔玛德尔玛扫地机器人是新品牌,抓住了低价机型的精髓,两千多的机器居然就配置了双增压螺旋地拖、10秒瞬间吸尘、无人驾驶级别的算法加持,再加上7.8厘米的超薄机身,功能丰富程度真的有些让新用户难以置信。

  • 年增速突破116%!追觅扫地机器人增速位居行业领先

    2023年追觅科技扫地机器人在中国线上市场的销额实现了116%的高增速,销量同比增长83%,位居2023年中国线上市场扫地机器人销额/销量占比TOP5品牌中销额、销量行业增速TOP1。追觅科技在技术创新上持续发力,不断促进产品迭代升级;另一方面追觅科技也极为注重洞察消费者需求,让技术服务于用户体验,切实解决用户使用痛点。追觅科技的高增长路径为行业提供了一个可借鉴的�

  • 中国扫地机器人火遍全球!石头科技一季度净赚4亿元

    快科技4月26日消息,今天,石头科技发布了2024年第一季度财报。财报显示,石头科技一季度营收18.41亿元,同比增长58.69%,归母净利润3.99亿元,同比增长95.23%。对于营收和净利的大幅增长,石头科技解释称是由于报告期内,公司前期积极开拓海内外市场的优势进一步得到延续和扩展。通过渠道深耕和合理化的布局,公司产品的销量与上年同期相比显著提升,经营业绩和盈利能�

  • 坚持用户价值为中心 石头科技扫地机器人销额登顶全球第一

    3月29日,主题为“大道如砥”的2024石头科技全球发布会在北京召开,据世界市场调查机构欧睿国际调研数据,石头科技扫地机器人销额全球第一。石头科技总裁全刚表示,石头科技始终以用户价值为中心,做正确的事,坚持长期主义。石头科技致力于成为全球领先的科技家电企业,让全球消费者的生活更有品质感。

  • INDEMIND机器人导航解决方案,让开发更简单,让机器人更高效

    随着机器人进入到越来越多的生产生活场景中,作业任务和环境变得更加复杂,机器人需要更精准、更稳定、更智能、更灵敏的自主导航能力。自主导航技术作为机器人技术的核心,虽然经过了多年发展,取得了长足进步,但在实践过程中,依然面临较多难题,如面对特殊障碍物难以避障、复杂场景精度降低稳定性下降、智能交互支持不足等问题,且地图构建大多仍为传统的2D栅格地图、拓扑地图,缺乏机器人用于理解环境、人机交互等业务的高层次语义信息。结合INDEMIND提供成熟的硬件参考设计和量产设计服务及相对成熟的作业单元技术,整机从立项到量产最快可以控制到2个月以内,大大降低企业的研发周期和投入成本。

  • 国产大模型卷翻机器人!这些火遍全网的机器人,都装上了星火「大脑」

    【新智元导读】大模型这把火点燃了整个机器人行业的热情。纵观全世界,过去几个月,国内外大模型大厂和机器人初创公司的合作也是动作不断。科大讯飞所做的,就是用技术革新,让机器人走进每个家庭。

  • 家纺也AI 世纪华通生态成员已量产验布机器人

    在一块面料上自动找出各种疵点;每分钟“审视”60米,是人工的3倍,漏报在100米3个以内;灵活配置不同的企业检测标准;结果可生成二维码,按需自动生成详实的报表……具备这些能力的智能验布机器人,已由世纪华通生态体系成员艾豚科技自主研发完成,日前投入量产。长久以来,我国的纺织生产线虽然在自动化方面达到了世界先进水平,但在原材料和成品的品质控制环节,�

  • 会颠勺的国产机器人来了!星尘智能推AI机器人Astribot S1 家务活全包

    随着人工智能向通用人工智能目标加速发展,星尘智能公司最新研发的AI机器人AstribotS1,以其卓越的操作性能,在同规格机器人中脱颖出。AstribotS1在未经加速的1倍速视频中,展示了其在家居和工作场景中的多任务能力,包括叠衣、分拣物品、颠锅炒菜、吸尘清洁和竞技叠杯等。它不仅能够完成日常家务能在各种工作场景中提供帮助,展现了AI机器人在未来生活中的广泛应用潜力。

  • Notta Showcase:通过AI技术,轻松实现视频的多语言翻译和配音,连接全球观众。

    Notta Showcase是一款在线视频翻译和配音工具,它通过AI技术帮助用户将视频内容翻译成15种不同的语言,同时保持原始的语音风格和情感,以提供自然的听觉体验。该产品的主要优点包括高效率、成本效益、用户友好的界面、高准确度的转录和翻译,以及支持多种文件格式和平台。它适用于营销、社交媒体和教育等多个领域,可以显著扩大内容的全球影响力。

  • SunoAI API:开源项目,实现AI音乐服务的API接口

    Suno API是一个开源项目,允许用户设置自己的Suno AI音乐服务API。它实现了app.suno.ai的创建API,兼容OpenAI的API格式,支持自定义模式,一键部署到Vercel,并且拥有开放源代码许可证,允许自由集成和修改。

  • x-crawl:灵活的 Node.js AI 辅助爬虫库,让爬虫工作更高效、智能、便捷。

    x-crawl 是一款基于 Node.js 的 AI 辅助爬虫库,它通过强大的 AI 辅助功能,使得爬虫工作变得更加高效、智能和便捷。它支持对动态页面、静态页面、接口数据以及文件数据的爬取,同时提供了自动化操作、键盘输入、事件操作等控制页面的能力。此外,它还具备设备指纹、异步同步、间隔爬取、失败重试、轮换代理、优先队列和记录爬取等功能,以适应不同的爬取需求。x-crawl 拥有类型,通过泛型实现完整的类型,基于 MIT 许可发布,适合需要进行数据爬取的开发者和企业。

  • MetaCLIP:一种用于图像和文本数据的先进机器学习模型,专注于数据质量和透明度。

    MetaCLIP是一个开源的机器学习模型,用于图像和文本的联合表示学习。它通过一个简单算法对CLIP数据进行筛选,不依赖于先前模型的过滤,从而提高了数据的质量和透明度。MetaCLIP的主要贡献包括无过滤的数据筛选、透明的训练数据分布、可扩展的算法和标准化的CLIP训练设置。该模型强调数据质量的重要性,并提供预训练模型,以支持研究人员和开发者进行控制实验和公平比较。

  • AITown:一个虚拟城镇,AI角色在这里生活、聊天和社交。

    AI Town是一个基于MIT许可的可部署启动套件,用于构建和定制您自己的AI城镇版本。这个项目受到了研究论文'Generative Agents: Interactive Simulacra of Human Behavior'的启发,旨在提供一个强大的基础平台,旨在被扩展。后端原生支持共享全局状态、事务和模拟引擎,适用于从简单的项目到可扩展的多人游戏。

  • Vanna:通过自然语言生成SQL查询,简化数据库交互。

    Vanna是一个使用Retrieval-Augmented Generation (RAG) 技术的开源Python框架,用于SQL生成和相关功能。它通过训练RAG模型,将自然语言问题转换为SQL查询,从而允许用户以提问的形式与数据库进行交互。Vanna的主要优点包括高准确度、安全性、私有性、自学习能力,并且支持任何SQL数据库。

  • Fal AI:AI图片生成式开发者平台

    fal.ai 是一款面向开发者的生成媒体平台,提供了业界最快的推理引擎,可以让您以更低的成本运行扩散模型,创造出全新的用户体验。它拥有实时、无缝的 WebSocket 推理基础设施,为开发者带来了卓越的使用体验。fal.ai 的定价方案根据实际使用情况灵活调整,确保您只为消耗的计算资源付费,实现了最佳的可扩展性和经济性。

  • Chat With Llama 3:一个开源的聊天机器人,能够解释概念、写诗、编程、解逻辑谜题。

    Chat With Llama 3 是一个开源的聊天机器人,由Meta AI开发。它能够进行多种智能对话,包括解释复杂概念、创作诗歌、编写代码、解决逻辑谜题,甚至帮助用户给宠物起名。这个聊天机器人的主要优点在于它的多功能性和开源性,使其可以被广泛地应用于各种场景,并且可以根据需要进行定制和改进。

  • AI图片生成与搜索:释放创意,一键生成或搜索超过200万张AI图片。

    AI图片生成与搜索是一个在线平台,利用先进的人工智能技术,允许用户快速生成或搜索各种风格的AI图片。该技术的重要性在于它能够极大提高设计和创意工作的效率,同时降低成本。产品的主要优点包括丰富的图片资源、高效的生成速度、以及用户友好的界面。产品背景信息显示,这是一个面向广大创意工作者和设计师的工具,旨在帮助他们快速实现创意构想。目前,该产品提供免费试用,但具体价格和定位信息未在页面中提供。

  • OpenPerplex:,您的知识门户

    OpenPerplex是一个提供广泛知识资源的在线平台,它通过整合多种信息源,为用户提供了一个便捷的知识获取渠道。该产品以其丰富的信息量、高效的检索能力和友好的用户界面而受到用户的青睐。它不仅适用于个人学习,也适合专业人士进行深入研究。

  • JavaVision:基于Java的全能视觉智能识别项目

    JavaVision是一个基于Java开发的全能视觉智能识别项目,它不仅实现了PaddleOCR-V4、YoloV8物体识别、人脸识别、以图搜图等核心功能,还可以轻松扩展到其他领域,如语音识别、动物识别、安防检查等。项目特点包括使用SpringBoot框架、多功能性、高性能、可靠稳定、易于集成和灵活可拓展。JavaVision旨在为Java开发者提供一个全面的视觉智能识别解决方案,让他们能够以熟悉且喜爱的编程语言构建出先进、可靠且易于集成的AI应用。

  • RMBG:利用AI技术,快速高效地从您的图片中移除背景。

    AI-Powered Background Removal(AI驱动的背景移除)是一款基于AI技术的在线工具,它能够快速且高效地从用户上传的图片中移除背景。该工具的主要优点在于其隐私保护和本地执行能力,即图片处理在用户设备上完成,无需上传至互联网,保证了数据的安全性和处理速度。此外,作为一款开源且完全免费的工具,它极大地释放了用户的创造力,无需担心成本问题。

  • SearchForJohn:一个专注于搜索功能的在线工具

    SearchForJohn是一个在线搜索工具,旨在帮助用户快速找到所需的信息。它以简洁的界面和高效的搜索算法为特点,为用户提供了一个便捷的信息检索平台。该产品的主要优点包括快速响应、准确的搜索结果和用户友好的界面设计。SearchForJohn的背景信息显示,它是由一群对搜索技术充满热情的开发者创建的,旨在解决用户在信息过载时代中寻找特定信息的难题。目前,该产品提供免费试用,但具体价格和定位信息未在页面上明确展示。

  • OpenBioLLM-Llama3-8B:一款专为生物医学领域设计的开源大型语言模型

    OpenBioLLM-8B是由Saama AI Labs开发的先进开源语言模型,专为生物医学领域设计。该模型在大量高质量的生物医学数据上进行了微调,能够理解并生成具有领域特定准确性和流畅性的文字。它在生物医学基准测试中的表现超越了其他类似规模的开源生物医学语言模型,并与更大的专有和开源模型如GPT-3.5和Meditron-70B相比也展现出更好的结果。

  • 小悟空AI:一站式智能工具集,助力创作与运营。

    小悟空是一个集成了多种智能工具的网站,旨在提高个人和团队的创作效率和运营效果。它通过提供诸如文章生成、视频脚本创作、笔记创作等多样化功能,满足不同用户在内容创作、个人表达、学习教育等方面的需求。产品背景基于人工智能技术,结合大数据分析,为用户提供个性化、高质量的服务。价格定位为免费试用,部分功能付费,以适应不同用户的需求。

  • Jasper Chat:AI聊天,感觉出奇地人性化

    Jasper Chat是一个先进的人工智能聊天工具,它通过数十亿的文章、论坛、视频文字稿和网络内容的学习,能够就复杂主题进行详细对话。它的设计易于使用,能够记住对话内容,快速生成有用、适用且独特的内容,并且支持30多种语言。Jasper Chat不仅功能强大,而且使用起来充满乐趣,可以用于写作诗歌、讲笑话、制作剧本或生成日常星座运势等。

  • Transcript Generator:获取任何YouTube视频的转录文本,并使用AI生成文章。

    YouTube Transcript Generator可以下载任何YouTube视频的转录文本,并提供复制、下载、搜索和转换等功能。通过AI将YouTube转录文本转换为文章或博客帖子。

  • Undress AI Tool:通过强大的照片脱衣工具,免费无缝地脱掉任何人的衣服。

    Undress AI Tool是一款强大的深度脱衣应用程序,可以修改图像,使人们看起来像是没有穿衣服。它使用先进的技术准确地修改照片,生成DeepNude和AI成人图像。该工具的主要优点是可以快速准确地创建深度脱衣图像。

  • TinderProfile.ai:用AI生成的图片,提高约会匹配度

    TinderProfile.ai是一个使用AI技术分析用户自拍和照片,生成一组高质量、专业外观的图片,以确保在约会档案上留下良好的第一印象,增加用户获得更多匹配的机会。

  • OpenBioLLM-70B:先进的开源生物医学大型语言模型,专为医疗领域设计。

    OpenBioLLM-70B是由Saama AI Labs开发的先进开源语言模型,专为生物医学领域设计。该模型在大量高质量的生物医学数据上进行了微调,能够理解和生成具有领域特定准确性和流畅性的文字。它在生物医学基准测试中展示了超越其他类似规模开源生物医学语言模型的优越性能,并且在与更大的专有和开源模型如GPT-4、Gemini、Medtron-70B、Med-PaLM-1和Med-PaLM-2的比较中也展现了更好的结果。

今日大家都在搜的词:

热文

  • 3 天
  • 7天