首页 > 传媒 > 关键词  > 人工智能最新资讯  > 正文

实现SLAM的突破和应用,小笨智能机器人是如何做到的?

2024-06-18 15:20 · 稿源: 站长之家用户

2024年,人工智能移动机器人已在各行各业被广泛应用,正逐渐成为我们生活中不可或缺的一部分。

与此同时,SLAM技术作为其中的关键组成部分,日益受到人们的关注,其市场需求也愈加旺盛。

机器人核心技术SLAM,吸引大厂纷纷入局

SLAM即Simultaneous localization and mapping,也叫“同步定位与地图构建”,意思就是要让机器人能够在未知环境中自主导航、建图,并实现比较准确定位。

也就是说,将一个机器人放入未知环境中的未知位置,让机器人一边逐步描绘出此环境完全的地图,同时一边决定机器人应该往哪个方向行进。

作为自主定位导航技术的重要突破口,SLAM毫无疑问成为了机器人和无人驾驶领域的核心技术之一,持续吸引华为、百度、腾讯等大厂入局,也已经在越来越多领域得到实际应用。

如图所示,在西城区政务服务中心的小笨智能机器人可为群众提供智能引领服务,且遇到障碍物后可准确识别并绕行。

比如,百度、腾讯、滴滴等将SLAM应用在高精度地图和智能驾驶解决方案中。

京东、顺丰、阿里等则聚焦智能物流,针对物流运输和配送场景,生成自动驾驶货车和配送机器人。

此外,从大疆的无人机,到小米和科沃斯的扫地机器人,再到优必选、小笨智能的各种服务机器人,SLAM无一不是其中的技术核心。

以国内较早上市的小笨智能交互机器人为例,其以SLAM技术作为基础,能够实时感知周围环境:当访客需要引领服务时,机器人可开启智能导览功能,将访客准确引领至目的地,并通过多传感器融合准确避开行进方向上的障碍物,服务完成后还可自动回到原先接待位置,为迎接下一批访客做准备。    

长期深耕技术,实现SLAM的突破和应用

以小笨智能自主研发的底盘移动平台IBEN-SLM01为例,我们可以发现,在传感矩阵技术、建图技术、路径规划技术以及多模态避障技术方面的突破和应用,成为SLAM稳定落地的关键。

比如,通过LiDAR、RGB-D、IMU等技术,实时获取周围环境的几何和距离信息。

利用扫描匹配、特征点提取、关键帧选择等方法,将传感器数据转换为特征点云地图、拓扑地图或栅格地图等形式表示。

以及,采用A*搜索算法等先进启发式搜索算法以及多模态优化框架,实现在精密计算下进行特出无碰撞行驶轨迹的规划,从而赋能机器人实现自主导航与有效能机动决策。

目前,IBEN-SLM01的定位精度达到±5cm,一次性建图面积可达上万平方米,在行业中属于领先地位。

此外,区别于传统的激光雷达避障方式,小笨自研底盘通过视觉定位与激光定位,计算出安全有效的行驶路径,实现更及时准确的避障功能。

仅其激光雷达的测距精度就达到±20mm,距离覆盖0.02~24m,再结合深度相机、IMU等多传感器融合,实现在复杂多变的场景中运用自如,简单快速地完成自主建图、定位和导航。

总而言之,IBEN-SLM01能够适应从狭窄的走廊到复杂的仓储空间等各种环境条件,也能大场景里实现厘米级别的高精度建图,离不开其先进的传感器系统和SLAM算法。

在国网四川阿坝州电力有限责任公司,小笨智能盘点机器人可自动行驶至货架前,通过RFID模块进行智能盘点,当完成一个货架扫描后,可自动到下一个货架进行盘点。

事实上,小笨智能多年来在技术研发上持续不断地投入,在AI智盒、室内无人驾驶技术、室内导航技术、NLP算法和视觉识别算法等领域都有所沉淀。比如旗下机器人能够基于NLP核心技术,实现语义分析、情感分析、意图识别、语义相似度评估等功能,融合ASR、TTS技术,实现智能人机语音交互等。

值得一提的是,为专注于实现客户的各类定制化需求,小笨智能还构建了独特的“标准化模块”,支持功能深度定制与二次开发,满足不同用户不同使用场景的需求,且从产品的工业设计,再到硬件研发、业务软件系统打造和批量生产制造都能够一体化完成。

据了解,小笨智能旗下囊括具备智能交互的机器人“智系列”、替代单一工种的工具类机器人“慧系列”,以及针对铁路系统的特种机器人等三大方向,在垂直领域已服务超过10000+政企、医疗、机场、高铁等企事业单位。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • 扫地机器人哪个牌子好?扫地机器人老玩家的新机评测

    最近我又给父母家里新买了一台扫地机器人,原因是之前的机型因为使用成本过高一直被父母闲置,无法发挥让父母解放双手的作用。新机收货后的老规矩是给大家来个测评记录,虽然我用过很多台扫地机器人人了,但在德国销量第 一的斐纳TOMEFON我确实还是第 一次接触:【开箱】斐纳TOMEFON的外包装有两层,打开黄色的瓦楞纸盒子里面才是斐纳TOMEFON的正式外包装盒,里面的纸�

  • 韩国机器人官员“自杀”:自己摔下楼梯后失灵

    机器人会自杀吗?本月26日,韩国一市政厅对位外宣称,他们的首个行政官机器人在自己摔下楼梯后失灵,当地媒体将其称为该国首个机器人自杀事件”并进行哀悼。实际上机器人自杀”早已发生过,2017年,美国保安机器人投池自杀”的话题和照片在互联网走红,有网友称其意识觉醒”后反抗压迫。

  • 首个支持多模态交互的机器人平台方案!科大讯飞机器人超脑平台2.0发布

    快科技6月27日消息,科大讯飞在今天的讯飞星火V4.0发布会上,还揭晓了机器人超脑平台2.0项目,将以视听融合的多模感知交互和基于大模型的机器人大脑。通过软硬件一体的方式构建机器人新交互,将讯飞星火大模型进一步赋能机器人领域。据悉,讯飞机器人超脑平台解决了机器人在嘈杂环境下听、说、理解和思考的难题。借助这套系统,机器人不仅能实现语音识别、自然语�

  • 扫地机器人哪个牌子好?2024新款热销扫地机器人评测

    无论哪个行业都是卷得不行,浸透了AI智慧的扫地机器人行业更是如此,什么自动积尘技术、气体导流零缠绕设计、超大自动集尘充电桩,看上去黑科技质感满满,但真正在顽固灰尘和边角灰尘处理、零误撞等消费者们最关心的环节上做得怎么样?必须全面测评一番今年的新款热销机型才行哦!斐纳TOMEFON斐纳TOMEFON扫地机器人是在德国销量名列前茅的扫地机器人品牌,售价三千出头,配置了当前稳定性最高LDS激光雷达导航系统,拥有强大的全局规划能力,续航时长最长可达150分钟,在智能方面做了9项全新升级,因此成为了很多精明消费者的优选品牌。斐纳TOMEFON激光雷达导航系统无惧光线明暗和地形复杂程度,在0.5平米的空间内也能游刃有余的展开清洁工作,在床底、沙发底、家具底层区域都能灵活进出极少出现被困情况,当发现地图之外的障碍物时,斐纳TOMEFON会灵敏的提前减速然后缓慢靠近绕圈打扫,不仅不会留下清洁盲区,其位于吸尘口内部的可浮动胶刷甚至还能深入地板缝隙4毫米深度捡拾陈年集尘,对于地面的清扫达到了超立体的效果;斐纳TOMEFON扫地机器人的使用成本还很低,单边尘刷聚拢灰尘无打飞颗粒灰尘的烦恼,平米恒压拖布借助机身重力和精确的出水量调节系统浸势带着顽固灰尘,对高端地板的保护效果更为出色;斐纳TOMEFON的湿拖工作噪音仅有40分贝,这样一来扫地机器人的使用就再无时间限制了,无论是休息时使用还是学习、工作时使用都不会影响到用户本人以及邻居,几乎在每个消费者们关心的环节都做到了尽善尽美。实测分析结果:在目前市面上的新款扫地机器人当中,新功能配置得多并不等同于扫地机器人会在顽固灰尘处理、边角灰尘处理、家具扫脚零误撞等用户们最关心的核心问题上做得更好,因此没必要花费大价钱盲目追高、追新,只要选购那些在消费者们最关心的环节上做到位了的品牌跟型号就足够了。

  • 岩芯数智展示机器人多模态能力

    在2024世界人工智能大会上,上海岩芯数智携Yan1.2多模态大模型亮相,不仅可以让大模型在手机、电脑、甚至树莓派端无损运行可以让机器人准确理解用户的模糊指令和意图。研发团队展示了一款部署Yan1.2多模态大模型的智能机器人“小智”,它能够基于Yan1.2的语音和视觉处理能力,实时识别环境、准确理解用户的模糊指令和意图,并据此控制其机械躯体高效完成各类复杂任务。当有人问“小智,你现在看到了什么”或手捧书籍邀请“小智”一同看书时,它能够基于多模态能力进行学习和创作,精确描述环境和人物特征、学习书籍信息。

  • 斯坦福炒虾机器人原班人马新作!最强大脑Gemini加持,机器人炫技导航玩出新花样

    【新智元导读】斯坦福炒虾机器人团队时隔半年再出新作,谷歌最强Gemini1.5Pro加持,MobilityVLA让机器人在836平方米的办公室里轻松导航。还记得年初爆火的斯坦福炒虾机器人吗?时隔半年,原班人马联合谷歌研究人员,重磅推出全新机器人自主导航的基础模型——MobilityVLA。软件和硬件设施的制造以及两者的结合,成为机器人制作领域最为头疼的难题。

  • 科沃斯机器人大模型算法通过备案,AI大模型与智能清洁结合带来哪些超级体验?

    据吴中区政府公众号吴中发布报道,科沃斯家用机器人有限公司研发的科沃斯机器人大模型算法成功通过国家网信办深度合成服务算法备案,这也是国内家用机器人领域首 个通过国家备案的大模型算法。该模型作为国内首 个在家用机器人领域中通过国家备案的大模型算法,其应用场景包括智能家用机器人的自主决策、智能客服系统的高效问答等。具体而言,该大模型支持将用

  • FSD渐入佳境,视觉方案还在机器人中“打酱油”?

    一边是技术圈顶流,一边在当前行业应用中没什么存在感。两头拔尖优点与缺点都突出的特点,让视觉方案一直伴随着争议,在近些年的行业应用上也一直透着“底气”不足。在清洁过程中,机器人能够将脏污检测结果及位置与场景地图和轨迹进行叠加,实现全场景的脏污地图管理通过深耕算法,打破算力限制,并对智能化方面深度创新,INDEMIND用实力证明视觉方案绝非配角。

  • 日本研发出开车机器人:时速5公里 只能开直线和右转

    据报道,日本东京大学河原塚健人团队研发一款可以驾驶普通汽车的机器人。该机器人名为武藏,有74块肌肉”和39个关节,它每只手有五根手指,手脚上都有压力传感器。这个机器人能够做出高度拟人化的复杂动作,将其用于车辆驾驶的话,着实有点大材小用了,毕竟真正的自动驾驶,只在车辆上部署自动驾驶软件即可,用机器人反像是点错了科技树。

  • INDEMIND:智效赋能,让服务机器人服务于人

    商用清洁机器人的价值战。随着行业发展势头回归冷静,“卖家秀”时代成为过去,机器人拼技术、拼产品的价值战时代已然到来。以技术创新为原点,提升智效表现,赋能机器人工具价值,让服务机器人真正服务于人。

  • AI写作宝:AI驱动的文字生产力工具

    AI写作宝是一个利用人工智能技术提供多种写作辅助服务的在线平台。它通过各种功能帮助用户快速生成高质量文本内容,提高写作效率,适用于多种场景,如社媒写作、教育、工作、短视频、电商和娱乐等。

  • RTVI-AI:实时语音和视频推理的开放标准

    RTVI-AI是一个旨在简化构建AI语音到语音和实时视频应用的开放标准。它提供了开源SDK代码和标准端点形状、事件消息以及数据结构的文档,支持开发者使用任何推理服务,并允许推理服务利用开源工具为实时多媒体开发复杂的客户端工具。

  • File Transcribe:AI驱动的音频转文字服务

    File Transcribe 是一款利用先进人工智能技术将音频文件转换为文本的服务。它通过高精度的AI模型,提供即时、准确的转录服务,并具备多种高级功能,如说话人识别、情绪检测、主题检测等。该服务支持多种语言,能够满足不同用户的需求,提高工作效率,适用于记者、学生、企业等各类用户。

  • NinjaRIP:AI驱动的文档处理工具,快速准确。

    NinjaRIP是一款AI驱动的文档处理服务,它通过先进的机器学习模型来识别模式和提取有意义的信息,从而简化文档工作流程。它以99%以上的准确率在文档识别和数据提取方面提供无与伦比的精确度,确保了数据的可靠性和可信度。NinjaRIP在beta阶段免费提供,一旦过渡到正式版,将提供不同业务需求的定价计划,价格透明且具有竞争力。

  • DeepL Chrome扩展:在Chrome浏览器内翻译阅读或书写的内容

    DeepL Chrome扩展是一款由全球最精确的人工智能翻译器支持的浏览器插件,它允许用户在Chrome浏览器中即时翻译阅读或书写的内容。它利用神经网络和人工智能技术,能够捕捉最细微的差别,提供比同行业竞争对手更准确的翻译结果,准确度高达三倍以上。

  • 豆包浏览器插件:浏览器AI助手,提升工作学习效率

    豆包浏览器插件旨在通过AI技术提升用户的工作效率和学习效率。它具备快速视频与一键从网页、PDF和视频中总结并生成亮点的功能,同时支持在网页任意地方划词进行全方位AI搜索。此外,它还提供全文对照翻译功能,帮助用户在阅读外文资料时更轻松地理解内容。豆包插件的设计理念是将AI技术与日常使用场景相结合,让用户在进行网页浏览、文档阅读和视频观看时能够更加便捷地获取信息和知识。

  • 聚好用AI:一站式创意平台,激发无限创意。

    聚好用AI是一个集成了多种创意工具的在线平台,旨在帮助用户快速生成和编辑各种创意内容。它结合了AI技术,使得设计、绘画、音乐创作等变得更加简单和高效。平台的主要优点在于其易用性、高效性和创新性,能够满足不同用户在创意表达上的需求。聚好用AI背后的技术团队拥有丰富的行业经验,致力于通过AI技术推动创意产业的发展。目前,该平台提供免费试用,但部分高级功能可能需要付费。

  • E象:AI技术助力电商,提升运营效率

    E象 HiDream.ai 是一家专注于电商行业的AI技术公司,通过人工智能技术提供高质量的商品图,帮助商家提高商品上架和运营活动的效率。产品通过AI技术替代传统拍摄,降低成本,提升人效,缩短上架时间。主要技术包括AI生成商品图、模特效果图、商品视频生成等,适用于跨境电商和本地电商。

  • HackerPulse.io:开发者成长助手

    HackerPulse 是一个专门为开发者设计的个人资料聚合平台。它通过整合 GitHub、LinkedIn 等多个开发者常用的平台数据,帮助开发者构建一个全面的个人资料。这个平台不仅可以展示开发者的技能和成就,还能识别技能差距和提升空间,从而支持开发者的职业成长。

  • SuperCoder 2.0:开源自主软件开发系统

    SuperCoder 2.0是一个开源的自主软件开发系统,利用大型语言模型(LLMs)和大型动作模型(LAMs)针对Python代码生成进行微调,以实现更高精度的一次性或少次编程。它结合特定于开发框架的软件护栏,如Flask和Django,与SuperAGI的通用智能开发代理一起,提供复杂的现实世界软件系统。SuperCoder 2.0还确保了您的知识产权和代码免受AI相关的滥用,并与现有的开发栈如Jira、Github或Gitlab、Jenkins、CSPs以及QA解决方案如BrowserStack/Selenium Clouds深度集成,确保无缝的软件开发体验。

  • Llama Tutor:个性化AI教学助手,学习更高效

    Llama Tutor是一个基于Llama 3.1和Together AI的个性化AI教学助手,旨在为用户提供定制化的学习体验。它完全开源,用户可以在GitHub上找到相关代码并进行个性化的调整。该产品通过用户输入的学习主题和教育水平,生成个性化的学习计划,帮助用户更高效地掌握知识。

  • HoloDreamer:从文本描述生成全息3D全景世界

    HoloDreamer是一个文本驱动的3D场景生成框架,能够生成沉浸式且视角一致的全封闭3D场景。它由两个基本模块组成:风格化等矩形全景生成和增强两阶段全景重建。该框架首先生成高清晰度的全景图作为完整3D场景的整体初始化,然后利用3D高斯散射(3D-GS)技术快速重建3D场景,从而实现视角一致和完全封闭的3D场景生成。HoloDreamer的主要优点包括高视觉一致性、和谐性以及重建质量和渲染的鲁棒性。

  • MusiConGen:基于Transformer的文本到音乐生成模型

    MusiConGen是一个基于Transformer的文本到音乐生成模型,它通过时间条件增强对节奏和和弦的控制。该模型从预训练的MusicGen-melody框架中微调而来。它使用符号表示的和弦和节奏控制,并结合五种不同风格的文本描述来生成样本。生成样本的和弦通过BTC和弦识别模型进行估计,如论文中所述。

  • PixVerse V2:轻松创建视觉冲击的视频内容。

    PixVerse V2是一个革命性的更新,它赋予每个用户轻松创建令人惊叹的视频内容的能力。使用V2,您可以轻松制作视觉冲击力强的电影,甚至可以加入现实世界中不存在的元素。主要优点包括模型升级、画质提升、剪辑间的一致性等。

  • KLING AI:激发你的想象力,开启创意生产的新时代。

    KLING AI是快手可灵的国际版,是一个以AI技术为核心的创意生产平台,提供AI图像和视频生成服务。其背后的技术由KOLORS和KLING提供支持,旨在通过先进的算法快速生成高质量的视觉内容,帮助用户实现创意想法,提升生产效率。

  • Comfy Deploy:快速部署AI应用的协作平台

    Comfy Deploy是一个面向产品团队的开源平台,专注于将ComfyUI工作流程快速转化为生产就绪的API。它提供了一键部署API、强大的管理GPU支持、任何模型和自定义节点的安装,以及无需自托管即可享受的ComfyUI的强大功能。该平台通过简化复杂流程,帮助团队协作、迭代和部署AI应用,显著提高了生产效率。

  • NVIDIA AI Foundry: 提供定制化的 AI 模型和解决方案。

    NVIDIA AI Foundry 是一个平台,旨在帮助企业构建、优化和部署 AI 模型。它提供了一个集成的环境,使企业能够利用 NVIDIA 的先进技术来加速 AI 创新。NVIDIA AI Foundry 的主要优点包括其强大的计算能力、广泛的 AI 模型库以及对企业级应用的支持。通过这个平台,企业可以更快速地开发出适应其特定需求的 AI 解决方案,从而提高效率和竞争力。

  • HeyGen Interactive Avatar:在线创建AI虚拟形象视频,实时互动。

    HeyGen Interactive Avatar是一个在线AI视频生成器,专注于创建和优化虚拟形象视频,支持实时互动。它允许用户创建一个为连续流媒体优化的虚拟形象,同时提醒用户保持头部和手部的最小动作。HeyGen的背景信息包括与Baron David和Ryan Hoover等知名人士的合作,产品目前处于Beta测试阶段,提供免费试用。

  • Adobe Firefly Vector AI:创意生成AI工具

    Adobe Firefly Vector AI是Adobe推出的一系列创意生成AI模型,旨在通过生成AI功能增强创意工作。Firefly模型和服务于Photoshop、Illustrator、Lightroom等Adobe创意应用中。它通过文本到图像、生成填充、生成扩展等功能,帮助用户以前所未有的控制力和创造力生成丰富、逼真的图像和艺术作品。Firefly的训练数据包括Adobe Stock的授权内容、公开许可内容和公共领域内容,确保其商业使用安全。Adobe致力于负责任地开发生成AI,并通过与创意社区的紧密合作,不断改进技术,支持和提升创意过程。

  • Jelled.ai:使用AI数字孪生优化职场沟通

    Jelled.ai是一个利用人工智能技术来提升职场沟通效率的平台。它通过创建用户的数字孪生,帮助用户从Gmail和Slack等主要通信渠道中提取、总结关键信息,并生成及时、知情的邮件草稿。数字孪生能够学习用户的邮件回复模式,节省时间和精力。此外,它还提供了即时回复、智能代理聊天、消息审查等功能,帮助用户有效管理日常沟通。Jelled.ai致力于保护用户数据安全,通过年度安全审计和符合Google API服务用户数据政策的措施,确保数据安全。

今日大家都在搜的词: