首页 > 传媒 > 关键词  > 正文

3D视觉传感器市占率71.09%,奥比中光领跑中国服务机器人视觉感知赛道

2023-07-19 18:01 · 稿源: 站长之家用户

机器视觉产业链自下而上的国产化替代已经开始提速。

7 月 14 日,高工机器人产业研究所(GGII)重磅发布奥比中光参编的《 2023 机器视觉产业发展蓝皮书》(下称“蓝皮书”)。根据蓝皮书测算,奥比中光在中国服务机器人3D视觉传感器领域市占率超过70%,位列行业之首,领跑全球3D视觉感知市场。

图注: 7 月 14 日,奥比中光联合高工机器人产业研究所(GGII)及梅卡曼德机器人、康士达、知象光电重磅发布《 2023 机器视觉产业发展蓝皮书》。

行业之首!服务机器人3D视觉传感器市占率超70%

3D视觉感知行业经过数十年的发展,由早期的工业级成功向消费级拓展,且应用领域仍在不断拓宽,行业经历了起步、初级发展时期,即将迎来快速增长时期。

其中,在服务机器人应用领域,3D 视觉传感器可以帮助服务机器人有效完成人脸识别、距离感知、避障、导航等功能,使其更加智能化。目前已实现落地的应用包括扫地机器人、自动配送机器人、引导陪伴机器人等,服务于家庭、餐厅、酒店、医院等多个线下场景。

蓝皮书指出,从 3D 视觉传感器参与者来看,主要有奥比中光、英特尔、索尼、英飞凌、银牛微电子等。其中,2022 年奥比中光在中国服务机器人领域的市占率超过 71.09%,位居行业之首。

2022 年中国公共服务机器人领域 3D 视觉传感器竞争格局(单位:台,%)来源:GGII

根据 GGII 统计,2022 年中国公共服务机器人产量 10.24 万台,同比增长 30.61%;预计未来几年复合增速超 27%,到 2026 年产量有望达到 27 万台。

2017-2026 年中国公共服务机器人产量及预测(单位:万台,%)来源:GGII

一台服务机器人一般配备1- 7 台传感器,根据设计和场景的不同,选择的传感器类型和数量会有所差异。目前来看,更多服务机器人配备2- 4 台传感器,其中以3D视觉传感器为主。GGII预计,未来几年单台服务机器人搭载的传感器数量有望提升,传感器需求的复合增速超30%,到 2026 年传感器需求量有望接近 80 万台,其中3D视觉传感器占比接近80%。

2017-2026 年中国公共服务机器人传感器需求量及预测(单位:万台,%)来源:GGII

在以奥比中光为代表的企业推动下,3D视觉感知技术越来越丰富和全面,3D视觉感知产品也随着底层元器件及核心算法的发展,向低成本、低功耗、小体积、高性能的方向发展。

目前,与奥比中光达成业务合作的机器人厂商超过 100 家,合作客户包括普渡科技、高仙机器人、擎朗机器人、云迹科技、斯坦德机器人等行业头部,覆盖了智能工厂、仓储物流、建筑自动化、智能巡检、割草机、酒店配送、楼宇配送、商用清洁、ROS 教育等众多服务机器人应用场景。

国产化替代提速,让服务机器人走向多元场景

蓝皮书指出,从机器视觉产业链看,自下而上的国产化替代已经开始提速。在视觉应用集成到相机、光源、 镜头、工控机、软件再到图像传感器、视觉芯片等环节,国产化进程正不断深入。

从数据上看, 2022 年中国市场机器视觉各大核心部件的国产化份额均已超过70%,其中光源国产化率超过90%,镜头国产化率80%左右,2D相机国产化率超过70%,3D相机国产化率超过60%,视觉软件国产化率超过40%。 2022 年中国3D视觉市场增速接近60%,众多国产厂商开始崭露头角,预计未来 5 年将会是机器视觉行业发展的关键“卡位期”,期间在各细分领域有望有更多的头部企业脱颖而出。

在蓝皮书发布会圆桌论坛环节,奥比中光机器人产品线总经理钟亮洪表示,“机器人所处的是三维世界,当需要对三维世界有感知的时候,特别是需要感知几何空间的时候,3D视觉是必不可少的。奥比中光通过打造3D视觉传感器,让机器人可以适应更多元的场景,赋能机器人准确定位、避障、识别、导航。”

图注:奥比中光机器人产品线总经理钟亮洪在发布会圆桌论坛发言。

钟亮洪还提到,3D视觉与2D视觉之间不是替代关系,而是补充关系,二者的结合可以帮助机器人解决更多问题。但是在一些更加精细化的场景,比如机械臂抓取,3D视觉可以更好地保证抓取精度,不损伤器件,对比2D而言更有优势。

目前,2D 视觉正在向3D视觉进行延伸。随着智能制造的不断深入,面对复杂的物件辨识和尺寸量度任务,以及人机互动所需要的复杂互动,2D 视觉在精度和距离测量方面均出现部分技术局限,市场对 3D 视觉的需求开始与日俱增。3D 视觉技术的发展,将很大程度上填补2D视觉的应用空白,并且可以更好的满足对于高精度定位、抓取、检测等场景的需求。

奥比中光作为行业领先的3D视觉感知整体技术方案提供商,也是国内主要的服务机器人3D 视觉传感器提供商,可为机器人客户提供单目结构光、双目结构光、LiDAR、iToF 在内的完整视觉感知产品矩阵,并具备超过 7 年的行业落地经验。未来,奥比中光将继续聚焦机器人视觉感知领域,持续为客户提供先进的产品解决方案,赋能行业3D智能化升级。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • SEOJuice:AI驱动的内部链接工具,简化SEO工作

    SEOJuice是一个AI驱动的内部链接工具,旨在简化SEO工作,通过自动化创建内部链接,帮助网站提升在搜索引擎中的排名。由Vadim个人开发,以解决手动添加内部链接的繁琐和耗时问题。SEOJuice通过AI扫描网站内容,找到合适的上下文链接和关键词,并自动添加,从而提升整个网站的SEO性能。作为一个自筹资金、独立运营的项目,SEOJuice不依赖外部投资,以用户订阅费用为运营资金。

  • Florence-2-large-ft:先进的视觉基础模型,支持多种视觉和视觉-语言任务。

    Florence-2-large-ft是由微软开发的高级视觉基础模型,使用基于提示的方法来处理广泛的视觉和视觉-语言任务。该模型能够通过简单的文本提示执行诸如图像描述、目标检测和分割等任务。它利用FLD-5B数据集,包含54亿个注释,覆盖1.26亿张图像,实现多任务学习。模型的序列到序列架构使其在零样本和微调设置中均表现出色,证明其为有竞争力的视觉基础模型。

  • 豆包 MarsCode:智能开发工具,一触即发

    豆包 MarsCode 是一款即将发布的智能开发工具,旨在通过AI技术激发开发者的创造力。它将为编程工作带来革命性的改变,提高开发效率,降低技术门槛。

  • Florence-2-base:先进的视觉基础模型,支持多种视觉和视觉-语言任务。

    Florence-2是由微软开发的高级视觉基础模型,采用基于提示的方法处理广泛的视觉和视觉-语言任务。该模型能够解释简单的文本提示,执行如描述、目标检测和分割等任务。它利用包含54亿个注释的5.4亿张图像的FLD-5B数据集,精通多任务学习。模型的序列到序列架构使其在零样本和微调设置中都表现出色,证明其为有竞争力的视觉基础模型。

  • Florence-2-large:先进的视觉基础模型,支持多种视觉和视觉-语言任务

    Florence-2-large是由微软开发的先进视觉基础模型,采用基于提示的方法处理广泛的视觉和视觉-语言任务。该模型能够解释简单的文本提示来执行如图像描述、目标检测和分割等任务。它利用包含54亿注释的5.4亿图像的FLD-5B数据集,精通多任务学习。其序列到序列的架构使其在零样本和微调设置中均表现出色,证明是一个有竞争力的视觉基础模型。

  • Multi:多人协作,提升软件开发效率

    Multi是一款专为软件开发团队设计的协作工具,它通过多人协作、共享控制、即时通讯和自动记录等功能,帮助团队成员更高效地沟通和工作。产品基于Zoom的高质量音视频基础设施,提供低延迟的共享控制体验,并通过AI技术自动生成会议摘要和行动项,进一步加速团队的软件开发流程。

  • 智能编码助手通义灵码:智能编码助手,提升开发效率

    通义灵码是一款专为开发者设计的智能编码助手,支持多种开发环境,包括JetBrains IDEs、Visual Studio Code、Visual Studio等。它通过集成先进的AI技术,帮助开发者快速完成编码任务,提高编码效率和质量,适用于各种编程语言和开发场景。

  • MOFA-Video:通过生成运动场适应实现单图像动画化

    MOFA-Video是一种能够将单张图片通过各种控制信号动画化的方法。它采用了稀疏到密集(S2D)运动生成和基于流的运动适应技术,可以有效地使用轨迹、关键点序列及其组合等不同类型的控制信号来动画化单张图片。在训练阶段,通过稀疏运动采样生成稀疏控制信号,然后训练不同的MOFA-Adapters来通过预训练的SVD生成视频。在推理阶段,不同的MOFA-Adapters可以组合起来共同控制冻结的SVD。

  • Duix:AI数字人智能交互平台

    DUIX是一个开源的AI数字人智能交互平台,由硅基智能打造。它允许开发者接入多种大模型和语音能力,实现数字人实时交互,并支持在Android和iOS多终端一键部署。DUIX适用于多种场景,包括地铁、银行、政务等,具有低成本快速部署、小网络依赖和功能多样化的特点。

  • SuperSonic:下一代BI平台,融合Chat BI和Headless BI。

    SuperSonic是一个集成了由大型语言模型(LLM)驱动的Chat BI和由语义层驱动的Headless BI的下一代商业智能(BI)平台。它确保Chat BI能够访问与传统BI相同的经过策划和治理的语义数据模型。此外,这两种范式的实现都从集成中受益:Chat BI的Text2SQL通过从语义模型中检索上下文得到增强;Headless BI的查询接口通过自然语言API得到扩展。SuperSonic提供了一个Chat BI界面,使用户能够使用自然语言查询数据,并以适当的图表可视化结果。要实现这种体验,唯一需要的就是通过Headless BI接口构建逻辑语义模型(定义指标/维度/标签及其含义和关系)。同时,SuperSonic被设计为可扩展和可组合的,允许使用Java SPI添加和配置自定义实现。

  • DB-GPT:AI原生数据应用开发框架

    DB-GPT是一个开源的AI原生数据应用开发框架,利用AWEL(Agentic Workflow Expression Language)和代理(agent)技术,简化了大型模型应用与数据的结合。它通过多模型管理、Text2SQL效果优化、RAG框架优化、多代理框架协作等技术能力,使企业和开发者能够以更少的代码构建定制化应用。DB-GPT在数据3.0时代,基于模型和数据库,为构建企业级报告分析和业务洞察提供了基础数据智能技术。

  • OpenAgents:一个开放平台,用于日常使用的语言代理。

    OpenAgents是一个开放平台,旨在使用户和开发者能够在日常生活中使用和托管语言代理。该平台已经实现了三种代理:数据分析的Data Agent、集成200+日常工具的Plugins Agent和自动网页浏览的Web Agent。OpenAgents通过优化的Web UI使普通用户能够与代理功能进行交互,同时为开发者和研究人员提供在本地设置上的无缝部署体验,为创新语言代理的构建和现实世界评估提供了基础。

  • ChattyUI:你的私人AI聊天工具,运行在浏览器中。

    Chatty是一个利用WebGPU技术在浏览器中本地且私密地运行大型语言模型(LLMs)的私人AI聊天工具。它提供了丰富的浏览器内AI体验,包括本地数据处理、离线使用、聊天历史管理、支持开源模型、响应式设计、直观UI、Markdown和代码高亮显示、文件聊天、自定义内存支持、导出聊天记录、语音输入支持、重新生成响应以及明暗模式切换等功能。

  • AsyncDiff:异步去噪并行化扩散模型

    AsyncDiff 是一种用于并行化扩散模型的异步去噪加速方案,它通过将噪声预测模型分割成多个组件并分配到不同的设备上,实现了模型的并行处理。这种方法显著减少了推理延迟,同时对生成质量的影响很小。AsyncDiff 支持多种扩散模型,包括 Stable Diffusion 2.1、Stable Diffusion 1.5、Stable Diffusion x4 Upscaler、Stable Diffusion XL 1.0、ControlNet、Stable Video Diffusion 和 AnimateDiff。

  • MacAIverse:macOS风格的开源React桌面环境

    MacAIverse是一个完全由AI生成代码,使用React构建的macOS风格的开源桌面环境。该项目由Claude AI助手初始创建,现在开放给其他Claude实例或其他开发者贡献新的应用。它遵循macOS设计原则,保持与整体桌面环境的一致性,并通过Tailwind CSS和framer-motion库实现流畅的动画和响应式布局。

  • EvTexture:视频超分辨率纹理增强技术

    EvTexture是一种基于事件的视觉驱动的视频超分辨率(VSR)技术,它利用事件信号中的高频细节来更好地恢复VSR中的纹理区域。该技术首次提出使用事件信号进行纹理增强,通过迭代纹理增强模块逐步探索高时间分辨率的事件信息,实现纹理区域的逐步细化,从而获得更准确、丰富的高分辨率细节。在四个数据集上,EvTexture达到了最先进的性能,特别是在Vid4数据集上,与最近的基于事件的方法相比,可以获得高达4.67dB的增益。

  • Telegraf:开源服务器代理,用于收集和报告指标

    Telegraf是一个开源的服务器代理,用于收集和发送来自数据库、系统和IoT传感器的所有指标和事件。它使用Go语言编写,编译成一个单一的二进制文件,无需外部依赖,占用的内存非常小。Telegraf拥有300多个插件,由社区成员编写,覆盖了云服务、应用程序、IoT传感器等多种数据源。它支持灵活的解析和序列化,适用于多种数据格式,如JSON、CSV、Graphite,并能将数据序列化为InfluxDB行协议和Prometheus等。Telegraf还具有稳健的交付保证,包括流量回压、调度器、时钟漂移调整、全流支持等。此外,Telegraf的自定义构建器允许用户选择特定插件包含在Telegraf二进制文件中,适合在资源受限的设备上使用。

  • iA Writer:纯净写作体验,专注流状态

    iA Writer是一款专注于写作的应用程序,旨在提供纯净的写作环境,帮助用户专注于内容创作。它通过简洁的界面设计和强大的功能,如语法检查、文本聚焦等,帮助用户提高写作效率和质量。iA Writer背后的设计理念是利用人工智能技术,让用户在写作时思考得更多,而不是更少,从而提升写作体验。

  • Groqnotes:使用Groq、Whisper和Llama3从音频生成有组织的笔记。

    Groqnotes是一个基于Streamlit的应用程序,它通过迭代解析和生成从转录的音频讲座中提取的笔记来构建结构化的讲座笔记。该应用程序混合使用了Llama3-8b和Llama3-70b模型,利用较大的模型生成笔记结构,较快的模型创建内容。Groqnotes的主要优点包括快速转录音频和生成文本,以及通过策略性地在两种模型之间切换来平衡速度和质量。此外,它还支持Markdown样式,可以在Streamlit应用程序中创建美观的笔记,包括表格和代码,并允许用户下载包含全部笔记内容的文本或PDF文件。

  • june:本地语音聊天机器人,保护隐私,无需联网。

    june是一个结合了Ollama、Hugging Face Transformers和Coqui TTS Toolkit的本地语音聊天机器人。它提供了一种灵活、注重隐私的解决方案,可以在本地机器上进行语音辅助交互,确保没有数据被发送到外部服务器。产品的主要优点包括无需联网即可使用、保护用户隐私、支持多种交互模式等。

今日大家都在搜的词: