首页 > 传媒 > 关键词  > 正文

技术基因&自主创新,光鉴科技塑造3D视觉感知新范式

2024-01-16 11:45 · 稿源: 站长之家用户

根据高工机器人产业研究所(GGII)的统计数据,预计到 2027 年我国机器视觉市场规模将超过 560 亿元,其中3D视觉市场规模将接近 160 亿元,占比接近三成。目前,3D视觉感知技术已经渗透到智能汽车、工业机器人、服务机器人、智慧城市、新零售和智能家居等广泛领域,凭借精度高、速度快、适配性强、抗干扰能力强等突出优势,3D视觉感知技术迅猛发展之势已经不可阻挡。

产业热度高让相关企业率先受益。在3D视觉感知赛道里, 2018 年成立的光鉴科技借产业东风,已经从行业新星成长为一家行业领先的3D感知公司。 2023 年 12 月,光鉴科技完成了两亿元人民币的B轮融资,公司发展进入到一个全新的阶段。

光鉴科技创始人&CEO 朱力博士在接受电子发烧友网采访时表示,完成B轮融资通常意味着公司产品已经完成了市场的初步验证,取得了一定的市场成绩。过去两三年光鉴科技业务每年都有数倍的增长,“让投资人看到了我们处于一个非常好的发展状态,是一个非常优质的投资标的。”

一般而言,B轮融资之前,公司通常已经证明了其商业模式的可行性,证明了自有技术和产品的价值;B轮融资之后,公司需要进一步继续扩大业务规模,加强财务和治理结构,并开拓市场。毫无疑问,B轮融资会是公司发展一个重要的里程碑,那么光鉴科技完成本轮融资后会有怎样的变化呢?光鉴科技给出了自己的答案。

避开市场内卷:持续打造有差异化的3D视觉感知方案

机器视觉技术在工业领域已经发展了数十年,当然此前更多是2D视觉技术。2D视觉基于物体平面轮廓驱动,无法获得曲度、空间坐标等三维参数。因此,从2D视觉感知到3D视觉感知是一次技术跃迁。随着底层硬件和算法的成熟,目前3D视觉感知技术的应用早已不再局限于工业领域,我们上述提到的广泛领域,3D视觉感知技术都已经有所涉猎。

过往,3D视觉感知的技术流派主要有双目视觉、3D结构光技术、激光三角测量和TOF飞行时间法。光鉴科技进一步创举性地提出了sToF (structured ToF)方案——基于纳米光子芯片调制投射光场设计的硬件系统,仅需一组光学硬件即可同时实现结构光和ToF 深度重建,配合自研算法,达到近距离的超高精度和中远距离的高精度深度重建。

朱力表示,从 2018 年成立至今,光鉴科技一直都专注在3D视觉传感这一领域,目标就是基于公司各项技术帮助各行业实现更好的视觉感知能力。“现在,我们在这个领域走得更加深入,完成了从技术到产品的升级,开始了公司商业化进程。当前,从‘刷脸’到‘刷掌’,从‘屏下3D感知’到‘3D视觉智能座舱’,这些热门方案都有用到光鉴科技的3D视觉感知技术。”

光鉴科技行业解决方案

这一点记者感触颇深, 2019 年当记者初次接触光鉴科技时,该公司的分享基本是围绕核心技术,当然会给出落地愿景,但大都是在展望。如今,光鉴科技已经从拥有创新技术的行业新星,蜕变为在众多领域有领先方案和落地案例的行业领先型企业。

谈到创业过程,朱力称:“ 2018 年和 2019 年的时候,我们的主要精力还在点亮公司的科技树,还处于产品化前期的技术开发阶段。五年的时间过去了,我们走过了从技术到产品,然后让目标市场接受我们产品的商业化全过程。这个过程并不容易,但是收获了令我们满意的成果。”

通过官网能够看到,光鉴科技目前已经成功推出了多款产品及解决方案,这些都融合了光鉴科技自研的“光学+算法+计算”思维模式,包括Stellar ToF系列深度相机、Aurora结构光系列深度相机、Nebula sToF系列深度相机、屏下3D结构光方案、刷掌支付解决方案、智能座舱3D视觉方案等。

光鉴科技产品矩阵

对于“光学+算法+计算”这套构建产品的组合拳,朱力解释说:“3D视觉感知归根结底是感知+计算,那么就需要做到软硬件融合,单独做哪一个方面都会有缺失。对于下游市场来说,客户需要一个整体最 优的方案,那么‘光学+算法+计算’这三部分是缺一不可的。这是我们的优势,我们以行业领先的光学技术为基础,配合一批全球领先的研发团队,能够提供非常具有竞争力的产品。”

对于整个3D视觉感知市场而言,光鉴科技的产品和方案都相当创新。当然,完全从底层技术创新的技术,在实现商业化落地时往往会遇到更大的挑战,光鉴科技能够取得今天的成绩绝非易事。朱力称,之所以选择了一条看似难度更高的路,和光鉴科技确定下来的两条发展路径有关。

其一便是通过技术创新赋能终端市场。“我们希望看到的创新成果是,不在已经形成共识的市场和国内厂商去同质化内卷,而是通过我们的技术和产品,为下游终端市场创造新的卖点和价值,进而体现光鉴科技自身的价值。光鉴科技不会去做市场蛋糕越卷越小的产品,而是和产业一起用科技创新把市场做大,这是科技公司不断成长的必然方向。”朱力对此讲到。

显然,这是光鉴科技在B轮融资之前的产品策略,本轮融资之后这并不会发生改变。当然产品会做进一步的升级,比如在产品集成层面,计算芯片能够把传感硬件和算法融合,做进一步的集成,进而降低方案的功耗并优化性能。“更集成的方案可能会带来50%,甚至是更高的性能优化。”这就是光鉴科技产品下一步的升级方向之一。

用数据说话:让投资人看到最真实的市场表现

从时间节点来看,光鉴科技完成B轮融资的时间几乎就是行业资本最为谨慎的时刻,很多数据都表明,电子信息产业的投资在收窄,当然这也从侧面体现了光鉴科技公司的硬实力。如何去打动投资人?如何打消投资人的顾虑?朱力的回答很简洁:用数据说话。“B轮融资就是要看公司的商业转化能力,所以营收数据就是我们给投资人的最 好答案。”

3D视觉技术在移动支付、消费电子、汽车座舱、机器人等领域有非常明显的赋能价值,给用户带来全新的交互体验。针对这些领域,光鉴科技目前都已经推出了产品。“B轮考验的是产品规模性落地的能力,从我们的业务表现来看,我们在移动支付、机器人市场已经具有一定的销售规模,并且仍在高速增长。在汽车智能座舱的人机交互方面,车厂的需求也越来越多。在汽车领域,无论是我们合作车厂的领先性,还是我们技术/产品的领先性,都将支撑我们取得可观的市场成绩。”朱力在交流时提到。

目前在汽车领域,3D智能交互是一个非常热门的概念,一些车厂已经将这种方案作为标配。通过引入3D视觉感知技术,汽车座舱系统控制复杂度高的问题迎刃而解。朱力表示:“汽车座舱里的屏幕、座椅、空调、音响、车窗和遮光板等都会和驾乘人员形成交互。光鉴科技在汽车座舱里面提供的方案,实际上会比感知更进一步,我们将其称为‘意识’——让汽车能够意识到座舱内驾驶员和乘客的状态,进而提供自动化的服务。”

光鉴科技车规级3D深度相机

上述内容我们提到,光鉴科技有两条确认的发展路线,一条是关于产品创新的,另一条实际上就是针对产品落地的。这也就是为什么,在短短四年多的时间里,光鉴科技能够将一项创新技术成功落地到移动支付、机器人、智慧城市和智能座舱等广泛的终端领域。

朱力称:“我们探索出一条有效的市场迭代之路。实现的方式是,我们要和行业标杆客户做深度合作,大家秉持充分信任的态度去打造具有颠覆性的产品,对双方而言都会有很大的收获。对光鉴科技来说,这样做让我们打通了一条从技术创新到市场转化的快速通道。”

和产品创新策略一样,对于这项产品落地的政策,光鉴科技也会持之以恒地贯彻下去。

扎根中国、放眼全球:成为一家世界 领先的高科技公司

从科技公司发展角度来说,产品创新和产品落地是核心指标,也是硬性指标。服务于这两项核心指标,也会有很多软性指标,比如人才梯队的搭建、生态系统的培育以及地域性市场扩展等。

关于人才梯队搭建,根据朱力的介绍,光鉴科技目前研发人员占比大概在80%左右。“融资之后预计也会保持这个状态,所以光鉴科技依然会是研发聚焦的公司,同时我们的研发创新会聚焦我们已经服务的市场。在市场销售和组织架构方面,我们也会吸纳一些更有经验的人才,让我们继续保持这种良好的增长势头。”

关于生态系统培育,朱力表示,“现阶段我们的生态布局策略依然是将我们的底层技术和客户的市场需求深度结合起来,在客户进行产品规划和定义的时候,我们之间就已经有充分的合作,这样能够实现更有效的转化。未来,出于产品集成方面的考虑,我们可能会和芯片公司进行深入合作,完成产品形态的进一步升级。这个过程中,对于合作伙伴的选择,我们更看重双方对于创新场景的投入意愿。”

无论是产品创新、产品落地,还是人才培养和生态培育,这些其实都服务于光鉴科技的公司目标:成为全球领先的科技公司。因此,光鉴科技也已经开始自己的全球化布局。“依托于我们在当地的合作伙伴,早期是将我们的产品和方案复制过去,当取得一定的市场成功后,我们会针对其他国家市场的本地化需求做更多的事情。”朱力最后说。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • Adobe Firefly Vector AI:创意生成AI工具

    Adobe Firefly Vector AI是Adobe推出的一系列创意生成AI模型,旨在通过生成AI功能增强创意工作。Firefly模型和服务于Photoshop、Illustrator、Lightroom等Adobe创意应用中。它通过文本到图像、生成填充、生成扩展等功能,帮助用户以前所未有的控制力和创造力生成丰富、逼真的图像和艺术作品。Firefly的训练数据包括Adobe Stock的授权内容、公开许可内容和公共领域内容,确保其商业使用安全。Adobe致力于负责任地开发生成AI,并通过与创意社区的紧密合作,不断改进技术,支持和提升创意过程。

  • Jelled.ai:使用AI数字孪生优化职场沟通

    Jelled.ai是一个利用人工智能技术来提升职场沟通效率的平台。它通过创建用户的数字孪生,帮助用户从Gmail和Slack等主要通信渠道中提取、总结关键信息,并生成及时、知情的邮件草稿。数字孪生能够学习用户的邮件回复模式,节省时间和精力。此外,它还提供了即时回复、智能代理聊天、消息审查等功能,帮助用户有效管理日常沟通。Jelled.ai致力于保护用户数据安全,通过年度安全审计和符合Google API服务用户数据政策的措施,确保数据安全。

  • Mock Interviews with AI:AI驱动的模拟面试,提升求职成功率。

    Mock Interviews with AI 是一款由Invue AI提供的职业面试准备平台,它通过AI技术模拟真实面试场景,提供即时反馈和个性化建议,帮助求职者提高面试技巧和自信心。产品背景基于36,000+求职者的使用经验,由专业团队设计,旨在帮助用户在面试中取得成功。产品提供基础和高级两个版本,基础版免费,高级版提供更多功能和服务。

  • Lokal.so:本地开发工具,支持远程访问和AI辅助

    Lokal.so 是一款本地开发工具,旨在简化本地开发环境的设置和使用。它通过提供多种功能,如本地隧道服务、AI 助手、S3 兼容服务器等,帮助开发者更高效地进行本地开发和调试。主要优点包括:1. 支持通过公共和 https .local 地址共享本地主机。2. 提供自托管的本地隧道服务器,确保隐私和自由。3. 利用 Cloudflare 的全球网络加速网站交付。4. 内置 AI 助手,可以与隧道流量交互,生成代码,回答与流量内容相关的问题。5. 提供无限的 .local 域名,支持局域网内的访问。6. 内置 S3 兼容服务器,方便文件存储和调试。7. 支持 JSON 到语言模式的自动转换,简化开发流程。

  • ScanIt:轻量级、快速、无广告的文档扫描应用

    ScanIt是一款专为iPhone和iPad设计的文档扫描应用,以其轻量级、快速、无广告的特点,为用户提供了一种简单高效的文档数字化解决方案。它拥有智能文档识别、曲面调整和文本提取(OCR)等专业功能,支持多种格式导出,并能安全加密文档,满足不同用户对扫描效率和安全性的需求。

  • PhotoMaker V2:一键生成个性化照片,快速便捷。

    PhotoMaker V2是由腾讯ARC实验室开发的AI照片生成应用,利用先进的图像识别和生成技术,用户可以快速生成个性化的照片。产品背景信息显示,PhotoMaker V2旨在为用户提供一个简单、高效的图片创作工具,无论是社交媒体分享还是个人收藏,都能满足用户需求。目前产品处于免费试用阶段,具体价格尚未公布。

  • Speax AI:AI视频多语言配音服务

    Speax AI提供快速、准确的AI视频配音服务,支持29种以上语言的即时翻译和配音。它通过先进的AI技术确保声音同步和文化准确性,同时提供具有竞争力的价格。

  • Cerebella:智能学习卡片应用,简化知识学习过程。

    Cerebella是一款iOS平台上的智能学习卡片应用,旨在通过简洁美观的设计,帮助学生和终身学习者高效备考和探索新知识。它提供了创建个性化学习卡片、智能学习算法、多选测试和自定义学习体验等功能,致力于让学习变得更简单、更有趣。

  • Volv:9秒新闻,为高效人士提供精炼资讯。

    Volv是一款为追求效率的个人设计的新闻APP,它由AI驱动,通过9秒的短文章形式,提供最有趣、最热门和最重要的内容。Volv旨在减少用户在社交媒体上无目的滚动的时间,帮助他们快速获取信息。

  • SuperCoder:自主软件开发系统,提高编码效率。

    SuperCoder是一个开源的自主软件开发系统,利用先进的AI工具和代理来简化和自动化编码、测试和部署任务,提高效率和可靠性。它支持多种编程语言和框架,以满足不同的开发需求。

  • Composio:AI代理工具集,赋能复杂任务处理。

    Composio是一个为AI代理提供高质量工具和集成的平台,它简化了代理的认证、准确性和可靠性问题,使得开发者能够通过一行代码集成多种工具和框架。它支持100多种工具,覆盖了GitHub、Notion、Linear等90多个平台,提供了包括软件操作、操作系统交互、浏览器功能、搜索、软件开发环境(SWE)以及即席代理数据(RAG)等多种功能。Composio还支持六种不同的认证协议,能够显著提高代理调用工具的准确性。此外,Composio可以作为后端服务嵌入到应用程序中,为所有用户和代理管理认证和集成,保持一致的体验。

  • NeuralGCM:高效准确的气候模拟模型

    NeuralGCM是由谷歌研究团队开发的气候模型,与传统基于物理的气候模型相比,它结合了机器学习技术,提高了模拟的准确性和效率。NeuralGCM能够生成2至15天的天气预测,其准确性超过了当前的黄金标准物理模型,并且在重现过去40年的温度数据方面比传统大气模型更为准确。尽管NeuralGCM尚未构建为完整的气候模型,但它标志着开发更强大、更易用气候模型的重要一步。

  • RouteLLM:节省LLM成本,不牺牲质量的框架

    RouteLLM是一个用于服务和评估大型语言模型(LLM)路由器的框架。它通过智能路由查询到不同成本和性能的模型,以节省成本同时保持响应质量。它提供了开箱即用的路由器,并在广泛使用的基准测试中显示出高达85%的成本降低和95%的GPT-4性能。

  • Meta-Llama-3.1-8B:8B参数的大型多语言生成模型

    Meta Llama 3.1是一系列预训练和指令调整的多语言大型语言模型(LLMs),包含8B、70B和405B大小的版本,支持8种语言,专为多语言对话用例优化,并在行业基准测试中表现优异。Llama 3.1模型采用自回归语言模型,使用优化的Transformer架构,并通过监督式微调(SFT)和强化学习结合人类反馈(RLHF)来提高模型的有用性和安全性。

  • Meta-Llama-3.1-70B:70亿参数的大型多语言文本生成模型

    Meta Llama 3.1是Meta公司推出的大型语言模型,拥有70亿个参数,支持8种语言的文本生成。该模型采用优化的Transformer架构,并通过监督式微调和人类反馈强化学习进一步优化,以符合人类对帮助性和安全性的偏好。模型在多语言对话使用案例中表现优异,超越了许多现有的开源和封闭聊天模型。

  • Meta Llama 3.1-405B:大型多语言预训练语言模型

    Meta Llama 3.1-405B 是由 Meta 开发的一系列大型多语言预训练语言模型,包含8B、70B和405B三种规模的模型。这些模型经过优化的变压器架构,使用监督式微调(SFT)和强化学习与人类反馈(RLHF)进行调优,以符合人类对帮助性和安全性的偏好。Llama 3.1 模型支持多种语言,包括英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。该模型在多种自然语言生成任务中表现出色,并在行业基准测试中超越了许多现有的开源和封闭聊天模型。

  • Llama 3.1:最前沿的开源AI模型,支持多语言和高级功能。

    Llama 3.1是Meta AI推出的最新一代大型语言模型,具有128K的上下文长度扩展、支持八种语言,并首次开源了405B参数级别的前沿AI模型。该模型在通用知识、可控性、数学、工具使用和多语言翻译方面具有最先进的能力,能够与最好的闭源模型相媲美。Llama 3.1的发布,将为开发者提供解锁新工作流程的工具,例如合成数据生成和模型蒸馏。

  • YouOrMe:通过面部识别技术比较你与父母的相似度

    YouOrMe是一款利用面部识别技术的应用,通过比较用户的面部照片与父母的面部照片,来确定用户更像谁。该技术不仅有趣,还能引发家庭间的互动和讨论。它使用先进的面部识别算法,为用户提供一个简单、直观的方式来探索他们的遗传特征。

  • Arcane.com:AI助力的营销自动化工具

    Arcane是一个面向现代营销人员的AI驱动的生产力平台,旨在通过自动化行业和受众研究、文案撰写以及内容再利用来提高工作效率。它通过集成的应用程序库,帮助营销人员快速生成有价值的LinkedIn帖子,节省时间,扩大影响力。

  • Awan LLM:无限令牌,无限制,成本效益高的LLM推理API平台。

    Awan LLM是一个提供无限令牌、无限制、成本效益高的LLM(大型语言模型)推理API平台,专为高级用户和开发者设计。它允许用户无限制地发送和接收令牌,直到模型的上下文限制,并且使用LLM模型时没有任何约束或审查。用户只需按月付费,而无需按令牌付费,这大大降低了成本。Awan LLM拥有自己的数据中心和GPU,因此能够提供这种服务。此外,Awan LLM不记录任何提示或生成内容,保护用户隐私。

今日大家都在搜的词: