首页 > 传媒 > 关键词  > 正文

AR行业的「戴维斯双击」,Rokid在海外掀起「眼前革命」

2023-11-22 14:11 · 稿源: 站长之家用户

「一叶落而知秋」,这样的自然法则并不适用于商业世界,尤其是在瞬息万变的创新领域。

不久前,XR领域明星公司Pico在其官微公开承认,短期投入和相关团队规模的缩减,涉及的裁员规模达到约1/4。这是否意味着,国内人机交互行业的寒冬已至?

事实恰恰相反。IDC数据显示, 2023 年上半年,国内AR/VR头显出货32. 8 万台,其中VR出货 26 万台,同比下滑53.3%;AR出货6. 8 万台,同比上涨142%。

AR和VR,走出了两条截然相反的错位路线。国内AR行业迎来了技术与市场双重认可的「戴维斯时刻」。以初创厂商Rokid为例,其在 8 月发布了消费级OST个人空间计算平台Rokid AR Studio,和同样锚定「空间计算」的苹果新品Vision Pro发布时间仅差月余,足以体现国内厂商的前瞻思考与野心。

AR和VR,走出了两条截然相反的错位路线。国内AR行业迎来了技术与市场双重认可的「戴维斯时刻」。以初创厂商Rokid为例,其在 8 月发布了消费级OST个人空间计算平台Rokid AR Studio,和同样锚定「空间计算」的苹果新品Vision Pro发布时间仅差月余,足以体现国内厂商的前瞻思考与野心。

接踵而来的好消息是,「蓝洞商业」获悉,Rokid于 11 月22日官宣与日本最 大的电信Docomo达成战略合作,全球化版图更进一步。

如果说,Pico是字节跳动登陆XR时代的一张巨额船票,那其蛰伏足以表明,张一鸣「大力出奇迹」的路线并不适合人机交互领域;反之,在VR与AR路线之间,选择更贴合市场需求的技术路线,并找寻硬件、软件、内容生态之间的极 致与平衡的中国厂商,也许更能先拥抱新时代的「iPhone时刻」。

1.在海外,Rokid做对了什么?

和Docomo的合作,对于Rokid而言,相当于找到了撬动海外市场的重要支点。

公开资料显示,作为日本三大通信运营商之一的Docomo签约用户超过 6000 万,并常年保持着「最 低客户流失率(0.53%)」的市场地位。

对于AR终端这样的新鲜事物,线下体验带来的直观感受往往比强调「多快好省」的线上平台更具意义。据Rokid相关负责人透露,从 2023 年 11 月 22 日北京时间上午 10 点开始,Rokid相关产品将出现在Docomo全日本范围内的渠道,包括线上平台和 261 家线下门店。

从全球视角来看,相对成熟的欧美日韩市场是所有XR企业要攻克的桥头堡。在AR爆发的前夜,「出海」是所有国内创新企业摆脱小众标签的必经之路。

对于智能生活服务占比近20%的Docomo来说,选择代表未来新势能的硬件厂商合作是丰富经营品类的必要步骤,但海内外品牌众多,为什么偏偏是Rokid?

如果跳出来看行业,不同于 2012 年Google眼镜带来的转瞬即逝的第 一波浪潮, 11 年后,AR产业似乎已进入了Gartner曲线的第二个爬坡阶段,这包括应用层面的进一步成熟和C端市场的准爆款出现。

在这一背景下,以「AR时代的引领者」为口号的Rokid率先迎来了增长飞轮,过去三个月来接二连三的好消息,也成了当下Docomo与其建立合作的关键点。

8 月的一场发布会上,Rokid 联合Google推出了AR 版的便携式Android TV,也是全球首 款经谷歌认证的AR版便携式Android TV终端,这意味着,Rokid获得了Google生态的认可和授权,将其生态中的百万内容收入囊中。

在海外款产品中,包括YouTube、Hulu、Disney+、TVer、AbemaTV甚至抖音等内容都可以在设备上运行。得益于此,本次与Docomo建立合作后发售的「RokidMax」以及「RokidStation」,能够为用户提供影院级娱乐体验,而不是刻板映像中「放大的屏幕」。

正如那个经典的比喻,没有游戏卡的Switch只能在墙角吃灰。在海外市场内容生态的搭建,是打动头部渠道商的敲门砖。第二个好消息来自消费市场的数据反馈。 11 月 9 日,Rokid创始人祝铭明在朋友圈官宣,Rokid AR获单笔两万台订单,且均为toC消费级订单。

可以作为参照数据的是,今年上半年,国内AR上半年整体出货量为6. 8 万台,其中消费级市场6. 2 万台。此外,截至目前,Rokid AR眼镜服务人数已超过 100 万,月活用户达到40%,用户平均日使用时长超过 1 个小时。Rokid在国内市场的领跑者地位稳固。

和过去数年来被资本热捧的VR设备相比,这样的出货量并不算多,按祝铭明的说法是「杯水车薪」,但准爆款的出现是智能终端市场的重要信号。

正如他此前在接受媒体采访时表示,「当AR的单品年销量达到 50 万台时,行业就会迎来真正的成熟。」典型案例是比如Meta旗下的Quest one,一年卖到 50 万台的时候,它就被整个行业接受了。

显然,和Docomo的合作会加速这一天的到来。这本身也是一个双向奔赴的过程。作为当地头部运营商,Docomo不仅有肥沃的消费级土壤,更有多年的5G部署;此外,当地消费者对AR产品的认知和接受度,也是当前发展周期的重要考量因素。

而一个容易被忽略的关键点是双方理念的契合,据了解,Docomo以挑战智能创新为愿景,在业内以卓越的服务质量和严谨的行业标准闻名,企业内部管理中非常重视「协作」的重要性。

而开放与携手共进也同样是Rokid所坚持的,正如祝铭明此前曾表示:一个欣欣向荣的行业,一定有多个玩家,健康的市场体系才是最终赢家的真正游戏规则。

在和Google及Docomo的合作中,祝铭明反复强调,这是Rokid的一小步,却是行业的一大步。除却本身的销售渠道拓展,本次合作对于整个国内产业链都有着关键的「破冰」意义。

2.无休止的技术精进

无论是Google还是Docomo,Rokid在海外的开疆拓土,技术是硬实力。

今年 6 月,库克在苹果全球开发者大会(WWDC)上带来了头显新品Vision Pro,并在演讲中表示,「这款产品将如同Mac开创个人计算时代、iPhone开创移动计算时代一样,开创空间计算时代。」

Vision Pro的发布掀起了新一轮的AR狂潮,让全球开发者精神为之一振,但不容忽视的是其「极 致的、不计成本的堆料」,在彰显工业设计的美好主义的同时,也带来了 3499 美元的高昂售价、500- 600 克的重量以及一再下调的出货预期。

而在两个月后的Rokid新品发布会上,同样押注空间计算的祝铭明带来了次时代AR产品的另一种解法。

与苹果公司采用的VST(视频透视)技术不同,Rokid基于OST(光学透视)方案,推出了消费级OST(Optical See Through)个人空间计算平台Rokid AR Studio,由AR空间计算眼镜Rokid Max Pro和AR空间计算主机Rokid Station Pro组成,售价做到了 3999 元和 4999 元。

祝铭明曾公开解读:VST方案可以对数字化的东西任意改造,这是OST做不到的。但硬币总分两面,VST要做沉浸式和数字化的物理世界重建,那设备的体积、显示系统,整体就很难做到轻量化。

轻量化恰是OST技术路线和Rokid产品的优势,与之相伴的,无论对算力的要求,对传感器的要求,对诸多的东西都会简化。

据了解,Rokid Max Pro的机身做到了76g,仅比前一代产品重1g,这对于日常有佩戴眼镜习惯的使用者而言,是几乎无感的重量。

但「轻」不是Rokid产品的唯 一优势,甚至不是最重要的。更为突出的是,Rokid Max Pro只用一颗摄像头,完成了SLAM(空间定位技术)、微手势交互、第 一视角分享、视觉定位VPS能力等多种融合型的交互方式。

而Vision Pro的快速定位捕捉、高精度全景感知等亮点,则是用 12 颗摄像头「堆」出来的。在这背后,是Rokid用AI算法来突破硬件的壁垒的成功尝试,也是多年基于技术不断投入带来的「知其所以然」。

如果画一条时间轴,Rokid入局AR终端的时间绝不算晚,但在技术创新上是实打实的实用主义,信奉慢工出细活。

2013 年,彼时仍在阿里任职的祝铭明遇到了自己命运的转折点,在试戴了Google Glass之后,他发出感叹:革命性的突破,但我们可以做的更好。

2014 年Rokid成立,锚定人机交互技术,初代产品是语音交互机器人,经过四年时间打磨, 2018 年,第 一款AR眼镜Rokid Glass面世,时年被认为是「AR崛起之年」,苹果、谷歌、微软、Facebook都是从此刻开始布局。而在首 款产品中,Rokid就一直强调超轻量级的实用性,而彼时其他行业企业甚至没有成型样机拿出。

而后,信奉「以B带C」的发展策略的祝铭明将B端市场作为试验田,相继在安防、工业、教育等行业打造了Rokid Glass2,以及首 款支持5G北斗防爆的AR智能头盔X-Craft等。

在B端市场站稳脚跟后,又一个四年过去,首 款消费级AR智能眼镜Rokid Air获得市场认可,成为首部 60000 台全部售完的消费级单品。

也是在这一年,Rokid在AR行业率先提出了分体设计。打造了AR行业首 款主机Station,引入云计算为AR开辟道路,让显示与计算分离。在重量、算力和续航矛盾之间找到了软解法。

而在推出消费级空间计算平台之前的五个月,Rokid MAX、操作系统YodaOS-Master以及AR空间创作工具「灵镜」的发布,成为被消费者及行业人士双认可的旗舰设备,Rokid正式站稳了脚跟。

对于仍在萌芽期的AR行业来说,无论哪款新品问世,都意味着共同做大行业蛋糕的行动更进一步。但不可否认的是,Rokid和其他国产厂商在技术上的持续迭代,以及toC市场大刀阔斧的推进,无不酝酿着国产厂商即将掀起的行业变革。

据前瞻产业研究院数据, 2022 年,中国AR产业专利申请数达到2. 24 万项,排名首位,与之相对,美国为1. 81 万项,日本为0. 53 万项。不难看出,中国的AR技术实力已经悄然领跑全球。

03.奇点临近,Rokid上演「帽子戏法」

Pico的蛰伏和AR行业的逆势崛起,是AR和VR技术路线角逐暂时告一段落的信号。

正如此前义无反顾投入AR创业的罗永浩所说:「我们觉得 VR 的本质更像是游戏主机,它可能是史上最畅销的游戏机。我们相信 AR 就是下一代计算平台,这在科技界很大程度上也是共识了,并不是我们的创见。」

而OST和VST技术路线的选择,也给出了一个关于成本、效率、体验以及产业链协同的阶段性答案。对于祝铭明来说,他认可每一个技术路线的发展前景,但如何选择,基于对市场前景的判断和商业规律的尊重。从空间计算来说,就是选更贴近消费者真实需求的。

而这更核心的体现在Rokid在国内国外的市场拓展以及内容生态协同上,正如他给Rokid的定义「一家隐藏在精美硬件产品中的系统软件公司」。

从浅层次来看,Rokid一直在致力于为用户提供足够丰富的内容。这包括在国内携手影牛牛为提供了上百部顶 级3D视效大片,与随乐游深度合作,提供了三百多款海内外顶 级游戏,以及和阿里云合作,在打造行业全栈语音解决方案的同时,连接云端和眼镜端,让沉浸式的云上办公和娱乐成为可能。

在海外,与Google的合作不仅带来了丰富的内容供给,也和此轮与docomo的合作一样,为Rokid打开了中国香港地区、日本、韩国、新加坡、马来西亚、印度和印度尼西亚等主要亚洲国家和地区的市场。

事实上,Rokid的出海之旅远早于此,在 2022 年 7 月,其产品就登陆亚马逊,截至目前,Rokid AR眼镜已经在全球超过 80 个国家和地区开放销售。

「时代周刊」表示,「成立于中国的创业公司Rokid,其发布的空间计算平台Rokid AR Studio处于行业领先地位。」而北美知名科技媒体Phone Arena则盛赞Rokid Station(全球版):「最 大的优点是其便携性,它比一部智能手机还轻。」

而截至发稿前,Rokid上演了一出「帽子戏法」,继公布了销量、渠道合作的之后的第三个好消息接踵而至,他们获得了资本市场的进一步认可。

11 月 21 日,Rokid官宣完成C轮融资,总规模达1. 12 亿美金,主要的投资者包括在游戏和教育领域开发和扩展多个互联网及移动平台的网龙。

「我们期待着与网龙合作,利用他们在教育和游戏方面的知识和技能,以及他们的全球销售网络,扩大我们的机会。」祝铭明的发言表明,新一轮的融资将被用于Rokid的海外市场拓展,并在游戏、教育场景方面展开新的尝试。

这也折射出Rokid进军C端市场的更深一层动作,即并不止步于取代电视和游戏机的工具,而是通过给已有场景赋能,带来观影、娱乐、办公的新时代供给,实现从娱乐设施向生产力工具的转变。

成为更广泛应用的AR平台,是Rokid拥抱下一个时代「第四屏」的关键目标。而这一布局是在创业初期就已开始的「长期主义」坚持。

在推动人机交互的革新过程中,Rokid自研XR操作系统、平台,并提倡、参与建立XR领域的开放标准,构建基础设施。甚至Rokid Station采用的「分体设计」根本目的也在于,把显示和计算设备分开,可以解锁更多的应用可能性。

在正确的技术路线选择上,Rokid十年之旅看似跋涉,却并没有走什么冤枉路。

回过头来看,完善的内容生态,是AR爆发的「破题之举」;丰富线上线下渠道,是爆品起飞的助推器;而伴随推动产品从B端到C端,从娱乐工具向生产力平台的转变。

对于这家中国企业来说,它的「iPhone时刻」已经不再遥远。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • AI Lyrics Generator:利用AI技术快速生成原创歌词

    AI Lyrics Generator是一个基于人工智能技术的在线歌词生成工具,专为词曲作者、音乐家和创意人士设计。它能够根据用户输入的风格、主题和情感等参数,快速生成原创歌词。这个工具利用先进的机器学习算法,模仿人类创作歌词的过程,为用户提供灵感和创作辅助。AI Lyrics Generator不仅能够节省创作时间,还能拓宽创作视野,帮助用户探索不同的音乐风格和表达方式。

  • Fancy Text Generator:创意文字转换器,轻松生成独特、炫酷的文字效果。

    Fancy Text Generator是一个在线工具,利用AI算法为用户提供多种风格的花式文字生成服务。它支持包括花式字体、emoji装饰、特殊符号在内的多种文字效果,适用于社交媒体、个人签名、艺术创作等场景。该产品的主要优点包括用户友好的界面、快速生成作品的能力、高分辨率输出以及社区分享功能。它免费在线使用,无需下载,适合所有希望在数字平台上展示个性化文字的用户。

  • Flux Lora Online:在线生成精美图片,释放创意潜力。

    Flux Lora Online 是一个在线平台,提供多种 Flux Lora 模型,用于生成各种风格的图像。这些模型包括但不限于写实风格、动漫风格、迪士尼风格等,能够满足不同用户对图像生成的多样化需求。平台采用先进的图像生成技术,提供高分辨率和细节丰富的图像,同时拥有用户友好的界面,简化工作流程,提高生产力。

  • Vadoo AI:AI视频生成器,将文本快速转化为视频。

    Vadoo AI是一个全功能的AI视频生成器,它使用先进的人工智能技术,让用户能够将文本提示快速转化为视频内容。该产品支持多种语言字幕,提供多种视频风格和模板,以及背景音乐和自动缩放等功能,使得视频制作变得简单而高效。Vadoo AI的目标是帮助用户,无论是社交媒体创作者还是企业营销人员,都能轻松创建专业质量的视频内容,以吸引和保持观众的注意力。

  • AI Youtube Shorts Generator:从长视频中生成引人入胜的YouTube短片

    AI Youtube Shorts Generator 是一个利用GPT-4和Whisper技术的Python工具,它可以从长视频中提取最有趣的亮点,检测演讲者,并将内容垂直裁剪,以适应短片格式。这个工具目前处于0.1版本,可能存在一些bug。

  • Cavela:全球首个虚拟采购代理,连接全球制造商网络

    Cavela是一个创新的虚拟采购代理平台,它通过自动化技术连接全球的供应商网络,为企业提供从供应商匹配、报价编制、样品生产、质量保证到订单交付的一站式服务。Cavela通过其平台,帮助企业降低采购成本,提高效率,同时确保产品质量。它特别适合需要全球采购资源的中小型企业和初创公司,帮助他们在竞争激烈的市场中快速响应市场需求。

  • Landerino:最简洁的网页构建器,设计至上

    Landerino是一个创新的网页构建平台,它通过提供简单易用的界面,让用户能够快速创建、编辑和发布落地页。它不仅支持实时编辑和预览,还提供了强大的分析工具,帮助用户优化页面并进行A/B测试。Landerino的目标是让每个人都能轻松地构建和管理自己的网页,无需专业的技术背景。它通过简化网页制作流程,降低了维护成本,使内容创造成为焦点。

  • Mneme AI:在设备上与您的笔记进行对话,提升生产力。

    Mneme AI 是一款运行在iPhone上的本地AI助手应用,它允许用户通过与个人笔记、文档和书籍的对话来提高工作效率。这款应用完全离线运行,确保了用户数据的隐私和安全。Mneme AI 通过提供个性化的响应,帮助用户整理思绪和知识,支持用户使用内置文本编辑器记录新笔记或添加PDF文档。它支持英语,并推荐在iPhone 14或更新型号上使用以获得最佳性能。

  • AI-Faceless-Video-Generator:利用AI生成视频脚本、语音和会说话的头像

    AI-Faceless-Video-Generator是一个利用人工智能技术,根据话题生成视频脚本、语音和会说话头像的项目。它结合了sadtalker进行面部动画,gTTS生成AI语音和OpenAI语言模型生成脚本,提供了一个端到端的解决方案,用于生成个性化视频。该项目的主要优点包括脚本生成、AI语音生成、面部动画创建以及易于使用的界面。

  • FLUX.1-dev-LoRA-Dark-Fantasy:生成幻想生物和角色的AI模型

    FLUX.1-dev-LoRA-Dark-Fantasy是由Shakker AI的GUIZANG(歸藏)训练的LoRA模型,专注于生成幻想生物和角色。该模型受到Klee、Odilon Redon、Eyvind Earle等艺术家的影响,能够生成具有电影质感、复杂光影效果和精细细节的图像。模型遵循flux-1-dev-non-commercial-license,适用于非商业用途。

  • 通义万相AI视频生成:利用AI技术,将文字和图像转化为创意视频。

    通义万相AI创意作画是一款利用人工智能技术,将用户的文字描述或图像转化为视频内容的产品。它通过先进的AI算法,能够理解用户的创意意图,自动生成具有艺术感的视频。该产品不仅能够提升内容创作的效率,还能激发用户的创造力,适用于广告、教育、娱乐等多个领域。

  • Windows Agent Arena:用于测试和开发AI代理的可扩展开源框架

    Windows Agent Arena (WAA) 是一个专注于Windows操作系统的可扩展、开源框架,用于测试和开发能够使用语言模型在PC上进行推理、规划和行动的AI代理。它通过模拟真实的Windows环境,允许代理自由操作,并使用与人类用户相同的应用程序、工具和网络浏览器来解决任务。WAA通过Azure实现可扩展性和并行化,能够在短短20分钟内完成完整的基准测试评估。

  • VELS by Kaiden AI:AI驱动的模拟训练,提升沟通技能。

    VELS by Kaiden AI是一个基于人工智能的模拟训练平台,提供定制化、反馈丰富的模拟场景,帮助用户准备各种交流互动。该平台通过创建逼真的训练场景和AI虚拟对话伙伴,模拟真实世界的交流环境,让用户在安全的环境中练习和提高沟通技能。VELS通过实时反馈和性能分析,为用户提供个性化的训练体验,帮助他们在各种行业和角色中提升表现。

  • Selfplanr:规划你的高中四年,迈向梦想大学。

    Selfplanr是一个为高中生设计的在线规划工具,旨在帮助学生规划他们的高中生涯,以实现进入理想大学的目标。通过个性化的目标设定、动态的四年规划、每周任务安排、与导师和同伴的协作规划以及动态进度跟踪,Selfplanr帮助学生构建全面而独特的简历,发现学术之外的无数机会,如实习、奖学金、研究和志愿活动。

  • GoMaxAI:一站式AI服务,提供多样化智能解决方案。

    GoMaxAI是一个集成了多种AI功能的平台,旨在为用户提供包括3D视频创建、智能问答、AI绘画、文档分析和思维导图等多种智能服务。它通过先进的AI技术,帮助用户在影视制作、设计、艺术创作、信息处理等领域提高效率和创造力。

  • XVERSE-MoE-A36B:多语言大型语言模型,支持多领域文本生成。

    XVERSE-MoE-A36B是由深圳元象科技自主研发的多语言大型语言模型,采用混合专家模型(MoE)架构,具有2554亿的总参数规模和360亿的激活参数量。该模型支持包括中、英、俄、西等40多种语言,特别在中英双语上表现优异。模型使用8K长度的训练样本,并通过精细化的数据采样比例和动态数据切换策略,保证了模型的高质量和多样性。此外,模型还针对MoE架构进行了定制优化,提升了计算效率和整体吞吐量。

  • Peter Cat:智能答疑机器人解决方案,助力GitHub社区维护者和开发者

    Peter Cat 是一个专为社区维护者和开发者打造的智能答疑机器人解决方案。它通过对话式答疑 Agent,配置系统、自托管部署方案和便捷的一体化应用SDK,让用户能够一键创建智能答疑机器人,并快速集成到各类官网或项目中,为社区提供更高效的技术支持生态。

  • Covers:将您的音乐作品转换为全新风格。

    Covers 是 Suno 推出的一款音乐创作工具,它允许用户将任何声音,从简单语音备忘录到完整制作的音乐,转换成全新风格的音乐作品,同时保留原始的旋律。这一功能特别适合想要尝试不同音乐风格或为纯音乐添加歌词的音乐创作者。Covers 目前处于早期访问测试阶段,向所有 Pro 和 Premier 订阅者提供,用户可以免费试用200次,之后每次生成新 Cover 将消耗10个积分。

  • AgentRE:基于代理的框架,用于在复杂信息环境中进行关系抽取。

    AgentRE是一个基于代理的框架,专门设计用于在复杂信息环境中进行关系抽取。它通过模拟智能代理的行为,能够高效地处理和分析大规模数据集,从而识别和提取实体之间的关系。该技术在自然语言处理和信息检索领域具有重要意义,尤其是在需要处理大量非结构化数据的场景中。AgentRE的主要优点包括其高度的可扩展性、灵活性以及对复杂数据结构的处理能力。该框架是开源的,允许研究人员和开发者自由使用和修改,以适应不同的应用需求。

  • GoMaxAI Pro版 (ChatGPT-Midjourney):个人、团队、企业私有化AIGC应用平台

    GoMaxAI Pro版是一个基于Node.js、Vue3、uniapp开发的AIGC平台,提供ChatGPT、Midjourney绘画、Suno音乐、Pika/Runway/Sora视频服务。它支持私有化部署,适用于个人、团队和企业,强调用户体验和资源集成,具备权限管理和安全审计功能。

今日大家都在搜的词: