首页 > 业界 > 关键词  > 苹果最新资讯  > 正文

新专利显示苹果VR头显可能利用神经网络监测用户的姿势

2021-07-14 07:53 · 稿源: cnbeta

苹果VR或AR头显可以根据监测用户的身体动作来移动用户的虚拟头像,而其电池寿命可以通过一些巧妙的数据传输技术来延长。在美国专利和商标局周二授予的一对专利中,苹果公司认为它可以改进其头显所能提供的东西,涉及到它如何与用户互动,以及它如何与主机设备进行通信。

第一项专利名称为"生成身体姿势信息",涵盖了系统跟踪用户运动的能力,然后使用这些数据来执行其他相关动作。苹果估计,一些沉浸式计算机生成的现实体验需要了解用户的身体姿势。在一些体验中,VR或AR应用可能会根据用户的姿势或动作,对其呈现的内容做出改变,比如游戏中的警卫会对用户的姿势做出不同的反应。

更明确地说,苹果公司建议,了解身体的姿势可以用来控制用户的化身。这在流行的在线社交体验VR聊天等情况下可能很有用,它可以利用其他硬件的运动来改变用户化身的动作。根据该专利,苹果公司建议可以使用各种相机和神经网络来学习姿势,多个神经网络一起工作,为单个身体关节建模。每个神经网络都单独工作,但其结果被反馈到一起以创建整个身体模型。

训练将以多种方式进行,不仅要教授对摄像机数据的理解,还要训练网络如何相互作用,这包括多个神经网络系统的各自拓扑结构。就网络能收集多少关于一个人的姿势的信息而言,有说法称监测的关节涵盖颈部、肩关节、肘关节、腕关节、骨盆关节、膝关节、踝关节和指关节。

第二项与VR有关的专利名为"自适应无线传输方案",瞄准了处理头显和主机之间的通信。目前,像Oculus Quest这样的一体式系统,它们会增加设置的重量,虽然系留式设置可以减轻重量,但电缆本身可能是一个问题。解决这个问题的办法是采用无线通信系统,以减轻重量并消除电缆。

然而,即使是无线系统也会引起问题。例如,传输数据需要消耗电力,而且无线系统的可用带宽通常比电缆系统低。还有固有的干扰问题和其他干扰性问题。在这项专利中,苹果建议可以使用无线系统,但为了减少一次性传输的数据量,该系统必须发送更少的视频数据。苹果计划通过使用左眼数据和右眼数据的交错帧传输,希望将使用的带宽减半。

举报

  • 相关推荐
  • 大家在看
  • QQ 持续强化网络水军整治,助力网络环境良性发展

    一直以来,QQ 致力于为广大用户构建健康、绿色、积极的网络环境。然而网络水军的持续对抗,导致部分虚假信息和炒作行为干扰舆论环境,误导公众正确的认知判断,破坏网络空间的公共秩序。为进一步维护平台良好的生态秩序,QQ 持续打击网络水军操纵信息内容的违法违规行为,严厉处置恶意蹭炒热点事件、刷转评赞数据的网络水军账号,以及网络水军容易聚集的违规群�

  • 惠普发布727pm显示器:4K IPS Black屏、内置网络摄像头

    惠普推出了新款Series7Pro727pm显示器,主要针对商务和生产力方面做了优化,加入了一些针对性的设计,比如内置了环境光传感器,可自动调节亮度。除了DisplayPort1.4输入输出端口、HDMI2.0端口外配备了多个USBType-C/A端口,包括一个支持DP模式、65WPD供电的USBType-C端口以及五个USB3.2Gen2Type-A端口,为用户提供了丰富的连接选项。

  • 美国为摆脱华为发愁:真的离不开 网络设备拆了无法上

    7月6日消息,据国外媒体报道称,虽然美国在各种打压华为,但他们真的没办法离开这家公司。报道中提到,华为占据全球电信设备收入的近三分之一,这样的体量和影响力,让美国根本没能力完全摆脱。在世界上的某些地方,你真的离不开华为。”这是美国对华为的评价。更早之前,美国联邦通信委员会(FCC)要求国家提供更多资金,帮助互联网服务提供商修复和更换华为和中兴通讯生产的设备。按照FCC的说法,在获得联邦支持的美国电信公司中,近40%需要额外的政府资金,才能从美国无线网络中移除中企制造的设备。设备拆除工作预计耗资49.8亿美元,?

  • 爱聊APP 2024年5月“净”行动公示,守护用户网络安全

    爱聊APP近日正式公示了其2024年5月“净网”行动的成果,这一行动旨在深入整治网络环境,切实守护用户的网络安全。在当前网络社交日益普及的背景下,爱聊APP积极响应用户需求,通过“净网”行动为用户打造一个更加安全、清朗的社交空间,让每一位用户都能在平台上放心交流,畅享社交的乐趣。01加强信息认证,注重安全社交为保障用户社交安全,从源头上防范不法分子�

  • 伊对积极宣传反诈知识,警企合作共筑网络安全墙

    随着网络社交的不断发展,在虚拟空间产生的电信网络诈骗也日益变化。电信网络诈骗犯罪活动已成为当前发案最高、造成损失最大、群众反映最强烈的突出犯罪。打击电信网络诈骗,保护群众财产安全,是每个互联网企业义不容辞的责任。伊对作为主打真实的音视频社交平台,主动履行社会责任,积极宣传反诈知识,并联合公安部门打击各类犯罪行为,共筑网络安全墙。在�

  • 南湛高速通车在即 5G网络及测速系统将同步启用

    随着南宁至湛江高速公路南宁至博白那卜段的关键控制性工程——平陆运河旧州特大桥的全幅贯通,该高速公路建设迎来重要里程碑。钦州移动紧跟建设步伐,在南湛高速灵山段圆满完成了高速区间测速建设和网络覆盖两大项目,为高速公路的顺利建设提供了强有力的技术支撑。网络测试显示,在沿途及隧道内行驶时,手机网络信号稳定,用户可畅享玩游戏、刷视频、视频通话等流畅无卡顿的通信服务。

  • 倍孜网络携手信通院,启动SDK合规研究报告编写

    2024年7月9日至11日,第二十三届中国互联网大会在北京召开。“互联网大会”是中国最早的互联网行业盛会之一,自2002年创办以来,以开放精神汇聚行业智慧,是国内最权威的互联网行业盛会之一。在合规领域,倍孜网络将持续与信通院深度合作,开展一系列的合规践行,赋能行业的动作。

  • 东北虎竟然能听懂东北话:与饲养员默契互动走红网络

    一段别开生面的视频在网络上迅速走红,视频中一只东北虎展现出了令人惊讶的“语言天赋”,仿佛能够听懂地道的东北话指令。在饲养员的细心照料下,这只东北虎在洗澡时表现得异常乖巧,按照饲养员用东北方言发出的“仰脖”指令,它竟然能够准确无误地调整姿势,这一幕温馨又有趣的画面,瞬间捕获了众多网友的心。它提醒我们,在保护野生动物、促进生态平衡的同时,也应尊重它们的习性和需求,以更加科学、人性化的方式给予它们关爱和呵护。

  • “City”到底啥意思?热梗City不City风靡网络

    一股名为“City不City”的网络热潮席卷来,迅速成为社交媒体上的热门话题,引发了广大网友的广泛讨论与好奇——“City”究竟蕴含着怎样的新意义?这股风潮的源头,是一位自美国来的创意达人“保保熊”,他将“City”这一词汇赋予了全新的内涵——“洋气不洋气”,这一独特解读不仅频繁登上热搜,更激发了公众无限的遐想与共鸣。在保保熊的诠释下,“City”不再仅仅是城市的代名词,它化身为一种情感与体验的象征,代表着那些令人心潮澎湃、难以忘怀的美好瞬间。这种跨文化的语言现象,不仅丰富了人们的表达方式,也促进了世界各地文化的相互理解和尊重,展现了人类文明的多样性与包容性。

  • 《蛋仔派对》推进反诈行动,护航未成年人网络安全

    随着网络的迅猛发展,网络诈骗的手段也在不断翻新,给广大玩家带来了严重的财产损失和心理困扰。作为一款备受玩家喜爱的多人休闲游戏,《蛋仔派对》积极承担社会责任,推进反诈行动。《蛋仔派对》将继续在未成年人网络安全保护方面持续发力,不断优化和完善反诈措施,与广大玩家一起,共同守护安全、绿色的游戏环境。

  • Mock Interviews with AI:AI驱动的模拟面试,提升求职成功率。

    Mock Interviews with AI 是一款由Invue AI提供的职业面试准备平台,它通过AI技术模拟真实面试场景,提供即时反馈和个性化建议,帮助求职者提高面试技巧和自信心。产品背景基于36,000+求职者的使用经验,由专业团队设计,旨在帮助用户在面试中取得成功。产品提供基础和高级两个版本,基础版免费,高级版提供更多功能和服务。

  • Lokal.so:本地开发工具,支持远程访问和AI辅助

    Lokal.so 是一款本地开发工具,旨在简化本地开发环境的设置和使用。它通过提供多种功能,如本地隧道服务、AI 助手、S3 兼容服务器等,帮助开发者更高效地进行本地开发和调试。主要优点包括:1. 支持通过公共和 https .local 地址共享本地主机。2. 提供自托管的本地隧道服务器,确保隐私和自由。3. 利用 Cloudflare 的全球网络加速网站交付。4. 内置 AI 助手,可以与隧道流量交互,生成代码,回答与流量内容相关的问题。5. 提供无限的 .local 域名,支持局域网内的访问。6. 内置 S3 兼容服务器,方便文件存储和调试。7. 支持 JSON 到语言模式的自动转换,简化开发流程。

  • ScanIt:轻量级、快速、无广告的文档扫描应用

    ScanIt是一款专为iPhone和iPad设计的文档扫描应用,以其轻量级、快速、无广告的特点,为用户提供了一种简单高效的文档数字化解决方案。它拥有智能文档识别、曲面调整和文本提取(OCR)等专业功能,支持多种格式导出,并能安全加密文档,满足不同用户对扫描效率和安全性的需求。

  • PhotoMaker V2:一键生成个性化照片,快速便捷。

    PhotoMaker V2是由腾讯ARC实验室开发的AI照片生成应用,利用先进的图像识别和生成技术,用户可以快速生成个性化的照片。产品背景信息显示,PhotoMaker V2旨在为用户提供一个简单、高效的图片创作工具,无论是社交媒体分享还是个人收藏,都能满足用户需求。目前产品处于免费试用阶段,具体价格尚未公布。

  • Speax AI:AI视频多语言配音服务

    Speax AI提供快速、准确的AI视频配音服务,支持29种以上语言的即时翻译和配音。它通过先进的AI技术确保声音同步和文化准确性,同时提供具有竞争力的价格。

  • Cerebella:智能学习卡片应用,简化知识学习过程。

    Cerebella是一款iOS平台上的智能学习卡片应用,旨在通过简洁美观的设计,帮助学生和终身学习者高效备考和探索新知识。它提供了创建个性化学习卡片、智能学习算法、多选测试和自定义学习体验等功能,致力于让学习变得更简单、更有趣。

  • Volv:9秒新闻,为高效人士提供精炼资讯。

    Volv是一款为追求效率的个人设计的新闻APP,它由AI驱动,通过9秒的短文章形式,提供最有趣、最热门和最重要的内容。Volv旨在减少用户在社交媒体上无目的滚动的时间,帮助他们快速获取信息。

  • SuperCoder:自主软件开发系统,提高编码效率。

    SuperCoder是一个开源的自主软件开发系统,利用先进的AI工具和代理来简化和自动化编码、测试和部署任务,提高效率和可靠性。它支持多种编程语言和框架,以满足不同的开发需求。

  • Composio:AI代理工具集,赋能复杂任务处理。

    Composio是一个为AI代理提供高质量工具和集成的平台,它简化了代理的认证、准确性和可靠性问题,使得开发者能够通过一行代码集成多种工具和框架。它支持100多种工具,覆盖了GitHub、Notion、Linear等90多个平台,提供了包括软件操作、操作系统交互、浏览器功能、搜索、软件开发环境(SWE)以及即席代理数据(RAG)等多种功能。Composio还支持六种不同的认证协议,能够显著提高代理调用工具的准确性。此外,Composio可以作为后端服务嵌入到应用程序中,为所有用户和代理管理认证和集成,保持一致的体验。

  • NeuralGCM:高效准确的气候模拟模型

    NeuralGCM是由谷歌研究团队开发的气候模型,与传统基于物理的气候模型相比,它结合了机器学习技术,提高了模拟的准确性和效率。NeuralGCM能够生成2至15天的天气预测,其准确性超过了当前的黄金标准物理模型,并且在重现过去40年的温度数据方面比传统大气模型更为准确。尽管NeuralGCM尚未构建为完整的气候模型,但它标志着开发更强大、更易用气候模型的重要一步。

  • RouteLLM:节省LLM成本,不牺牲质量的框架

    RouteLLM是一个用于服务和评估大型语言模型(LLM)路由器的框架。它通过智能路由查询到不同成本和性能的模型,以节省成本同时保持响应质量。它提供了开箱即用的路由器,并在广泛使用的基准测试中显示出高达85%的成本降低和95%的GPT-4性能。

  • Meta-Llama-3.1-8B:8B参数的大型多语言生成模型

    Meta Llama 3.1是一系列预训练和指令调整的多语言大型语言模型(LLMs),包含8B、70B和405B大小的版本,支持8种语言,专为多语言对话用例优化,并在行业基准测试中表现优异。Llama 3.1模型采用自回归语言模型,使用优化的Transformer架构,并通过监督式微调(SFT)和强化学习结合人类反馈(RLHF)来提高模型的有用性和安全性。

  • Meta-Llama-3.1-70B:70亿参数的大型多语言文本生成模型

    Meta Llama 3.1是Meta公司推出的大型语言模型,拥有70亿个参数,支持8种语言的文本生成。该模型采用优化的Transformer架构,并通过监督式微调和人类反馈强化学习进一步优化,以符合人类对帮助性和安全性的偏好。模型在多语言对话使用案例中表现优异,超越了许多现有的开源和封闭聊天模型。

  • Meta Llama 3.1-405B:大型多语言预训练语言模型

    Meta Llama 3.1-405B 是由 Meta 开发的一系列大型多语言预训练语言模型,包含8B、70B和405B三种规模的模型。这些模型经过优化的变压器架构,使用监督式微调(SFT)和强化学习与人类反馈(RLHF)进行调优,以符合人类对帮助性和安全性的偏好。Llama 3.1 模型支持多种语言,包括英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。该模型在多种自然语言生成任务中表现出色,并在行业基准测试中超越了许多现有的开源和封闭聊天模型。

  • Llama 3.1:最前沿的开源AI模型,支持多语言和高级功能。

    Llama 3.1是Meta AI推出的最新一代大型语言模型,具有128K的上下文长度扩展、支持八种语言,并首次开源了405B参数级别的前沿AI模型。该模型在通用知识、可控性、数学、工具使用和多语言翻译方面具有最先进的能力,能够与最好的闭源模型相媲美。Llama 3.1的发布,将为开发者提供解锁新工作流程的工具,例如合成数据生成和模型蒸馏。

  • YouOrMe:通过面部识别技术比较你与父母的相似度

    YouOrMe是一款利用面部识别技术的应用,通过比较用户的面部照片与父母的面部照片,来确定用户更像谁。该技术不仅有趣,还能引发家庭间的互动和讨论。它使用先进的面部识别算法,为用户提供一个简单、直观的方式来探索他们的遗传特征。

  • Arcane.com:AI助力的营销自动化工具

    Arcane是一个面向现代营销人员的AI驱动的生产力平台,旨在通过自动化行业和受众研究、文案撰写以及内容再利用来提高工作效率。它通过集成的应用程序库,帮助营销人员快速生成有价值的LinkedIn帖子,节省时间,扩大影响力。

  • Awan LLM:无限令牌,无限制,成本效益高的LLM推理API平台。

    Awan LLM是一个提供无限令牌、无限制、成本效益高的LLM(大型语言模型)推理API平台,专为高级用户和开发者设计。它允许用户无限制地发送和接收令牌,直到模型的上下文限制,并且使用LLM模型时没有任何约束或审查。用户只需按月付费,而无需按令牌付费,这大大降低了成本。Awan LLM拥有自己的数据中心和GPU,因此能够提供这种服务。此外,Awan LLM不记录任何提示或生成内容,保护用户隐私。

  • Screenflick:电影台词搜索与生成工具

    Screenflick是一个提供电影台词搜索和生成服务的网站,用户可以通过它来寻找特定的电影台词或生成新的台词。它不仅能够增加用户对电影的了解和兴趣,还能激发创意思维,为电影爱好者和创作者提供灵感。

  • Airy:智能日记,助你轻松反思成长

    Airy是一款AI驱动的反思日记应用,它通过语音输入和图像识别简化了记录过程,同时提供个性化的分析和建议,帮助用户提高自我认知,促进个人成长。Airy的使命是让心理健康像聊天一样自然,其愿景是让自我发现变得愉快,个人成长变得轻松,心理健康真正可及。

今日大家都在搜的词: