首页 > 业界 > 关键词  > AI助手最新资讯  > 正文

苹果Vision Pro头显AI助手来了 会调酒还会打麻将

2023-06-12 10:17 · 稿源:站长之家

站长之家(ChinaZ.com)6月12日 消息:上周苹果推出的Vision Pro头戴显示器引起了很多人的兴趣。你能想象一下如果加上人工智能的话,会是什么样的体验吗?

最近,新加坡南洋理工大学和微软雷蒙研究所推出了一个多模态的人工智能助手——Otter(水獭)。它能够以视频作为输入,完成多模态的感知、推理和上下文学习,并经过专门的指令遵守训练。

QQ截图20230612101753.jpg

它不仅能够教你打麻将、开飞机,还能教你调酒。它能够实时识别现实场景并回答人类提问,简直是一个全能型的选手。

Otter支持8种语言,包括中文。在训练过程中,团队使用了适用于增强现实头戴显示器的第一人称视角视频,明确表示这是为苹果头戴显示器准备的。有网友发现,在各种测试项目中,Otter的平均成绩比传统的MiniGPT-4、OpenFlamingo等传统模型高出了十几个百分点。

image.png

Otter使用视觉识别模块来分析场景信息,并结合ChatGPT生成答案。其中,关键的视觉模块是基于改良版的LLaVA进行训练的。Otter的工作流程大概是这样的:首先要对视觉信息进行处理,并结合系统信息生成激励。生成好的激励会被传递给ChatGPT,得到指令-回应数据。这些回应数据再经过一步筛选器的筛选,由ChatGPT将所选择的语言进行翻译并输出。此外,团队还引入了冷启动机制,用于发现可用于数据库中的情景实例。

在线体验:

https://otter.cliangyu.com/

论文地址:

https://arxiv.org/abs/2306.05425

GitHub页面:

https://github.com/Luodian/Otter

举报

  • 相关推荐
  • 苹果Siri团队大换血!Vision Pro班底全面上马

    苹果正对Siri团队进行大规模重组,由新任工程主管Mike Rockwell主导改革。Rockwell从Vision Pro项目调来核心成员,重组了语音、理解、性能等关键团队。Vision Pro项目副手Ranjit Desai将负责Siri主要工程事务,Olivier Gutknecht接手用户体验设计。此次重组旨在简化开发流程,提升Siri功能。苹果AI/ML团队此前因管理混乱被员工戏称为"AI/less"。业内建议苹果应考虑重塑Siri品牌形象,推出全新数字助手以摆脱负面评价。

  • 苹果要 all in 智能眼镜?Vision Pro 2 也已准备就绪

    苹果已着手开发轻便且低价的 AR 智能眼镜,同时也在开发第二代头显设备 Vision Pro。

  • 苹果Vision Pro2有望年内上市 性能和设计上有望全面升级

    有关苹果第二代XR头显产品的消息不断传出。该产品已进入规模生产阶段,有望在年内正式发布。市场期待苹果能够为用户带来更多创新的产品和服务。

  • vivo申请注册MR头显商标 首款产品vivo Vision已亮相

    近日,维沃移动通信有限公司申请注册多枚VIVOAI眼镜”VIVOAR”VIVOMRHeadset”VIVOMR智能眼镜”商标,国际分类均为科学仪器,当前商标状态均为等待实质审查。在前不久的博鳌亚洲论坛上,vivoVision产品已经首次亮相,这是vivo首款MR混合现实头显设备。vivo还已经启动机器人领域的技术专家招聘工作,确认成立机器人LAB。

  • 苹果两款Vision Pro开发中!一款更轻更便宜、一款近乎零延迟

    快科技4月14日消息,据媒体报道,苹果正在开发两款新的Vision Pro设备,一款更轻、更便宜,另一款则主打近乎零延迟的体验。Mark Gurman透露,苹果正在开发一款比当前Vision Pro更轻、更便宜的设备。当前Vision Pro起售价高达3499美元,重量约600-650克,而新款设备将针对普通消费者,解决重量和价格两大问题。具体价格尚未披露,但有消息称其价格可能与高端iPhone相当,预计在1600美

  • vivo Vision混合现实头显宣布下半年发布

    vivo宣布其MR设备vivo Vision将于今年下半年正式发布,引发市场广泛关注。该设备可能与vivo X300系列手机同步上市,形成产品矩阵效应。Vision头显设计借鉴夏普Vision Pro风格,采用曲面抛光镜片,集成了多颗摄像头,但具体技术参数尚未公开。此布局被视为vivo战略转型的关键一步,旨在通过MR技术强化实时空间计算能力,为基础的未来机器人物联网应用奠定基础。vivo计划打造一套视觉感知系统,重点提升机器人的视觉捕捉、处理、理解、空间建模及边缘计算等五大维度的智能化水平。这一战略定位依赖于依图科技在AI大模型与混合现实技术领域的积累,vivo加速布局机器人赛道的相关落地措施已进入实质推进阶段。伴随Vision头显的发布,行业或将迎来新一轮技术竞争。这被寄予厚望的设备能否在空间计算领域实现突破,仍需等待市场验证。

  • 苹果Vision Air曝光:采用钛金属 设备更轻

    快科技4月17日消息,当前Vision Pro 256G版本售价为29999元起,设备重量为600克至650克,根据遮光罩和头带配置不同可能有所差异,其单独的电池重量为353克,不少线下体验者表示,该头显的重量影响其体验舒适度。苹果也意识到了这个问题,其下一代头显的研发重点是减重”,有博主在社交平台上爆料称,苹果正在研发全新头显Vision Air,其特点是采用轻量化设计,同时带来午夜�

  • 传初中生在校天天打麻将!校长:那是我设计的“化学麻将

    快科技4月15日消息,近日,深圳市南山实验教育集团麒麟二中的化学课堂上,中考复习秒变闯关游戏”,引起了网友热议。这样的化学课绝对颠覆你的想象!只见一群初三学生围坐麻将桌”前,手持的牌面却让围观者直呼看不懂”:高锰酸钾、氯离子、加热条件每一张牌都暗藏化学玄机。这款由校长亲自设计的化学麻将”彻底颠覆传统复习模式:学生需用14张牌组出完整化学方

  • Neousys宸曜科技亮相2025 Vision China(上海)

    2025年3月26日-28日,由机器视觉产业联盟主办、慕尼黑展览有限公司承办的2025上海机器视觉展暨机器视觉技术及工业应用研讨会VisionChinaShanghai在上海新国际博览中心顺利举办并圆满落幕。

  • 华为Vision智慧屏5系列正式推出:售价2799元起

    站长之家(ChinaZ.com)4月16日 消息:今日,华为正式推出Vision智慧屏5系列新品,凭借多项创新技术,为用户带来越级体验,宛如打造出一台更懂年轻人的“潮酷巨幕手机”。Vision智慧屏5系列以“三个首次”惊艳亮相。首次接入鸿蒙AI,深度融合与华为Mate70系列手机同源的AI能力。用户借助模糊剧情、角色/演员、台词三种模式,就能轻松锁定片源。比如询问“在阿勒泰拍摄的是哪�