首页 > 业界 > 关键词  > AI助手最新资讯  > 正文

苹果Vision Pro头显AI助手来了 会调酒还会打麻将

2023-06-12 10:17 · 稿源:站长之家

站长之家(ChinaZ.com)6月12日 消息:上周苹果推出的Vision Pro头戴显示器引起了很多人的兴趣。你能想象一下如果加上人工智能的话,会是什么样的体验吗?

最近,新加坡南洋理工大学和微软雷蒙研究所推出了一个多模态的人工智能助手——Otter(水獭)。它能够以视频作为输入,完成多模态的感知、推理和上下文学习,并经过专门的指令遵守训练。

QQ截图20230612101753.jpg

它不仅能够教你打麻将、开飞机,还能教你调酒。它能够实时识别现实场景并回答人类提问,简直是一个全能型的选手。

Otter支持8种语言,包括中文。在训练过程中,团队使用了适用于增强现实头戴显示器的第一人称视角视频,明确表示这是为苹果头戴显示器准备的。有网友发现,在各种测试项目中,Otter的平均成绩比传统的MiniGPT-4、OpenFlamingo等传统模型高出了十几个百分点。

image.png

Otter使用视觉识别模块来分析场景信息,并结合ChatGPT生成答案。其中,关键的视觉模块是基于改良版的LLaVA进行训练的。Otter的工作流程大概是这样的:首先要对视觉信息进行处理,并结合系统信息生成激励。生成好的激励会被传递给ChatGPT,得到指令-回应数据。这些回应数据再经过一步筛选器的筛选,由ChatGPT将所选择的语言进行翻译并输出。此外,团队还引入了冷启动机制,用于发现可用于数据库中的情景实例。

在线体验:

https://otter.cliangyu.com/

论文地址:

https://arxiv.org/abs/2306.05425

GitHub页面:

https://github.com/Luodian/Otter

举报

  • 相关推荐
  • 蝉妈妈 AI:打造电商人专属智能助手,技术实力引领行业革新

    蝉妈妈AI通过“独家电商数据库+AI大语言模型”技术融合,精准定位为电商营销助手。其创新构建“对话交互+多智能体”框架,提供数据分析与内容创作两大核心模块,帮助中小商家降低运营门槛、提升效率。该工具通过智能选品、爆款仿写、视频脚本解析等功能,实现从数据解读到内容生成的全链路智能化,助力电商行业实现普惠化智能变革。

  • 省心还是添乱?AI旅游助手在争议中前进

    AI对在线旅游行业的改造,正在提速。 今年上半年,各大平台争相推出面向用户的各类AI旅游助手,刮起了一阵AI旋风: 马蜂窝在2025世界人工智能大会上带来了AI旅游助手APP,计划将其打造成目的地“专属管家”,不久前还上线了个性化攻略定制产品“AI路书”; 途牛在4月推出“AI助手小牛”,随后陆续更新多项功能; 飞猪则推出“飞猪AI问一问”,并第一时间接入DeepSeek-R1大模

  • 可赞AI深度测评:这款AI办公助手,让我告别加班写报告!

    文章分享了一款名为“可赞AI”的办公工具,能高效处理文档写作、图表制作和会议纪要整理。通过实际测试,作者发现该工具可自动生成结构化摘要、可视化图表,并支持多场景适配,大幅提升办公效率。尤其适合团队协作,减少沟通成本。虽然部分复杂功能仍需优化,但整体完成度高,值得职场人士尝试。

  • 非洲女孩被AI识别出黑眼圈 网友:AI一视同仁

    ​9月10日,在上海外滩大会的热闹现场,一场关于AI测肤质的体验活动吸引了众多目光。其中,一位黑人女孩的体验过程尤为引人注目,她在使用AI测肤质功能后,竟被提示存在黑眼圈问题,需关注眼部皮肤状态及保养,这一结果瞬间引发了现场围观和网友热议。 据现场工作人员介绍,该AI测肤质功能通过先进的技术分析皮肤状况,不受肤色影响。当黑人女孩完成测试后,AI系�

  • 制造全链革命:广域铭岛工业AI体系驱动企业向AI原生跃迁

    制造业智能化转型面临数据孤岛、知识依赖人工、业务协同效率低等痛点。广域锚岛发布Geega工业AI应用平台与工业智造超级智能体,通过“平台+数据+场景”一体化战略,构建全链路智能化核心支撑,推动企业从传统“+AI”迈向“AI原生”运营模式,实现研发与制造环节的智能协同。实践案例显示,智能体驱动制造流程再造,显著提升排产效率83%,工艺文件生成准确率提高90%,开发周期缩短至小时级。该平台为企业数字化转型提供坚实技术基础,助力构建数据智能竞争力。

  • 在抖音,AI让心智成为超级链接

    你有没有想过,为什么有些品牌内容「爆得很玄」,而有些却能精准击中消费者心扉? 以蓝月亮为例,当这个品牌被提及,有人立刻想到其领先的生物科技「秒溶术」,有人脱口而出「至尊洗衣三锦囊」的洗护智慧,还有人联想到它推动的快洗时代变革。 这些多样化的记忆点,不仅塑造了消费者对产品的认知,更在无形中引导着市场需求与品牌之间的精准对接,促成了用户偏

  • 三星于 IFA 2025 推出 Vision AI 伴侣,开启 AI 驱动的显示新时代

    三星电子在IFA2025展会上推出Vision+AI伴侣,通过生成式AI技术赋能电视与显示器产品。该技术整合升级版Bixby语音助手,实现自然对话交互,提供个性化内容推荐和场景化智能服务。Vision+AI伴侣突破传统电视功能边界,支持多设备智能联动,覆盖影视、艺术、美食等多领域内容交互。该方案将于2023年9月下旬通过软件更新在韩国、北美及部分欧洲市场首发,后续逐步推广至全球。

  • 从“能导航”到“会思考”,腾讯地图AI新品即将发布

    2025年腾讯全球数字生态大会将于9月16-17日在深圳举办。大会重点包括腾讯地图将发布时空智能开放平台GAIA,聚焦AI+地图战略价值,通过开放生态连接政企资源,推动行业数字化转型。平台结合LBS技术与AI大模型,深度挖掘时空数据价值,为企业提供决策支持。小红书、麦当劳等企业代表将分享实战案例,展示地图技术在零售、出行等领域的应用潜力。

  • 真我Neo7 Turbo AI版发布 首款动感地带AI手机

    日前,真我Neo7TurboAI版发布,这是真我联合中国移动打造的首款动感地带AI手机。 与真我Neo7Turbo标准版相比,新机后盖多了中国移动Logo。 官方表示,真我Neo7TurboAI版将带来极速性能、偶像陪伴、运动竞技、云端空间、社交潮流五大专属体验。 真我Neo7TurboAI版负一屏植入芒果卡俱乐部,集成芒果TV、咪咕视频等App,自带咪咕体育、咪咕快游会员,支持中国移动云盘等服务。 据�

  • AI能力获权威认可,易鑫荣登“2025 AI Era企业创新大奖TOP55”

    易鑫集团凭借突出的科技创新能力及多项AI技术落地成果,荣登“2025AI+Era企业创新大奖TOP55”榜单,成为榜单上唯一的汽车金融科技领域代表。该奖项由新智元发起,旨在评选AI领域具有卓越市场竞争力和创新力的标杆企业。易鑫自研的AI技术已全面应用于汽车金融全场景,显著提升服务效率与用户体验,并通过科技解决方案赋能海内外合作伙伴,展现出优秀的商业化落地与跨区域扩展能力。公司将持续推进AI创新与业务深度融合,助力合作伙伴和用户共享科技红利。

今日大家都在搜的词: