首页 > AI头条  > 正文

​苹果研发 AI 代理,助力盲人虚拟探索街景

2025-07-08 09:41 · 来源: AIbase基地

苹果公司近期在其机器学习研究中心发布了一篇论文,介绍了一款名为 SceneScout 的人工智能代理。该技术旨在通过分析街景图像,为视障人士提供详细的环境描述,从而帮助他们在前往新的地点之前提前了解周围的地形。

目前,许多视障人士在独立出行时常常感到犹豫,因为他们不清楚陌生环境中的具体情况。尽管已有一些工具如微软的 Soundscape 应用,能够提供现场环境的描述,但这些工具主要是在用户现场使用时进行的,而非提前准备。因此,视障人士在出行前所获得的地标和导航信息,往往无法满足他们对环境背景的需求。SceneScout 的诞生正是为了填补这一空白。

苹果

SceneScout 是一款由多模态大型语言模型驱动的 AI 代理,具有两种主要功能模式。其中,“路线预览” 模式能够提供关于沿途可见元素的详细描述,比如提醒用户在转弯处注意路旁的树木等触觉元素。而 “虚拟探索” 模式则允许用户在街景图像中自由移动,获取更直观的环境信息。

在用户研究中,参与者表示 SceneScout 极大提升了他们对环境的认知,因为这款 AI 能够获取他们无法通过现有工具获取的信息。该研究表明,SceneScout 的描述准确率高达72%,对于稳定的视觉元素,准确率更是高达95%。然而,参与者也提出了一些改进建议,比如提供个性化的描述,或者将描述的视角调整至更符合行人的位置。

此外,参与者希望 SceneScout 能够实时提供街景描述,以便与他们的行走位置同步,甚至可以通过骨传导耳机在用户移动时提供视觉信息。利用设备中的陀螺仪和指南针,SceneScout 还可以指向环境中的细节,进一步提升使用体验。

虽然这篇论文并不代表苹果一定会推出相关产品或服务,但它为我们提供了一个了解苹果在这项技术应用方面的视角。未来,结合 AI 和实时数据,苹果或许能够为视障人士创造出更多便利的工具。

划重点:

🌍 SceneScout 是一款 AI 代理,旨在为视障人士提供详细的环境描述,帮助他们提前了解陌生地点的地形。

🔍 该技术具有 “路线预览” 和 “虚拟探索” 两种模式,可以根据街景图像提供环境信息。

📈 用户研究表明,SceneScout 在描述的准确性上表现良好,并提出了一些个性化和实时反馈的改进建议。

  • 相关推荐
  • 苹果研发加速:至少7款自研处理器同步开发中

    据媒体报道,随着2025年下半年新品发布季临近,苹果公司正迎来其自研芯片战略的关键转折点。 最新行业消息显示,苹果正在同步开发7款全新处理器,覆盖移动计算、可穿戴设备和无线通信三大领域,标志着其技术自主化进程进入全新阶段。 在移动处理器方面,苹果将推出A19系列芯片组。其中标准版A19将首次搭载于代号Tilos的iPhone 17 Air机型,而性能更强的A19 Pro版本则会为i

  • 文生图大模型有哪些?探索AI绘画的核心引擎与选择利器

    本文探讨了当前主流的AI文生图技术及其应用场景。国际阵营中,OpenAI的DALL·E3擅长复杂语义理解,MidJourney以艺术风格见长,Stable Diffusion则以开源生态支持深度定制。中国力量方面,百度文心一格在中文语义和国风创作表现突出,阿里通义万相侧重商业化应用,昆仑万维天工支持长文本生成连贯图像。垂直领域工具如Adobe Firefly深度集成设计流程,Runway ML革新视频创作。文章建议通过聚合平台高效对比模型特性,并指出下一代技术将突破分辨率限制,实现跨模态生成。从精准语义到无限可能,AI文生图正在重塑视觉创作边界。

  • 闪剪AI:一键生成数字人营销视频,助力商家轻松实现内容获客

    闪剪AI是一款专为营销视频制作设计的智能工具,主要解决实体商家和小白用户制作高质量营销视频的痛点。核心功能包括:1)一键生成数字人视频,支持定制专属形象;2)提供1000+数字人模特素材;3)多语种语音克隆,实现本地化内容;4)内置爆款文案素材库;5)智能成片功能简化制作流程;6)照片数字人让静态图片"开口说话";7)直播切片功能实时引流。该工具

  • 隐私为先,安心体验:探索保障Galaxy AI个性化体验的安全技术

    三星Galaxy AI通过个人数据引擎(PDE)实现个性化体验,该技术随Galaxy S25系列首次亮相。配合Knox+++增强加密保护(KEEP)技术,在设备端安全处理用户数据,确保隐私安全。KEEP为敏感数据创建独立加密空间,支持即时简报等功能,不影响使用流畅性。安全文件夹功能提供额外保护层,用户可自定义加密方式。这套系统构建了新一代移动智能安全标准,在提供个性化服务的同时保障数据本地处理,不上传不外泄,实现体验与隐私的双重提升。

  • 破壁之路:芬尼「董事长的房间」研发史诗——从技术迷途到空气革命

    文章讲述中国企业在空气系统研发领域的创新历程。团队最初研发高端"辐射五恒系统"遭遇技术瓶颈,后转型开发"地送风模式",通过地面风槽送风+顶部回风解决层高限制。最终创新推出"天面风管柔风+地面水冷调温"双模架构,实现零噪音、恒温恒湿的养生级空气系统。系统具备三重净化功能,能消除PM2.5、细菌等污染物,经严苛测试在极端环境下稳定运行。23年技术沉淀积累1730项专利,牵头制定行业标准,标志着中国企业在空气系统领域实现从参数崇拜到人文关怀的范式革命。

  • 应对VMware转型挑战!腾讯云x Omdia发布业内首个《从VMware到分布式云:企业虚拟化转型实战指南》

    腾讯云联合Omdia发布《从VMware到分布式云:企业虚拟化转型实战指南》,针对博通收购VMware后73%企业加速迁移计划的情况,提出"平替-升级-演进"三阶段路径。方案覆盖IaaS层替换、全栈云升级到云原生演进全场景,提供分布式云与专有云解决方案,支持5000vCPU规模下TCO降低30%。指南包含迁移策略、工具链及金融、制造等行业案例,如某银行8小时完成130套系统迁移并通过三级认证。腾讯云通过热迁移、数据同步等20余种工具,助力企业实现业务连续性保障和平滑过渡。

  • Meta高薪挖人!苹果AI大牛跳槽了

    Meta首席执行官扎克伯格正以高薪挖角竞争对手的AI人才,苹果一名核心工程经理已决定跳槽加入。 据悉,负责苹果基础模型团队的Ruoming Pang从苹果跳槽至Meta,他曾在苹果管理着约100名员工的团队,该团队致力于苹果大型语言模型的研发。 Ruoming Pang团队开发的模型已经应用到iPhone中,比如邮件摘要、生成式表情(Genmoji)等等。 Meta以每年数千万美元的待遇成功吸引了Ruoming Pan

  • 苹果发布iOS 18.6开发者预览版Beta 3:国行AI遥遥无期

    今日,苹果向iPhone用户推送了iOS 18.6开发者预览版Beta 3。 开发者可在兼容设备上通过设置”应用,进入通用软件更新”下载该测试版。 目前尚未发现有可见更新内容,不过此前有消息称,iOS 18.6将会针对欧盟地区用户进行实用性更新。 苹果当前在欧盟地区的iOS版本虽然支持上述两种行为,但会插入一些警告屏幕,这引起了欧盟监管机构的关注,将会进行一些调整。 值得注意�

  • 推动自动化产线研发!YOUMAGIC舒立缇研发公司与南林机械电子工程学院开展合作

    7月3日,YOUMAGIC舒立缇研发公司威脉医疗与南京林业大学机械电子工程学院在无锡国际生命科学创新园举行产学研合作签约仪式。双方将整合高校科研资源与企业产业优势,共同推动医疗健康领域技术创新与产业升级。威脉医疗专注高端医疗器械研发,已获得三类医疗器械注册证。此次合作将聚焦自动化产线研发,通过智能化技术提升医疗设备生产效率,推动行业转型升级。无锡高新区将为合作提供政策扶持与产业生态支持,助力科研成果转化落地。

  • 入选联合国案例集!AI拯救濒危动物,飞桨助力清除1.3万余条非法贸易广告

    7月9日,百度飞桨"濒危物种AI守护官"项目入选联合国AI向善全球峰会创新案例集。该项目通过AI技术识别野生动物制品图片,截至2025年6月已推动删除超1.3万条非法贸易广告。这是百度与国际爱护动物基金会(IFAW)合作研发的2.0版本,基于飞桨深度学习平台,识别准确率达86%,覆盖34类濒危物种及其制品。项目曾获2025爱迪生最佳新产品奖银奖。全球非法野生动物贸易年交易额高达230亿美元,该项目通过AI技术显著提升了网络野生动物犯罪识别效率,已筛查超41万张可疑图片,精准识别3.3万幅目标图片。AI向善全球峰会由国际电信联盟和瑞士政府共同主办,是推动AI技术发展与应用的重要平台。

今日大家都在搜的词: