首页 > 业界 > 关键词  > V-IRL最新资讯  > 正文

港大开发V-IRL平台:将真实世界地图纳入虚拟环境 给AI Agent完整的一生!

2024-03-04 09:15 · 稿源:站长之家

要点:

1. 港大和NYU的研究团队发展了一个名为V-IRL的平台,将真实世界的地图、街景等信息融入虚拟环境,为AI Agent提供了更真实和完整的生活体验。

2. V-IRL平台通过模拟真实世界环境,使智能体能够执行复杂任务,如寻找餐馆、房源、城市规划等,并且能够在不同任务间协作解决问题。

3. 研究人员进行了基于V-IRL的地点识别、视觉问答和导航等基准测试,发现视觉模型在处理多语言图像数据时面临挑战,但平台为AI在现实世界的应用提供了广阔的可能性。

站长之家(ChinaZ.com)3月4日 消息:近日,港大和NYU的研究团队合作开发了一个名为V-IRL的平台,该平台将真实世界的地图、街景等丰富信息融入到虚拟环境中,为AI Agent提供了更真实和完整的生活体验。

这项研究的核心在于构建一个可扩展的平台,利用地理信息和街景图像等API将AI智能体嵌入到真实城市环境中。研究人员使用V-IRL实例化了一系列智能体,它们可以执行各种任务,如寻找餐馆、房源、城市规划等。在这个平台上,智能体之间也可以协作解决复杂问题。

image.png

项目地址:https://github.com/VIRL-Platform/VIRL

此外,研究团队还进行了基于V-IRL的地点识别、视觉问答和导航等基准测试。结果显示,视觉模型在处理多语言图像数据时面临挑战,尤其是在一些地理多样性的城市中,模型的性能不如人意。

然而,这些挑战并没有阻止V-IRL平台为AI在现实世界的应用提供广阔的可能性。通过对不同任务的性能评估,研究人员展示了这个平台在全球视觉数据处理方面语言和视觉模型的广泛应用潜力,为提高AI在理解环境、做出决策和处理现实世界信息方面的能力开启了新的可能。随着空间计算技术和机器人系统的日益普及,AI Agent的需求和应用场景将不断扩大,我们期待着一个能够深刻理解周围世界的智能体时代的到来。

这项研究的意义在于,它将AI智能体从传统的虚拟环境中解放出来,让它们能够在与真实世界相似的环境中进行学习和交互。通过与真实世界的结合,AI Agent可以更好地理解人类行为和需求,从而为各种实际任务提供更准确、更高效的解决方案。同时,这项研究也展示了人工智能在未来城市规划、个人助手、生活辅助工具等领域的巨大潜力,为我们进入智能体时代打下了坚实的基础。

举报

  • 相关推荐
  • vampir吸血鬼身份验证教程 vampir吸血鬼怎么身份验证?

    《Vampir吸血鬼》将于2025年8月26日登陆韩服开启公测,支持PC与移动端跨平台互通。本文提供详细身份验证教程:使用加速器优化网络后,通过官网注册账号,选择Netmarble ID登录,完成邮箱验证流程,输入验证码即可完成认证,助您畅享黑暗冒险之旅。

  • 中国操作系统银河麒麟V11正式发布

    8月26日,麒麟软件在2025中国操作系统产业大会上正式发布银河麒麟操作系统V11。该系统基于6.6内核构建,是国内首个商业版6.6内核操作系统,标志着我国操作系统产业进入高稳定、强安全的核心能力建设新阶段。V11在技术架构、AI融合、安全性及生态兼容方面实现重大突破,支持国内外主流芯片,已适配超700万软硬件产品。该系统已成功应用于天问探火、空间站等国家重大工程,累计实现超10万小时零故障运行,服务用户超7万家,连续十四年保持中国Linux市场占有率第一。

  • 奢音 X7 Air 骨传导耳机:精准拿捏跑步场景需求,关键就靠这几招!

    作为运动爱好者,作者分享了对奢音X7Air骨传导耳机的使用体验。传统入耳式耳机在跑步时易导致耳道不适、出汗堵塞,且影响户外安全。X7Air仅23克,佩戴轻盈稳固,IPX8级防水抗汗,音质清晰低音强劲,内置32G存储和10小时续航,特别适合跑步场景。经过实测,它解决了运动时的诸多痛点,性价比突出,是跑步爱好者的理想选择。

  • 雷蛇发布北海巨妖萌猫版V3系列:现支持多平台连接

    雷蛇发布北海巨妖萌猫系列耳机新品,包括专业版V3 Pro和V3X。专业版V3支持无线、蓝牙和有线三种连接模式,配备Chroma RGB灯效、可伸缩麦克风、TriForce驱动单元和THX空间音效,专为玩家和创作者设计。V3X采用轻量化有线设计,兼容多设备,提供清晰音质。两款产品融合高性能音频与个性化设计,满足游戏、直播和移动创作需求。

  • 自研遇阻!苹果考虑用谷歌Gemini升级Siri

    苹果正与谷歌就使用Gemini AI引擎为新一代Siri提供技术支持进行初步谈判,这一动向表明苹果可能进一步将人工智能能力外包,成为其AI战略的关键一步。 据知情人士透露,这家iPhone制造商近期已与Alphabet旗下谷歌接触,商讨合作构建一款定制化AI模型,以用于明年预计推出的新版本Siri。 谷歌目前已开始训练一款可在苹果服务器上运行的模型。苹果在生成式人工智能领域起步�

  • 努比亚Air渲染图出炉:5.9mm超薄 对标苹果iPhone 17 Air

    日前,海外爆料博主@evleaks带来了努比亚即将推出的超薄机型努比亚Air”渲染图,多角度展示了新机的设计细节。 这款新机采用了超薄方案,厚度只有5.9mm,整体造型跟9月亮相的iPhone 17 Air造型接近,背部是长条形的后摄方案,有黑色与米金色两款配色。

  • 阿里Wan2.2-S2V正式发布:一张图+一段音频 即可生成人物动态视频

    今晚,阿里云正式发布全新多模态视频生成模型通义万相Wan2.2-S2V,并宣布开源。 Wan2.2-S2V极大地简化了视频制作过程,仅需提供一张静态图片和一段音频,模型便能生成面部表情自然、口型与音频高度一致、肢体动作流畅丝滑的电影级数字人视频。 支持分钟级长视频稳定生成,不止嘴动,手势、表情、姿态都能动。

  • 跨端AirDrop要来了吗 曝谷歌安卓快速分享将兼容iOS

    谷歌正在为苹果iOS开发兼容安卓的快速分享”功能。 报道称,他们拆解Google Play服务25.34.31 Beta版文件后,发现与苹果iPhone版快速分享”有关的代码,还激活了与iPhone共享文件的弹窗。

  • 荣耀Magic V Flip2今日开售:售价5499元起

    影像能力堪称荣耀Magic V Flip2的一大亮点。作为行业首款2亿像素主摄小折叠,它也是小折叠品类中首款采用“端云结合”影像方案的机型,支持最高AIGC30倍变焦,同时还搭配一颗1200万像素超广角镜头,满足用户多样化的拍摄需求。 在耐用性上,荣耀Magic V Flip2升级超坚韧50m UTG玻璃,获得SGS高品质耐久折叠认证,可实现50万次耐久折叠,确保屏幕5年长效平整,让用户使用更安心�

  • 免费使用!腾讯地图已接入DeepSeek-V3.1

    DeepSeek V3.1于2025年8月21日发布并开源,腾讯地图率先完成接入。新版AI助手“AI叮当”在三大核心能力显著提升:思考效率更高,响应更快;上下文理解更强,支持多轮连贯对话;智能体调用更精准,尤其在中文网页理解和跨领域搜索方面表现突出。依托升级,AI叮当可提供个性化行程规划、周边推荐及景点知识问答等智能出行服务,让导航升级为全程智能生活陪伴。

今日大家都在搜的词: