首页 > 业界 > 关键词  > V-IRL最新资讯  > 正文

港大开发V-IRL平台:将真实世界地图纳入虚拟环境 给AI Agent完整的一生!

2024-03-04 09:15 · 稿源:站长之家

要点:

1. 港大和NYU的研究团队发展了一个名为V-IRL的平台,将真实世界的地图、街景等信息融入虚拟环境,为AI Agent提供了更真实和完整的生活体验。

2. V-IRL平台通过模拟真实世界环境,使智能体能够执行复杂任务,如寻找餐馆、房源、城市规划等,并且能够在不同任务间协作解决问题。

3. 研究人员进行了基于V-IRL的地点识别、视觉问答和导航等基准测试,发现视觉模型在处理多语言图像数据时面临挑战,但平台为AI在现实世界的应用提供了广阔的可能性。

站长之家(ChinaZ.com)3月4日 消息:近日,港大和NYU的研究团队合作开发了一个名为V-IRL的平台,该平台将真实世界的地图、街景等丰富信息融入到虚拟环境中,为AI Agent提供了更真实和完整的生活体验。

这项研究的核心在于构建一个可扩展的平台,利用地理信息和街景图像等API将AI智能体嵌入到真实城市环境中。研究人员使用V-IRL实例化了一系列智能体,它们可以执行各种任务,如寻找餐馆、房源、城市规划等。在这个平台上,智能体之间也可以协作解决复杂问题。

image.png

项目地址:https://github.com/VIRL-Platform/VIRL

此外,研究团队还进行了基于V-IRL的地点识别、视觉问答和导航等基准测试。结果显示,视觉模型在处理多语言图像数据时面临挑战,尤其是在一些地理多样性的城市中,模型的性能不如人意。

然而,这些挑战并没有阻止V-IRL平台为AI在现实世界的应用提供广阔的可能性。通过对不同任务的性能评估,研究人员展示了这个平台在全球视觉数据处理方面语言和视觉模型的广泛应用潜力,为提高AI在理解环境、做出决策和处理现实世界信息方面的能力开启了新的可能。随着空间计算技术和机器人系统的日益普及,AI Agent的需求和应用场景将不断扩大,我们期待着一个能够深刻理解周围世界的智能体时代的到来。

这项研究的意义在于,它将AI智能体从传统的虚拟环境中解放出来,让它们能够在与真实世界相似的环境中进行学习和交互。通过与真实世界的结合,AI Agent可以更好地理解人类行为和需求,从而为各种实际任务提供更准确、更高效的解决方案。同时,这项研究也展示了人工智能在未来城市规划、个人助手、生活辅助工具等领域的巨大潜力,为我们进入智能体时代打下了坚实的基础。

举报

  • 相关推荐
  • 直通第五届无畏契约全国赛,掠夺者PL Girls的含金量还在上升!

    11月2日,PL+Girls校园电竞赛年度总决赛将在上海举行。从64支女子战队中脱颖而出的4支顶尖队伍——武汉站JMM、DCG与广州站xytk+、FGS,将角逐冠军荣耀。获胜队伍不仅捧起年度奖杯,更可直接晋级《无畏契约》全国总决赛,踏上专业电竞舞台。赛事以"挑战式学习"为核心理念,通过竞技、潮流与社交融合的开放平台,助力女性玩家突破自我,展现电竞梦想的光芒。

  • 国补1929元起!联想moto X70 Air预售:比iPhone Air更轻更薄

    联想moto X70 Air将于10月31日发布,新机目前已在联想商城、京东等电商平台开启预售。 据了解,联想moto X70 Air提供12GB 256GB、12GB 512GB两个版本,上市价分别为2599元和2899元。 联想moto手机京东自营旗舰店显示,联想moto X70 Air券后叠加国补到手价为1929元、2189元。

  • 半马跑者实测!奢音 X7 Air适配马拉松,佩戴轻盈不压耳

    本文分享奢音X7Air骨传导耳机的使用体验。作为运动耳机,它仅重23克,佩戴轻盈稳固,采用医疗级硅胶材质,防汗抗敏。音质上搭载Turbo Down低频增强技术,低音强劲,中高频清晰通透。蓝牙连接稳定,续航达10小时,支持快充。专为跑者设计,解决了传统耳机闷汗、压迫耳道等问题,适合晨跑和马拉松训练。

  • 升级版“蓝心小V”亮相,豆包大模型助力vivo打造AI原生体验

    vivo发布全新OriginOS 6系统,升级私人助手“蓝心小V”。该系统依托蓝心大模型与豆包大模型协同,实现精准意图识别与多模态交互,支持新闻、教育、天气等场景的智能问答。通过火山引擎联网搜索及内容整合,提供低延迟、高情感语音响应。同时拓展无障碍服务,为视障用户提供实时视觉辅助。未来将持续深化AI生态建设,打造更智能便捷的原生体验。

  • 佳能 R50V:APS-C 画幅 高画质 + 高帧率双突破,2025 年专业双修微单新基准

    佳能R50V作为2025年APS-C画幅全能微单,凭借2420万像素CMOS与DIGIC X处理器,实现“高画质+高帧率”双突破。支持6K超采4K 30P无裁切、4K 60P流畅录制及全高清120P慢动作,配备10-bit 4:2:2色深与Canon Log 3专业视频配置。机身仅重323克,搭载第二代全像素双核AF系统,精准追踪人眼与运动主体。覆盖Vlog、人像、风光、赛事等多场景创作,结合6000元级高性价比定位,成为兼顾专业创作与日常记录的理想选择。

  • 国内首个!海尔智家获评TÜV认可智能家电检测免目击实验室

    海尔全球检测中心近日通过TÜV莱茵2025年度认证评审,升级为免目击实验室。这是国内首个在智能家电检测领域获此资质的企业,标志着其检测实力获国际权威认可。该资质可大幅缩短认证周期,提升产品上市效率,助力企业抢占市场先机。海尔还拥有CNAS、UL等多项国际认证,实现检测数据互认,未来将持续创新检测技术,为全球用户提供更优质产品体验。

  • 触觉增强世界模型引关注,一目科技IROS首秀定义机器人感知新维度

    在2025年IROS大会上,中国AI企业一目科技凭借触觉感知与具身智能领域的突破成为焦点。公司展示了全球最薄仿生视觉触觉传感器,厚度大幅缩减,实现0.005N三维力分辨率和120fps输出帧率。CEO李智强提出"视觉-触觉-语言-行动"新范式,指出触觉能捕捉物理世界的隐秘维度。通过创新仿真平台和生成式AI技术,突破传统数据收集限制,显著提升机器人操作技能训练效率。现场机械臂成功演示易碎品抓取等复杂任务,验证了触觉感知在精细操控中的核心价值,为"操控即服务"产业愿景提供技术支撑。

  • PL Girls掠夺者校园电竞女神联赛究竟是怎么火出圈的?

    10月19日,PL Girls掠夺者校园电竞女神联赛广州站在广州工商学院落幕。经过激烈角逐,XYTK+与FGS战队脱颖而出,晋级年度总决赛,将与武汉赛区优胜队伍争夺总冠军。赛事融合专业竞技与潮流文化,通过官方解说、舞蹈表演等环节打造沉浸式体验,并设置装备体验区让玩家零距离接触顶级电竞设备。掠夺者以赛事为平台,为女性玩家构建支持性电竞生态圈,重新定义校园电竞赛事内涵。

  • 双十一闭眼入机型推荐:佳能R50V拍美食/车展无压力,现在入手最省钱省心

    双十一购物季即将开启,佳能推出R50V与R50相机,主打美食与车展拍摄场景。R50V作为全能双修机型,搭载2420万像素APS-C传感器与DIGIC X处理器,支持专业视频录制及智能对焦系统,内置14种创意滤镜优化色彩表现。R50则以轻便设计见长,配备智能拍摄模式,适合静态影像创作。双十一期间推出优惠价格(R50V 5999元起,R50 5599元起),搭配摄影配件套装,助用户捕捉美食细节与动感瞬间。

  • 百度智能云这项开源,让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

    10月28日,百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测(MTP)技术代码。该技术通过批量生成和集中验证机制,使模型解码吞吐量提升超2倍,突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配,并经过百度内部业务验证,开发者可"开箱即用"获得稳定可靠的推理加速能力。

今日大家都在搜的词: