首页 > 业界 > 关键词  > V-IRL最新资讯  > 正文

港大开发V-IRL平台:将真实世界地图纳入虚拟环境 给AI Agent完整的一生!

2024-03-04 09:15 · 稿源:站长之家

要点:

1. 港大和NYU的研究团队发展了一个名为V-IRL的平台,将真实世界的地图、街景等信息融入虚拟环境,为AI Agent提供了更真实和完整的生活体验。

2. V-IRL平台通过模拟真实世界环境,使智能体能够执行复杂任务,如寻找餐馆、房源、城市规划等,并且能够在不同任务间协作解决问题。

3. 研究人员进行了基于V-IRL的地点识别、视觉问答和导航等基准测试,发现视觉模型在处理多语言图像数据时面临挑战,但平台为AI在现实世界的应用提供了广阔的可能性。

站长之家(ChinaZ.com)3月4日 消息:近日,港大和NYU的研究团队合作开发了一个名为V-IRL的平台,该平台将真实世界的地图、街景等丰富信息融入到虚拟环境中,为AI Agent提供了更真实和完整的生活体验。

这项研究的核心在于构建一个可扩展的平台,利用地理信息和街景图像等API将AI智能体嵌入到真实城市环境中。研究人员使用V-IRL实例化了一系列智能体,它们可以执行各种任务,如寻找餐馆、房源、城市规划等。在这个平台上,智能体之间也可以协作解决复杂问题。

image.png

项目地址:https://github.com/VIRL-Platform/VIRL

此外,研究团队还进行了基于V-IRL的地点识别、视觉问答和导航等基准测试。结果显示,视觉模型在处理多语言图像数据时面临挑战,尤其是在一些地理多样性的城市中,模型的性能不如人意。

然而,这些挑战并没有阻止V-IRL平台为AI在现实世界的应用提供广阔的可能性。通过对不同任务的性能评估,研究人员展示了这个平台在全球视觉数据处理方面语言和视觉模型的广泛应用潜力,为提高AI在理解环境、做出决策和处理现实世界信息方面的能力开启了新的可能。随着空间计算技术和机器人系统的日益普及,AI Agent的需求和应用场景将不断扩大,我们期待着一个能够深刻理解周围世界的智能体时代的到来。

这项研究的意义在于,它将AI智能体从传统的虚拟环境中解放出来,让它们能够在与真实世界相似的环境中进行学习和交互。通过与真实世界的结合,AI Agent可以更好地理解人类行为和需求,从而为各种实际任务提供更准确、更高效的解决方案。同时,这项研究也展示了人工智能在未来城市规划、个人助手、生活辅助工具等领域的巨大潜力,为我们进入智能体时代打下了坚实的基础。

举报

  • 相关推荐
  • AI Agent再迎一巨头!谷歌重磅发力AI Agent ,商用大爆发!

    上周微软在“Microsoftignite2024”大会上发布10多个商用AIAgent后,科技巨头谷歌也宣布全力推广商用AIAgent,发布一系列激励活动和产品。谷歌云将提供从AIAgent的开发、部署到应用一站式商用生态。微软、谷歌、百度、SAP、Salesforce等巨头都在积极推广,加上OpenAI即将推出的全新AIAgent产品“Operator”,2025年将成为AIAgent商用爆发年。

  • AI Agent大爆发!微软刚刚发布大量商用AI Agent,全民智能体!

    微软在芝加哥召开“Microsoftignite2024”全球开发者大会,AIAgent成为本次大会的重点。微软发布的这些AIAgent包括简单易用的开发、维护一站式平台AzureAIFoundry、AzureAIAgent,同时也有集成在Microsoft365、Dynamics365等主打产品。本次大会一共三天,微软若放出更多关于AIAgengt、大模型的内容,「AIGC开放社区」还会继续为大家解读。

  • 清华、面壁提出创新AI Agent交互:能主动思考、预测需求

    哪怕是ChatGPT等最先进的AIAgent都是传统的被动式Agent,即需要用户通过明确的指令显式告诉Agent应该做什么,Agent才能继续执行接下来的任务。近期清华大学联合面壁智能团队提出了开创性的新一代主动Agent交互范式,为AI交互带来了突破性的解决方案。随着技术的不断进步,我们可以期待看到更自然的人机协作模式,更智能的场景适应能力,以及更深度的个性化服务。

  • 谷歌发布双思维AI Agent:像人类一样思考,重大技术突破!

    今年10月,OpenAI高级研究科学家、德扑AI之父NoamBrown,曾在美国旧金山举办的TEDAI大会上提出了一个惊人的理论——让AI模型思考20秒所带来的性能提升,相当于将模型扩大100,000倍并训练100,000倍的时间。Noam所指的技术便是System1/2thinking,也是OpenAI最新模型o1正在使用的技术。这种分工执行使得AIAgent能够同时处理快速的对话和复杂的规划,极大提高了用户体验。

  • AI能办专属信用卡了,Agent自己赚钱自己花,OpenAI合作伙伴打造

    给AI办张银行卡,它就能帮我们完成最终支付了?!事情是这样的。支付公司Stripe专门为AI智能体发布了一个接口,它允许智能体使用一次性虚拟卡完成金融支付。最后需要提醒,虽然现在可以给AI办银行卡了,但户头还不是AI自己。

  • 全球首个AI Agent程序员全面开放!3600元/月

    全球首个AIAgent程序员Devin今日宣布全面开放使用实现商业化,从最初的展示到全面使用不到一年时间。不过Devin的月费高达500美元,成为目前市场上最贵的生成式AI产品之一。值得一提的是,对于一个公司言,Devin是没有任何用户数量限制的,无论多少人都能无限制的使用。

  • 史上最贵!首个AI Agent程序员商业化,比ChatGPT Pro贵2倍

    今天凌晨1点,全球首个AIAgent程序员Devin宣布全面开放使用,实现商业化。只是价格不是一般的贵,前几天OpenAI发布的ChatGPTPro可以无限使用满血o1、新版本Sora等功能,一个月才200美元。因为它是没有任何用户数量限制的,无论多少人都能无限制的使用Devin。

  • 谷歌“狙击”OpenAI,发布新一代大模型,主打Agent+多模态

    继量子芯片之后,谷歌又来抢“OpenAI双12直播”的流量了!就在刚刚,谷歌新一代大模型Gemini2.0突然登场,再次由谷歌CEO皮猜亲自官宣。新一代模型专为AIAgent打造,谷歌表示目前已经将2.0版本提供给了一些开发者内测,正在迅速将其集成在Gemini和搜索等产品线中。从OpenAI跳槽到谷歌的LoganKilpatrick表示,他们在GoogleAIStudio中创建了一个全新体验,展示了Gemini2.0视频理解、原生工具�

  • 一个有意思的音效小工具: AI Sound Effect Generator

    在电影、游戏、音乐或者任何需要音效的创意项目中,声音的重要性往往容易被低估。它不仅是背景的点缀,更是叙事的一部分,能让你的作品更具生命力。

  • iOS 18.2 公开测试版 3 推出,Genmoji 和 AI 功能成亮点

    苹果在发布最新的iOS18.2开发者测试版仅数小时后,推出了公开测试版3。这一版本距离正式版发布仅有数周时间,以下是一些值得关注的新功能和改进。想要抢先体验这些功能的用户,可以通过[beta.apple.com]加入苹果公开测试版计划,下载并安装预发布软件。

热文

  • 3 天
  • 7天