首页 > 业界 > 关键词  > 正文

伯克利研究人员推出AI智能体Dynalang:可接收复杂指令

2023-08-08 09:52 · 稿源:站长之家

站长之家(ChinaZ.com)8月8日 消息:加州大学伯克利分校研究人员推出了一种名为 Dynalang 的智能体,这是一种通过在线体验获取世界语言和视觉模型的智能体,并利用该模型来理解人类行为。

由于世界建模与动作不同,Dynalang 可以在单一模式(纯文本或纯视频数据)上进行预训练,而无需活动或任务奖励。此外,语言生成的框架可能是统一的:代理的感知可以影响其语言模型(即,其对未来标记的预测),从而允许其通过在动作空间中生成语言来交流环境。他们在具有不同语言环境的广泛领域中测试 Dynalang。Dynalang 学习利用有关未来观察、环境动态和纠正的语言线索,以便在多任务房屋清洁环境中更快地完成家务。

image.png

论文地址:https://arxiv.org/abs/2308.01399

Dynalang 通过使用未来预测来将语言与视觉体验相连接,能够理解各种形式的语言以完成不同的任务。它在多任务的家庭清洁环境中学会使用语言提示来更快地完成任务,并且在 Messenger 基准测试中表现优于其他算法。Dynalang 还可以在视觉语言导航中接收复杂的指令,并展示了超越其他算法和任务特定架构的能力。

举报

  • 相关推荐
  • ReCon框架帮助AI大模型识破谎言 增加AI智能体的安全性

    随着大语言模型的不断进展,AI智能体的发展也变得更加蓬勃。研究者发现在未来无人监管的情况下,防止AI智能体被欺骗和误导是一个被忽视的问题,因为人类社会中存在着大量误导和欺骗性的信息,如果AI智能体不能有效地识别和应对这些信息,可能会导致不可估量的后果。这一研究对于提高AI智能体的安全性和可靠性具有重要意义。

  • 千万人围观「烧焦婴儿」图片!伯克利教授辟谣:AI图片检测器无用

    【新智元导读】AI无法打败AI,不是没有道理。上千万人围观的婴儿死亡照片,AI检测工具竟无法给出一致答案。在AI模型加速迭代当下,想要有「火眼金睛」太难了。

  • 复旦NLP团队发布80页大模型Agent综述,一文纵览AI智能体的现状与未来

    复旦大学自然语言处理团队推出LLM-basedAgents综述论文,全文长达86页,共有600余篇参考文献!作者们从AIAgent的历史出发,全面梳理了基于大型语言模型的智能代理现状,包括:LLM-basedAgent的背景、构成、应用场景、以及备受关注的代理社会。作者们探讨了Agent相关的前瞻开放问题,对于相关领域的未来发展趋势具有重要价值。就像其他的云服务一样,AaaS有潜力为用户提供高灵活性�

  • 英伟达爆火智能体研究AI逼真还原人类情感!会饿会孤独,会跑步会发火

    AI智能体,竟然能反映人类的真实情感有人际关系中微妙的距离感?最近,来自英伟达、华盛顿大学、港大的研究人员发布了类人智能体HumanoidAgents。从名字就可以看出,这种智能体能够反映人类的基本需求。他曾获得华盛顿大学硕士学位,学习的是自然语言处理,研究对话系统和计算社会科学。

  • 研究人员称,即使是最糟糕Claude AI版本也比GPT 3.5更好

    10月6日,一场引人入胜的竞争正在AI行业内悄然展开,OpenAI的ChatGPT与Anthropic的ClaudeAI模型之间展开了激烈的角逐。负责创建ChatbotArena和著名的Vicuna模型的大型模型系统组织刚刚更新了他们的ChatbotArena排行榜,展示了每个AI聊天机器人与竞争对手相比的表现。由于Claude模型在排名上超越了GPT-3.5,企业和个人用户可能会发现自己在评估哪个模型最符合其需求时面临抉择。

  • AI研究人员发现了主要大语言模型中关键漏洞 可低成本复制

    大型语言模型如ChatGPT和Bard在全球范围内引起了广泛的关注,众多公司投资数百万美元用于开发这些人工智能工具一些领先的AI聊天机器人的估值已达到了数十亿美元。这些LLM主要被应用于AI聊天机器人,它们通过整合互联网上的大量信息来学习和为用户提供请求的答案,这些请求通常被称为“提示”。”这项研究为我们提醒了虽然AI技术带来了巨大的机会,但也伴随着一系列潜在的威胁,因此必须谨慎行事。

  • 研究人员推出深度学习模型RECAST 改进地震预测

    来自加州伯克利分校、圣克鲁斯分校以及慕尼黑工业大学的研究人员发表论文,阐述了一种崭新的模型,将深度学习引入地震预测领域。该模型被命名为RECAST,相比自1988年问世以来改进有限的当前标准模型ETAS,RECAST可利用更大的数据集,提供更高的灵活性。你会看到它朝着正确的方向发展。

  • 中国研究人员推ImageBind-LLM:通过ImageBind实现LLM的多模态指令调优方法

    研究人员最近在大型语言模型的指令调整方面取得了令人瞩目的进展。这一发现对于提高通用语言模型的性能和多模态指令响应能力具有重要意义。ImageBind-LLM展示了四个关键特点:这项研究的成果为大型语言模型的多模态指令响应能力提供了新的方法和思路,具有重要的实际应用潜力。

  • 研究人员发现使用少见语言即可绕过GPT-4的限制

    布朗大学的计算机科学研究人员发现了OpenAI的GPT-4存在的安全性问题。通过使用不常见的语言,如祖鲁语和盖尔语,他们成功绕过了GPT-4的限制性设置。尽管他们意识到这一研究可能会给网络犯罪分子提供想法,但他们仍然认为将这一漏洞公之于众是必要的,因为利用现有的翻译API轻松实施这些攻击,因此那些试图绕过安全防护的恶意行为者最终会发现这一漏洞。

  • Waymo推出智能体运动预测方法MotionLM

    研究人员发现了一种名为MotionLM的新方法,用于预测道路上各种交通参与者的未来行为,这对于自动驾驶车辆的安全规划至关重要。MotionLM的主要思想是将多个道路参与者的行动预测任务视为一项语言建模工作,将预测任务视为创建语言短语的过程,其中语言是道路参与者的行动。MotionLM是自动驾驶车辆多代理动态预测的创新方法,对该领域的发展非常有益。

热文

  • 3 天
  • 7天