英伟达AI AgentEureka开源可完成转笔等复杂动作

2023-10-21 14:29 · 稿源：站长之家

要点:
英伟达的最新AI AgentEureka使用GPT-4生成奖励函数，教会机器人完成多项复杂任务，包括转笔、打开抽屉、抛球等，表现超越人类专家。
Eureka采用混合梯度架构，结合无梯度的情境学习和强化学习，通过上下文来实现人类水平的奖励算法设计，大幅提升机器人性能。
这项研究受到广泛关注，开源项目可在机器人领域应用，尤其在处理复杂任务和高维电机控制方面表现出色，甚至有时与人类策略负相关。

站长之家（ChinaZ.com）10月21日消息:英伟达最新的AI AgentEureka搭载了强大的GPT-4模型，通过生成奖励函数的方式，使机器人能够完成多项复杂任务，其中包括一些看似简单但难以实现的动作，如转笔、打开抽屉、抛球等。这一成就令人瞩目，尤其是在转笔这项技能上，即便是靠人类逐帧制作动画，也难以达到如此高水准。研究结果显示，Eureka在超过80%的任务中都超越了人类专家，使机器人的平均性能提升了50%以上。

论文链接:

https://arxiv.org/abs/2310.12931

GitHub链接:

https://github.com/eureka-research/Eureka

Eureka的关键创新在于采用了一种混合梯度架构，结合了无梯度的情境学习和强化学习。这个系统使用GPT-4的零样本生成、代码编写以及上下文改进功能，对奖励执行策略进行优化。在外循环中，GPT-4细化奖励函数，而内循环则使用强化学习来训练机器人控制器。这种方法让机器人能够通过强化学习来掌握复杂的技能，而不需要特定的提示工程和奖励模版。

Eureka还支持一种新形式的上下文强化学习，它能够将人类操作员的反馈融入自然语言中，以引导和调整奖励功能。在对29种不同的开源RL环境进行基准测试时，Eureka在83%的测试中超越了人类，并实现了52%的改进。这些测试环境包括10种不同的机器人形态，如四足机器人、四旋翼机器人、双足机器人和机械手等。

最令人惊讶的是，Eureka在处理复杂、高维电机控制的任务上表现更佳，有时甚至与人类奖励的相关性负相关。这表明它的策略在某些情况下比人类策略更为有效，类似于AlphaGo在下棋策略上的表现。这项研究由英伟达、宾夕法尼亚大学、加州理工学院和德州大学奥斯汀分校的研究人员合作完成，其中近半数研究人员都是华人。这一成就为机器人学习和强化学习领域带来了革命性的突破，也引发了广泛的关注和期待。

（举报）

相关推荐
大家在看

关键词：

英伟达

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
荐AI行业买英伟达GPU，花的钱比赚的多17倍

搞AI大模型，实在太烧钱了。如今的生成式AI有很大一部分是资本游戏，科技巨头利用自身强大的算力和数据占据领先位置，并正在使用先进GPU的并行算力将其推广落地。无论花掉多少钱，成为第一可能就会带来潜在的收益……但是什么样的收益，我们还无法作出预测。

AI 大模型资本游戏
英伟达斥资7亿美元收购Run:ai，进一步巩固在AI领域地位

AI巨头公司英伟达继续其战略性收购行动，今日宣布将收购一家以色列初创公司，以使AI芯片更高效。这家芯片制造商已经签署了一项“最终协议”，收购基于Kubernetes的软件提供商Run:ai，后者帮助优化图形处理单元上的AI应用和工作负载。“Run:ai自2020年以来一直与英伟达紧密合作，我们都热衷于帮助客户充分利用其基础设施，”Geller在宣布这项交易的英伟达博客文章中说道。

Run:ai 英伟达 AI头条
英伟达投资东南亚：将在印尼投资2亿美元建AI中心

英伟达近日宣布将与印尼第二大移动电信公司IndosatOoredooHutchison携手，在梭罗建设一座总投资额高达2亿美元的人工智能开发中心，此举标志着英伟达进一步扩大在印尼乃至整个东南亚的业务版图。据印尼通讯与信息部长布迪阿里塞蒂亚迪透露，这座名为IndonesiaAINation”的开发中心将加强当地的电信基础设施、人力资源和数字人才，为印尼乃至整个东南亚地区的人工智能和技术进

英伟达印尼人工智能
SWE-agent官网体验入口开源AI程序员使用地址

SWE-agent是什么？SWE-agent是普林斯顿大学推出的首个开源AI程序员，基于GPT-4技术，能够自动修复GitHub仓库中的bug。SWE-agent适用于需要自动修复bug的软件工程师、研究人员、GitHub代码管理者等。

SWE-agent
AI明星创业公司买英伟达GPU ，几周估值翻倍，但花的钱比赚的多17倍

在AI行业，尤其是生成式AI领域，技术的快速发展和应用的广泛前景吸引了大量的投资和关注。这一领域的高昂成本也引起了业界的广泛讨论。如何在追求技术进步的同时实现可持续的商业模式，是所有AI公司需要面对的重要问题。

英伟达
联发科英伟达合力推新品，高通慌了

首次亮相的3nm天玑汽车座舱平台CT-X1在业内激起不小的波澜，被认为是友商8295的头号天敌。同时亮相的还有天玑汽车座舱平台CT-Y1和CT-Y0，采用4nm制程，汽车制造商可借助天玑汽车座舱平台实现从旗舰到高端车型的智能化体验升级，满足不同定位车型对高算力和强AI的需求。面向AI定义汽车的大势所趋，科技巨头们的深度合作展现出强大的市场影响力，这对联发科的对手们构成了不小的挑战正是激烈的产品和技术竞争，才是推动汽车产业持续创新与发展的原动力。
李斌：蔚来自研芯片一颗顶英伟达四颗

蔚来李斌近日表示，去年购买了很多的英伟达芯片，这耗费了公司不少钱，为此公司转向自研芯片，因为一颗芯片可以顶四颗，所以能降低成本。在2023蔚来日上，蔚来正式发布了首颗自研智能驾驶芯片神玑NX9031。配合蔚来汽车的最强安全冗余能力，神玑NX9031能够带来极致安心的驾驶体验，让驾驶者在享受智能驾驶带来的便利的同时，也能感受到蔚来汽车对安全性能的极致追求�

蔚来自研芯片智能驾驶
你买A卡还是N卡！AMD痛失一重要伙伴：微星全力做英伟达RTX系显卡

微星官网很难找到AMDRadeon7000系列产品，官方表示已经停产。微星官方确认，公司未来发展将专注于推出英伟达GeForceRTX系列GPU显卡产品。虽然市场需求飙升，但是英伟达近期采取以不变应万变的策略，没有追加订单，使得RTX4060Ti系列的情况更为突出。
荐钉钉 AI Agent Store 上线了！软件竞争格局重构：Agent 掀起新风暴，App 何去何从？

4月18日，钉钉正式上线AI助理市场。首批上架了200多个AI助理。AI能够更好地进行资源的配置和人员组织安排，这当然是一个更长远、也很有意思的想法。

钉钉
曝英伟达计划四季度推出RTX 5090！采用GDDR7、核心数增加50%

英伟达计划在今年第四季度推出RTX5090及RTX5080显卡。此将有助于英伟达合作伙伴扩大出货量，尤其是随着越来越多的玩家向高端升级，这些GPU的推出还将有助于提高GPU的平均售价。此外在光线追踪方面，英伟达RTX5090的性能目标是提高2.5倍，计算能力将提高2倍，功耗可能高达520W。

英伟达 RTX 5090

今日大家都在搜的词：

热文

3 天
7天

英伟达AI AgentEureka开源 可完成转笔等复杂动作

今日大家都在搜的词：

热文

站长商机

英伟达AI AgentEureka开源可完成转笔等复杂动作