ai 智能体利用 llm 自动生成奖励算法,训练机器人完成复杂任务。
nvidia research 开发的一款名为 eureka 的新型 ai 智能体可以教机器人复杂的技能,它教会了机器人手快速转笔,并且第一次转得像人类一样好。
上面视频中所展示的令人惊叹的“魔术”是机器人通过 eureka 学会熟练完成的近 30 项任务之一,eureka 可以自动编写奖励算法来训练机器人。
eureka 还教会了机器人完成打开抽屉和柜子、抛接球、操作剪刀等任务。
于 10 月 20 日发布的这一 eureka 研究包含一篇论文和该项目的 ai 算法,开发者可以使用 nvidia isaac gym(一款用于强化学习研究的物理模拟参考应用)进行实验。isaac gym 基于 nvidia omniverse 而构建,后者是一个用于基于 openusd 框架构建 3d 工具和应用的开发平台。eureka 自身是由 gpt-4 大型语言模型驱动的。
nvidia ai 研究高级总监、eureka 论文作者之一的 anima anandkumar 表示:“在过去十年,强化学习取得了空前成功,但依然面临许多挑战,比如奖励设计需要不断试错才能完成。eureka 是朝着开发将生成式和强化学习方法结合以解决这些艰巨的任务的新算法迈出的第一步。”
点击视频,观看 eureka 用 llm 训练机器人灵巧操作
ai训练机器人
据该论文介绍,eureka 生成的奖励程序(可让机器人进行试错学习)在超过 80% 的任务上优于人类专家编写的程序,这使得机器人的平均性能提高了 50% 以上。
eureka 教机械臂打开一个抽屉。
该 ai 智能体使用 gpt-4 llm 和生成式 ai 编写软件代码,为机器人进行强化学习提供奖励。它不需要任何特定任务提示或预定义的奖励模板,并且能够随时结合人类的反馈改进其奖励,使结果更加精准地符合开发者的愿望。
利用 isaac gym 中的 gpu 加速模拟,eureka 能够快速评估大批奖励候选者的质量,从而提高训练效率。
eureka 随后会基于训练结果汇总关键统计数据,并指导 llm 改进其奖励函数的生成。通过这种方式,ai 可以自我完善。eureka 教会了各类机器人,包括四足机器人、双足机器人、四旋翼机器人、灵巧手、协作机器人臂等,来完成不同类型的任务。
该研究论文对 20 个 eureka 训练任务进行了深入评估,这些任务基于开源的灵巧性基准,要求机器人手展示一系列复杂的双手任务。
这些来自九个 isaac gym 环境的测试结果通过使用 nvidia omniverse 生成的可视化进行了展示。
类人型机器人通过 eureka 学习跑步步态。
该项目的贡献者之一、nvidia 高级研究科学家 linxi “jim” fan 表示:“eureka 是一个独特的组合,将大型语言模型与 nvidia gpu 加速的模拟技术相结合,可以实现灵巧的机器人控制,并且为艺术家提供了一种制作物理逼真动画的新方法。”
除了 nvidia research 最近取得的进展(比如使用 gpt-4 构建的能够自主玩 《我的世界》的 ai 智能体 voyager)之外,这项突破性的研究成果也必将让开发者们脑洞大开。
nvidia research 由全球数百名科学家和工程师组成,团队专注于 ai、计算机图形学、计算机视觉、自动驾驶汽车、机器人学等领域的研究。
了解 eureka 与 nvidia research 的更多信息,请查看:
eureka:
https://eureka-research.github.io/
nvidia research:
https://www.nvidia.com/en-us/research/
gtc 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。点击 “阅读原文” 或扫描下方海报二维码,关注更多会议及活动信息。
原文标题:eureka!nvidia 研究突破为机器人学习注入新动力
文章出处:【微信公众号:nvidia英伟达】欢迎添加关注!文章转载请注明出处。
传AMD下一款中阶主流显卡欲在明年推出
镍氢电池的电极反应式_镍氢电池有记忆效应吗
台积电联手博世、英飞凌、恩智浦投资欧洲半导体厂;Nvidia推出新AI芯片GH200,降低大型语言模型成本
用 LabVIEW软件和CompactRIO硬件 解决生物流体灌注系统方案详解
中微BAT32G137 ARM-Cortex M0+超低功耗系列MCU
Eureka!NVIDIA 研究突破为机器人学习注入新动力
七彩虹CVN B760主板实战测试
软通动力首次为中联重科提供服务
飞兆的智能负载开关帮您解决智能手机的续航问题
电压敏电阻与热敏电阻的基本原理和应用
什么才是主流标准,无线充电迎来A4WP时代
上能电气与ACWA Power举行高层会晤 深化推进绿色能源领域合作
小帅iBoxPlus投影机评测 性价比方面还是蛮高的
CAN FD,汽车电子下一个“风口”
宁德时代碳酸锂项目签约!
2016年ARM有哪些事情让你印象深刻?
超声波液位传感器和激光式液位传感器有什么区别
助于创建新或修改设备的开发工具介绍
探究3D传感和近眼显示应用的关键技术
OpenDaylight中的MD-SAL是什么