如何训练机器人学习新技能

10月27日消息,据外媒报道,约翰斯霍普金斯大学博士生安德鲁洪特(andrew hundt) 近日发布一篇新论文,指出应通过正强化法训练机器人学习新技能。
这篇论文的核心思想是,在训练机器人的过程中,应采用正强化法,即相比于在它做错时进行惩罚,更应在它做对时进行激励。而对于机器人来说,这种激励机制是以评分系统的形式呈现的,类似玩游戏一样,根据执行任务的情况获得积分。
安德鲁表示,这种方法能够大大缩短训练机器人执行任务的时间。“机器人希望能得到更高的分数,所以它们很快就可以完成相关任务。过去机器人需要一个月的练习才能达到100%的准确性,现在只用两天就能做到。”
不过他也指出,目前机器人执行的这些任务仍然是比较初级的,比如堆积木。但在未来,机器人有望通过正强化法完成更复杂和有意义的任务。


基于将 CLIP 用于下游few-shot图像分类的方案
“翼龙-2”无人机为中国的“新基建”事业保驾护航
网络视频监控业务分析及市场发展研究报告
光电龙头三安光电上半年:营收64亿,净利润仅1.7亿元
一文看懂汽车半导体芯片的发展概况
如何训练机器人学习新技能
SV-2401VP/SV-2403VP系列网络音频模块
3D打印技术重新定义光学领域的未来
劲霸458系列电磁炉故障与维修
Python哪种方式循环最快呢?
深交委出台首个共享单车新规 禁止低价倾销
三星宣布业界首个3nm级制造技术开始大量生产
积塔半导体12英寸汽车芯片先导线已建成通线
KUKAC2机器人程序备份更改路径
基于DLTAP713SC的智能宠物项圈:433遥控与RGB灯光的融合
示波器触发是什么_示波器触发的作用
51单片机教程(从原理开始基于汇编)
EN系列:保持低导通电阻与开关速度,改善噪声性能
小米8评测 整体表现还是比较令人满意的
哪款蓝牙耳机降噪效果好?降噪效果好的蓝牙耳机排行榜