如何训练机器人学习新技能

10月27日消息，据外媒报道，约翰斯霍普金斯大学博士生安德鲁洪特（andrew hundt）近日发布一篇新论文，指出应通过正强化法训练机器人学习新技能。
这篇论文的核心思想是，在训练机器人的过程中，应采用正强化法，即相比于在它做错时进行惩罚，更应在它做对时进行激励。而对于机器人来说，这种激励机制是以评分系统的形式呈现的，类似玩游戏一样，根据执行任务的情况获得积分。
安德鲁表示，这种方法能够大大缩短训练机器人执行任务的时间。“机器人希望能得到更高的分数，所以它们很快就可以完成相关任务。过去机器人需要一个月的练习才能达到100%的准确性，现在只用两天就能做到。”
不过他也指出，目前机器人执行的这些任务仍然是比较初级的，比如堆积木。但在未来，机器人有望通过正强化法完成更复杂和有意义的任务。

基于将 CLIP 用于下游few-shot图像分类的方案
“翼龙-2”无人机为中国的“新基建”事业保驾护航
网络视频监控业务分析及市场发展研究报告
光电龙头三安光电上半年：营收64亿，净利润仅1.7亿元
一文看懂汽车半导体芯片的发展概况
如何训练机器人学习新技能
SV-2401VP/SV-2403VP系列网络音频模块
3D打印技术重新定义光学领域的未来
劲霸458系列电磁炉故障与维修
Python哪种方式循环最快呢？
深交委出台首个共享单车新规禁止低价倾销
三星宣布业界首个3nm级制造技术开始大量生产
积塔半导体12英寸汽车芯片先导线已建成通线
KUKAC2机器人程序备份更改路径
基于DLTAP713SC的智能宠物项圈：433遥控与RGB灯光的融合
示波器触发是什么_示波器触发的作用
51单片机教程(从原理开始基于汇编)
EN系列：保持低导通电阻与开关速度，改善噪声性能
小米8评测整体表现还是比较令人满意的
哪款蓝牙耳机降噪效果好？降噪效果好的蓝牙耳机排行榜