欢迎您进入某某淀粉企业有限公司

热门关键词:

一种教授机器人预先掌握操纵策略的算法

返回列表 来源: 浏览: 发布日期:2019-08-19 22:49【

杭州到上海动车,莽山蛇王,印度连体兄弟被奉

当人类伸出手去抓住一个特定的物体时,他们往往需要将杂波推开,以隔离它并确保有足够的空间来拾取它。即使人类并不总是完全意识到他们正在这样做,这种被称为 预抓操作 的策略允许他们更有效地掌握物体。

近年来,一些研究人员试图在机器人中重现人类操纵策略,但更少的研究集中于预抓操作。考虑到这一点,卡尔斯鲁厄理工学院的一个研究小组最近开发了一种算法,可用于训练机器人抓握和抓握前的操纵策略。这种新方法在arXiv上发表的一篇论文中提出。

虽然掌握是机器人技术中一项众所周知的任务,但有针对性的预掌操作仍然非常具有挑战性, 进行这项研究的研究人员之一Lars Berscheid告诉TechXplore。 这使得机器人目前很难从杂乱或狭小的空间中抓取物体。但是,随着最近机器和机器人学习的创新,机器人可以学习如何通过与环境相互作用来解决各种任务。 ,我们想要应用我们在之前的工作中提出的方法,不仅要抓住,还要抓住预先掌握的操作。

当机器人学习如何完成某项任务时,它基本上需要弄清楚如何通过最大化其奖励来解决问题。在他们的研究中,研究人员专注于从随机填充的垃圾箱中抓取物体的任务。

使用来自摄像机的输入和来自其夹具的反馈,对机器人进行了大约80小时的物体训练。当它成功地在其机器人抓手中抓住物体时,它获得了奖励。由Berscheid和他的同事开发的算法使机器人的训练更进一步,使其也可以用于预先掌握操作策略,例如移位或推动。

我们工作的关键思想是通过引入额外的换档或推动动作来扩大抓握动作, Berscheid解释说。 机器人可以决定在不同情况下应用什么动作。实际上训练机器人非常棘手:首先,它需要很长时间,所以训练本身需要自动化和自我监督,其次是很多意想不到的事情如果机器人探索其环境就会发生。与机器学习中的其他技术类似,机器人学习总是受到数据消耗的限制。换句话说,我们的工作与两个非常具有挑战性的研究问题相关:机器人如何能够像机器人一样快速学习可能 - 机器人可以利用发现的见解学习什么任务?

正如Berscheid继续解释的那样,如果机器人在每次执行动作后都收到直接反馈,那么机器人可以更有效地学习,因为这可以克服稀疏奖励的问题。换句话说,提供给机器人的反馈越多,它就越快,更有效地学习如何完成给定的任务。

这听起来很容易,但实施起来有时很棘手:例如,你如何定义预抓操作的质量? Berscheid说。

研究人员提出的方法是基于之前的一项研究,该研究调查了在特定行动之前和之后抓取概率的差异的使用,重点关注行动所在的小区域。在他们的新研究中,Berscheid和他的同事们也试图发现机器人应尽可能快地学习的动作。

这是机器人学习中众所周知的探索问题, Berscheid解释道。 我们定义了一种探索策略,既可以最大化自我信息,也可以最大限度地降低行动的不确定性,并且可以非常有效地进行计算。

研究人员提出的算法允许机器人学习抓取动作的最佳姿势,以及如何执行这些动作以增加成功抓取的概率。他们的方法使得一个特定的动作依赖于另一个,这最终消除了对稀疏奖励的需要并且使得能够更有效地学习。

研究人员将他们的算法应用于Franka机器人手臂,然后评估其在一项任务中的表现,该任务涉及从仓中拾取物体直到它完全为空。他们使用25,000种不同的抓握力和2,500次换挡动作训练系统。他们的研究结果非常有希望,机器人手臂成功地抓住并归档了它熟悉的物体以及之前从未遇到的其他物体。

本文地址:http://www.feizekeji.com/youxi/165524.html 转载请注明出处!