伯克利人工智能实验室带来了一项新的机器人科研成果.doc
《伯克利人工智能实验室带来了一项新的机器人科研成果.doc》由会员分享,可在线阅读,更多相关《伯克利人工智能实验室带来了一项新的机器人科研成果.doc(6页珍藏版)》请在三一文库上搜索。
1、伯克利人工智能实验室带来了一项新的机器人科研成果摘要:前几天我们刚刚介绍了加州大学伯克利分校PieterAbbeel教授领导伯克利机器人学习实验室(UCBerkeleysRobotLearningLab)开发的会叠衣服的家务向机器人BLUE,今天伯克利人工智能实验室(BAIR)这边也带来了一项新的机器人科研成果教会机器人使用工具完成任务。这篇论文的作者之一是知名青年机器学习研究员、谷歌大脑研究科学家ChelseaFinn,她目前正在BAIR做博士后。AI科技评论把论文成果的介绍博客编译如下。一个有难度的目标:学习使用工具在许多动物身上,使用工具的能力都来自于观察学习和动手尝试两者的共同作用。比
2、如,大猩猩可以通过观察自己已经掌握了技能的同伴学会如何用树枝从白蚁窝里“钓”白蚁吃,人类也观察到卷尾猴能够把树枝作为扫和拨的工具,把较远的食物弄到他们身边。有人也许会提出这只不过是猴子们依葫芦画瓢,但这篇论文的作者们认为使用工具的能力显然体现了更为高级的智慧。大猩猩钓白蚁在这项新研究中作者们探索的问题是:我们能否让机器人也拥有相似的使用工具的能力通过观察和自己动手实验学会使用工具。在执行复杂的多物体控制任务时,有一项必须的要素是理解物理层面的因果关系,所以预测不同的物体之间会如何相互作用就非常关键。在之前的视觉深度强化学习研究中,作者们已经探究了如何在机器人与世界的无监督交互过程中学习包含因果
3、关系的视觉预测模型。在学习到这样的模型之后,机器人就可以开始规划并完成一系列简单的任务,包括叠衣服、整理物品。不过,如果考虑到使用工具的任务中更为复杂的物理交互,比如用扫帚把尘土扫进簸箕里,非指向性的动手实验就不够了。因此,考虑到动物们是如何学习的,作者们设计了一个新的算法,它可以让机器人通过类似的模仿、互动的范式学习如何使用工具。具体来说作者们展示了,借助一组演示数据以及无监督的动手实验,机器人可以学会把新的物体作为工具使用,甚至可以在传统工具缺失的情况下灵活使用现有的工具完成任务。更进一步地,根据任务要求的不同,作者们的方法还让机器人有能力决定是否使用当前给定的工具。作者们提出的方法让机器
4、人有能力学习如何把不同的物体当作工具以完成用户给定的任务(第一行图中用黄色箭头标出)。任务中并没有指定机器人必须使用给定的工具,但机器人决定使用它们。在指导中学习视觉预测从演示中学习首先,作者们需要使用一个演示动作数据集,其中展示了各种不同的工具是如何使用的。由于最终的目标是希望学习到一个具有多种多样的工具使用能力的模型,作者们采集的演示动作数据也就包含了多种不同的工具和多种不同的任务。对于每一个演示,作者们都让机器人自己的摄像头录制了图像序列和动作指令。几个引导运动的例子通过这些数据,作者们得到了一个模型,它可以提出把当前场景内存在的物体作为工具的运动序列。并且,为了能够从演示中捕捉更为丰富
5、的行为,这个模型的输出形式是不同动作序列的分布。为视觉预测模型的学习收集无监督数据由于作者们希望机器人的行为不要局限于演示数据中出现的那些动作,并最终泛化到新的物体和新的情境中,他们就还需要很多不同的数据。最理想的来源当然是由机器人自己采集,而且是通过大规模可拓展的方式。比如,作者们希望机器人能够理解抓取姿态不好之类的小错误对后续的动作会有什么影响,所以他们就让机器人从现有的经验基础上继续动手实验、继续收集更多的数据。具体来说,论文作者们设计了两种不同的数据自动采集方式:一种方式是执行随机的动作序列,另一种是从上一节中提到的动作序列提出模型中采样。后一种方式中,机器人可以把工具拿起来然后在空间
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 伯克利 人工智能 实验室 带来 一项 机器人 科研成果
链接地址:https://www.31doc.com/p-3377194.html