Google新开发一款AI系统,它可以“教”机器人模仿狗狗的动作

 智能工业机器人     |      2020-04-07 14:06

导读:本周发表的一篇预印论文和博客文章显示,谷歌研究人员开发了一个人工智能系统,可以学习和模拟动物的运动,给机器人更多的灵活性。该论文的合著者认为,他们的方法可以促进机器人的

本周发表的一篇预印论文和博客文章显示,谷歌研究人员开发了一个人工智能系统,可以学习和模拟动物的运动,给机器人更多的灵活性。该论文的合著者认为,他们的方法可以促进机器人的发展,从而使机器人能够完成一些生活中需要更高灵活性的任务,例如在多层仓库和履行中心之间运输材料。

该团队的框架使用动物(在本例中是狗)的动作捕捉片段,并使用强化学习(一种奖励和刺激软件代理完成目标的训练技术)来训练控制策略。

研究人员表示,该系统提供了不同的参考动作,使他们能够“教”一个四条腿的Unitree-Laikago机器人执行一系列行为,从快速行走(最高每小时2.6英里)到跳跃和转弯。

为了测试他们的方法,研究人员首先汇编了一组狗表演各种技能的真实数据集。(训练主要在物理模拟中进行,以便能够密切跟踪参考运动的姿态)。然后,通过在奖励函数中使用不同的动作(描述演员的行为),研究人员用大约2亿个样本训练了一个模拟机器人来模拟运动技能。

但是模拟器通常只能提供真实世界的粗略近似值。为了解决这个问题,研究人员采用了一种自适应技术,使模拟中的动力学随机化,例如改变物理量,例如机器人的质量和摩擦力。使用编码器将这些值映射到数字表示(即编码),该编码器作为输入传递给机器人控制策略。当该策略被应用到实际的机器人上时,研究人员移除了编码器,直接搜索一组变量,使机器人能够成功执行其技能。

该团队表示,他们可以在大约50个实验中使用不到8分钟的真实数据来使策略适应实际情况。此外,他们还展示了真正的机器人学会模仿狗的各种动作,包括踱步和小跑,以及艺术家动画的关键帧动作,如动态跳跃和转身。

“我们已经证明,通过使用参考运动数据,基于学习的方法可以自动合成控制器,以实现腿式机器人的各种行为。”这篇论文的合著者写道。“通过将有效的领域自适应样本技术集成到训练过程中,我们的系统可以在仿真中学习自适应策略,然后将其快速应用到实际部署中。”

然而,这种控制策略并不完美。由于算法和硬件的限制,它不能学习高度动态的行为(例如大的跳跃和运行),并且不像最好的手动设计的控制器那样稳定。(在五个场景中,每种方法进行了15次测试,真实世界的机器人在6秒钟后踱步时平均减少;5秒钟后向后小跑时,出现平均下降。旋转平均下降9秒)。作为回应,研究人员表示,他们将继续提高控制器的鲁棒性,并开发一个可以从视频剪辑等其他运动数据源中学习的框架。


  • 共2页:
  • 上一页
  • 1
  • 2
  • 下一页