防摔机器人实时适应具有挑战性的地形
机器人很难即兴发挥,遇到不寻常的表面或障碍物通常意味着突然停止或猛烈摔倒。但是研究人员已经为机器人运动创造了一种新模型,它可以实时适应遇到的任何地形,在遇到沙子、岩石、楼梯和其他突然变化时,它会迅速改变步态以保持卡车行驶。
虽然机器人运动可以是多才多艺和精确的,机器人可以“学习”爬楼梯、穿越破碎的地形等等,但这些行为更像是机器人在之间切换的个人训练技能。尽管像 Spot 这样著名的机器人可以从被推或踢中弹起,但该系统实际上只是在努力纠正身体异常,同时追求不变的步行策略。有一些自适应运动模型,但有些非常具体(例如这个基于真实昆虫运动的模型),而其他模型需要足够长的时间才能工作,以至于机器人在它们生效时肯定已经倒下。
该团队来自 Facebook AI、加州大学伯克利分校和卡内基梅隆大学,称之为快速运动适应。它来自这样一个事实,即人类和其他动物能够快速、有效和无意识地改变它们的行走方式以适应不同的环境。
“假设你学会走路,第一次去海滩。你的脚陷进去,要想把它拉出来,你必须用更大的力。感觉很奇怪,但走几步你就会像在坚硬的地面上一样自然地行走。这里面有什么秘密?”隶属于 Facebook AI 和加州大学伯克利分校的高级研究员 Jitendra Malik 问道。
当然,如果您以前从未遇到过海滩,但即使在以后遇到过海滩,您也不会进入某种特殊的“沙地模式”,让您可以在柔软的表面上行走。您改变动作的方式是自动发生的,无需真正了解外部环境。
“正在发生的事情是,您的身体通过感知这些条件对身体本身的不同后果来对不同的身体条件做出反应,”马利克解释说——而 RMA 系统以类似的方式工作。“当我们在新的条件下行走时,在很短的时间内,半秒或更短的时间内,我们已经进行了足够的测量,我们正在估计这些条件是什么,我们修改了步行策略。”
该系统完全在模拟中进行训练,在现实世界的虚拟版本中,机器人的小大脑(一切都在机载有限计算单元上本地运行)学会了以最小的能量最大化向前运动,并通过立即观察和响应来避免跌倒来自其(虚拟)关节、加速度计和其他物理传感器的数据。
为了强调 RMA 方法的整体内部性,Malik 指出机器人不使用任何视觉输入。但是没有视力的人和动物都可以走路,那么机器人为什么不能呢?但是由于无法估计“外部性”,例如它所行走的沙子或岩石的确切摩擦系数,因此它只是密切关注自己。
“我们不了解沙子,我们了解脚下沉,”共同作者,同样来自伯克利的 Ashish Kumar 说。
最终,该系统由两部分组成:一个主要的、始终运行的算法,实际控制机器人的步态,以及一个并行运行的自适应算法,用于监控机器人内部读数的变化。当检测到显著的变化,分析了他们-腿应该做这个,但他们在做这个,这意味着这种状况就像这样-并告诉主模型如何调整自己。从那时起,机器人只考虑如何在这些新条件下前进,有效地即兴制作专门的步态。
在模拟训练后,它在现实世界中取得了巨大成功,正如新闻稿所描述的那样:
机器人能够在沙子、泥泞、远足小径、高草和泥土堆上行走,在我们所有的试验中都没有失败。在 70% 的试验中,机器人成功地沿着远足径走下楼梯。尽管在训练期间从未看到不稳定或下沉的地面、障碍性植被或楼梯,但它在 80% 的试验中成功地通过了水泥桩和鹅卵石堆。当它以相当于其体重 100% 的 12 公斤有效载荷移动时,它也能以很高的成功率保持高度。
您可以在此处的视频中或(非常简短地)在上面的 gif 中看到许多此类情况的示例。
马利克对纽约大学教授凯伦阿道夫的研究表示赞同,他的工作表明人类学习走路的过程是多么的灵活和自由。团队的直觉是,如果你想要一个可以处理任何情况的机器人,它必须从头开始学习适应,而不是有多种模式可供选择。
正如您无法通过详尽地标记和记录每个对象和交互(总会有更多)来构建更智能的计算机视觉系统一样,您也无法为具有 10、100 甚至数以千计的特殊参数,用于在砾石、泥土、瓦砾、湿木头等上行走。就此而言,除了向前运动的一般概念之外,您甚至可能根本不想指定任何内容。
Kumar 说:“我们没有预先编程它对腿的想法,或者任何关于机器人形态的东西。”
这意味着该系统的基础——不是经过充分训练的系统,它最终将自己塑造成四足步态——不仅可以应用于其他有腿的机器人,还可以应用于人工智能和机器人技术的完全不同的领域。
“机器人的腿类似于手的手指;腿与环境相互作用的方式,手指与物体相互作用的方式,”卡内基梅隆大学的合著者迪帕克·帕塔克指出。“基本思想可以应用于任何机器人。”
更进一步,马利克建议,基本算法和自适应算法的配对可以适用于其他智能系统。智能家居和市政系统往往依赖于预先存在的政策,但如果它们即时适应呢?
目前,该团队只是在机器人:科学与系统会议上的一篇论文中展示了他们的初步发现,并承认还有大量的后续研究要做。例如,建立一个内部即兴步态库作为一种“中期”记忆,或使用视觉来预测启动新运动方式的必要性。但 RMA 方法似乎是应对机器人技术持久挑战的一种很有前途的新方法。