波士頓動力人工智能研究所的最新方法——結合采樣與學習的動態全身操作中,波士頓動力的機器狗Spot最快僅用3.7秒就能搬起輪胎。
搬運的輪胎重達15公斤,相當于Spot自身重量的一半(32.7千克),并遠超其最大臂力。
而且,搬起輪胎后,它還能將輪胎滾動到指定位置。
甚至還能把一個輪胎疊到另一個輪胎上面(還會用頭幫忙頂一下)。
這一方法克服了傳統操作策略(如搖操)在不同機器人形態學結構上的遷移限制,并通過分層控制實現了機器狗四肢與全身的協調動力學操作。
網友表示,狗子快去回收站去搬輪胎吧!
這是怎么做到的?
結合采樣與學習的動態全身操作
總的來說,結合采樣與學習的動態全身操作(Combining Sampling and Learning for Dynamic Whole-Body Manipulation)利用強化學習與基于采樣的控制(sampling-based control)相結合的方法,使機器人能夠執行需要手臂、雙腿和軀干協同配合的動態力交互任務。
為應對復雜的操作任務,研究采用了分層控制(hierarchical control)方法,將控制問題劃分為兩個互補且同步的層級。
在低層,基于強化學習的運動策略直接控制電機力矩,以實現平衡、穩定性與運動執行。
高層控制則根據任務類型而有所不同:
對于輪胎扶正、拖拽與堆疊等任務,系統采用基于采樣的控制,通過模擬潛在的未來情境來發現最優操作策略。
對于輪胎滾動任務,則使用強化學習來捕捉維持物體穩定運動所需的細微動力學特征與反應性控制機制。
所有的高層方法,最終都會輸出包括底盤速度、姿態參數(包括滾轉、俯仰、高度 )、腿部控制以及手臂動作等指令。
在采樣控制中,采樣控制器通過并行模擬多個未來情境,尋找最有效的操作策略,從而選擇最能實現任務目標的動作。
對于那些需要精確施力和多接觸協調的任務,系統會運行32個并行CPU線程,每個線程使用MuJoCo模擬未來幾秒內的不同動作序列。