速通足式机器人运动控制locomotion(一)大纲&动力学建模
Published:
适合非控制背景的做RL locomotion的同学进行考古,也适合做优化控制的同学进军 learning based。这是一系列综述类但充满细节和直觉的文章。
什么是Locomotion?
Locomotion以笔者的视角看,是机器人能按照一定要求,从一个状态变换到另一个状态的能力。要求可以包括能耗、用时、无碰撞等。最典型的任务是让机体跟踪实时给出的速度指令,或者跟踪一条预先规划好的轨迹。
全文纲要
经典Model-Based方法
- 动力学建模:从完整全身动力学逐步化简至倒立摆
- 正逆运动学:关节空间与任务空间的转换
- 足端规划:步态生成方法
- 经典控制算法:
- ZMP(零力矩点):简单有效且直观
- HZD(混合零动态):自然优雅的几何川峰之作
- MPC/TO:大力出奇迹啥都能塞的优化算法
- WBC(全身控制):处理不同优先级任务
Learning-Based方法革命
以MDP为模型、RL为求解手段的数据驱动控制以摧枯拉朽之势占据了应用的前沿:
- 强化学习与最优控制的关系
- 主流RL算法:PPO、Actor-Critic系列、Q系列
- 仿真器与Sim2Real Gap
前沿Locomotion方案
- RL范式:非对称AC、教师-学生蒸馏、表示学习
- 模仿学习:IRL、Behavior Cloning、GAIL/AMP
- 大模型时代:VLN/VLA、Transformer预训练
- 概率生成模型:Diffusion Policy、Flow Matching
动力学建模详解
WBDM 完整动力学
使用完整的非线性动力学描述,采用拉格朗日法: \(M(q)\ddot{q} + C(q,\dot{q}) + G(q) = \tau\)
其中 $q$ 是广义坐标,$M$ 是质量和惯量矩阵,$C$ 是离心力和科氏力项,$G$ 是重力项,$\tau$ 是关节输入。
CoMDM 质心动力学模型
将机器人的所有质量和惯量向质心折算,只考虑地面反向接触力对折算后的刚体的影响。
SRBDM 单刚体动力学
认为身体的惯量保持不变,仅关注机体(浮动基体)的位姿,将腿部关节的状态移除。
LIPM/SLIP 倒立摆模型
- 线性倒立摆:质心高度不变,在平衡点附近线性化
- 弹簧线性倒立摆:将腿部建立为二阶弹簧阻尼系统
这篇文章为读者提供了足式机器人控制领域的全面概览,从经典的模型驱动方法到前沿的学习驱动方法,为不同背景的研究者搭建了知识桥梁。
