2026-06-17
传统的人形机器人运动控制多依赖于模型预测控制(MPC)和全身控制(WBC),在面对未知扰动和非结构化地形时,往往需要人工编写大量的规则代码,且难以实现从仿真到现实(Sim2Real)的无缝迁移。
“DynamicWalk-V2”系统彻底摒弃了传统的规则驱动,采用深度强化学习算法,在物理仿真引擎中进行了超10亿次的步态训练。研发团队引入了“域随机化”与“教师-学生网络”架构,使得机器人能够在不依赖外部动捕设备的情况下,仅凭本体IMU和关节编码器数据,在碎石、斜坡、湿滑地面等复杂场景中保持动态平衡,甚至在遭受侧面500N瞬时冲击力时仍能迅速恢复姿态。
【智能新观察智库点评】
“小脑”的进化是具身智能走向通用的必经之路。此项技术的发布,标志着国内在运动控制算法层面已触及国际第一梯队。端到端强化学习不仅大幅降低了控制算法的开发周期,更为后续人形机器人执行高动态任务(如奔跑、跳跃、搬运重物)奠定了坚实的底层基础。