摘要
本发明涉及一种双足机器人复杂地形自适应步态规划方法及双足机器人,属于机器人技术领域,包括步骤:构建分数阶PID控制器,该分数阶PID控制器包括多传感器网络模块、自适应模块和分数阶微积分控制模块;构建用于双足机器人步态规划的强化学习模型,设置强化学习的状态、动作、决策以及强化学习奖励函数,并使用策略梯度方法对强化学习模型进行持续的迭代与优化调整,更新策略参数,输出双足机器人的控制参数;通过综合损失函数对分数阶PID控制器和强化学习模型输出的控制参数进行决策融合,得到全局最优的双足机器人控制参数。本发明能够为双足机器人在复杂地形中提供更加准确的步态规划,达到更好的行走灵活性和适应性。