基于增量式双Q学习的自适应模型预测控制方法

申请号：CN202411375800

申请日期：2024-09-30

公开号：CN119148531B

公开日期：2025-12-09

类型：发明专利

摘要

本发明属于智能控制领域，具体说是基于增量式双Q学习的自适应模型预测控制方法，包括以下步骤：1）建立非完整约束差速移动机器人的运动学模型，结合其运动学模型构建轨迹跟踪误差模型；2）基于轨迹跟踪误差模型，构建移动机器人轨迹跟踪模型预测控制器的预测模型，并依据该预测模型实现高性能轨迹跟踪控制；3）对双Q学习智能体的动作空间、状态空间进行增量式的离散化操作；4）通过智能体与环境之间的实时交互和在线迭代学习，来不断地优化双Q学习智能体的状态和动作空间，通过得到在线自适应MPC控制器，来实现移动机器人的高精度自主轨迹跟踪控制。本发明利用增量式双重Q学习算法对MPC的权重矩阵进行在线优化，根据系统状态实时调整MPC权重矩阵，以优化总奖励。

技术关键词

模型预测控制方法移动机器人模型预测控制器误差模型轨迹跟踪控制在线矩阵 Q学习算法代表记忆加速度存储计算机程序贪婪策略控制误差