摘要
本发明属于智能控制领域,具体说是基于增量式双Q学习的自适应模型预测控制方法,包括以下步骤:1)建立非完整约束差速移动机器人的运动学模型,结合其运动学模型构建轨迹跟踪误差模型;2)基于轨迹跟踪误差模型,构建移动机器人轨迹跟踪模型预测控制器的预测模型,并依据该预测模型实现高性能轨迹跟踪控制;3)对双Q学习智能体的动作空间、状态空间进行增量式的离散化操作;4)通过智能体与环境之间的实时交互和在线迭代学习,来不断地优化双Q学习智能体的状态和动作空间,通过得到在线自适应MPC控制器,来实现移动机器人的高精度自主轨迹跟踪控制。本发明利用增量式双重Q学习算法对MPC的权重矩阵进行在线优化,根据系统状态实时调整MPC权重矩阵,以优化总奖励。