摘要
本申请公开了一种基于类脑机制的无人机控制系统参数整定方法及装置,涉及无人机飞行控制领域,该方法包括:建立无人机仿真模型和PID控制器;给定控制期望,获取初始状态s;将初始状态s输入至预先训练好的策略网络,一组动作空间A,将控制参数载入PID控制器,更新PID控制器的参数;根据控制期望生成控制指令,并下发给无人机仿真模型,执行一个步长的动作,产生新的飞行状态数据s';计算奖励值r;将元组s,A,r,s'存入经验回放池,更新策略网络和价值网络的参数;将新状态s'作为下一时间步的当前状态s,重复上述步骤,直至达到系统设定的终止条件。本申请能够使复杂的无人机控制系统获得更精确的控制器参数。