摘要
本发明提出了一种基于改进TD3算法的复飞操纵方法,属于航空航天技术领域;包括如下步骤:包括如下步骤:S1:搭建舰载机模型;S2:构建分段激活结构的神经网络模型,利用神经网络模型构建目标策略网络和策略网络,进一步得到改进的TD3强化学习算法;S3:对改进的TD3强化学习算法进行参数配置,从舰载机模型中选择参数来配置状态观测量、动作输出量和奖励函数;S4:设计基于改进的TD3强化学习算法的复飞操纵模型;S5:计算复飞区参数;S6:根据计算得到的复飞区参数,确定复飞决策方法。本发明能输出最优的升降舵舵偏指令,实现迎角保持,无需依赖复杂的预设控制律或大量人工调参,符合实际复飞操作的约束和要求。