摘要
本发明提出一种基于目标检测与强化学习的海底电缆巡检方法,包括以下步骤;步骤一、搭建海底电缆巡检仿真平台,对海底环境、电缆模型和自主水下机器人AUV模型进行建模;步骤二、将海底电缆巡检任务建模为马尔可夫决策过程,采用SAC算法框架,设计动作空间与奖励函数,并融合海底电缆巡检跟踪算法的目标检测算法设计状态空间;步骤三、在仿真平台进行深度强化学习模型的算法训练和验证,使AUV学习巡检策略;本发明通过搭建海底仿真环境进行控制算法的训练与验证,从而降低自主水下机器人训练成本,减少潜在风险,并加速算法的优化过程,为实地实验做好前期准备,使得AUV能够在训练所得模型的控制下,在深海区域进行稳定且高效的海底电缆巡检跟踪任务。