摘要
一种绳驱柔性臂的末端位置控制方法,在数据采集阶段,同步获取柔性臂末端位置坐标与舵机转动值,形成训练数据集;在动力学模型训练阶段,基于数据集训练BP神经网络,预测末端位置;在强化学习智能体训练阶段,利用动力学模型预测和强化学习算法训练包含Actor和Critic网络的智能体,通过LSTM网络增强时间序列处理能力,实现最优控制动作学习。本方法突破了传统控制策略局限,避免了对理想化假设的依赖,无需复杂建模,直接数据驱动,具有强大的泛化性和适应性。实时决策与精确控制能力使其在末端负载变化下仍保持高效,降低了计算复杂度,提升了系统响应速度。适用于非结构化复杂环境,有效处理参数不确定性和未知交互,显著提高控制效果。