摘要
本发明公开一种基于强化学习的化学粉末研磨机械臂的控制方法,属研磨机器人控制领域,包括:步骤1,建立研磨平台的研钵内表面模型及导纳控制模块,采集粉末信息;步骤2,构建对粉末研磨场景的启发式策略及奖励函数,执行启发式策略获得离线数据集;步骤3,用离线数据集经离线强化学习算法对强化学习模块的策略模型的策略网络初步训练;步骤4,将策略模型部署于机械臂控制器,由视觉反馈模块和导纳控制模块持续采集实时视觉及力矩反馈,用在线强化学习算法对策略网络增量更新优化策略;步骤5,导纳控制模块按优化的最优策略,生成研磨轨迹并驱动机械臂执行粉末研磨,达到视觉反馈目标停止。该方法能高效、自适应控制机械臂进行粉末研磨。