摘要
本发明涉及一种基于强化学习技术的多机器人协同控制抓取方法,包括如下步骤:步骤1:建立统一坐标系下的多机器人控制数学模型,确定多个机器人的末端执行器的位姿以及待抓取物体的位姿;步骤2:使用贪心算法构建多机器人任务分配模型,为每个待抓取物体分配执行抓取任务的机器人;步骤3:构建强化学习网络,强化学习网络采用多智能体深度Q网络;步骤4:对强化学习网络进行训练,得到抓取控制模型;步骤5:利用抓取控制模型控制多机器人的协同抓取动作。本发明能够为每个机器人找到最优的动作策略,在抓取过程中快速、准确地做出决策,减少不必要的动作和时间浪费;多个机器人之间可以协同优化抓取策略,避免相互干扰和冲突,提高抓取效率。