摘要
本发明公开了一种实验室试剂瓶位置动态调整和路径规划方法与系统。所述试剂瓶位置动态调整和路径规划方法包括建立实验室环境状态模型、构建并训练深度Q网络模型,然后采用训练好的深度Q网络模型进行机械臂的路径规划和动态优化等步骤。构建的深度Q网络模型设置奖励机制,引入经验回放机制,采用最短路径和/或最少操作次数作为目标,并采用目标网络和主网络分离的策略进行Q值更新,目标网络的参数每隔固定步数从主网络中更新一次;模型训练过程中,模拟机械臂的取放操作,并根据操作结果更新策略。本发明能够在实验室环境中快速适应试剂瓶位置变化、实验人员干预及机械臂突发故障等情况,实现路径规划的自适应优化。