摘要
本发明公开了基于动态掩码和深度强化学习的特征加工工步排序方法,包括步骤1、构建特征工步排序深度强化学习模型;步骤2、构造输入向量的输入模式;步骤3、搭建Actor行动家网络和Critic评论家网络;步骤4、确定动态掩码:不满足几何前置特征、工艺前置特征、工艺链工步等加工约束条件的特征工步动态掩码赋予设定极大值;步骤5、确定局部耗费:考虑夹具更换、刀具更换、刀轨空行程的特征工步耗费;步骤6、确定特征工步排序深度强化学习模型;步骤7、模型训练;步骤8、特征加工工步排序。本发明能在可接受计算时间内实现满足加工约束的特征工步排序结果优化,从而缩短计算时间和提高加工效率。