摘要
本发明涉及装箱翻箱技术领域,具体涉及一种用于集装箱翻箱的多解码器动态注意力模型,包括基于Transformer架构设计包含特征增强的多解码器动态注意力模型;基于贪婪基线的强化学习算法对多解码器动态注意力模型进行训练:输入一个贝位构造,通过特征增强器提取集装箱堆栈语义,形成包含栈间语义的贝位构造;使用已训练的所述多解码器动态注意力模型,预测输入贝位的翻箱操作序列,该方法设计了一个堆栈特征增强器来增强输入的贝位构造信息,帮助编码器捕获堆栈之间的关系,解码器动态注意力模型训练多个构建策略,以增加输出的多样性,在训练过程中,每个解码器学习不同的解模式,并通过散度损失进行正则化,以强制解码器输出不同的概率分布。