基于知识引导的无地图导航模型实现的导航方法、装置、机器人及存储介质

申请号：CN202510028410

申请日期：2025-01-08

公开号：CN119779312B

公开日期：2025-07-25

类型：发明专利

摘要

本发明提供了一种基于知识引导的无地图导航模型实现的导航方法、装置、机器人及存储介质，该无地图导航模型是基于知识系统中的多条行动规则，对预先构建的DDPG算法模型进行训练得到的，相较于单一采用DDPG算法导航泛化性更强。在训练过程中，将引导动作指令与策略动作指令进行融合可以降低DDPG算法模型对动作选择的随机性，从而能够快速获取有价值的数据，提高学习效率，并且在奖励稀疏的环境，移动机器人可以在知识的引导下与环境交互，而不是随机的交互，避免陷入到局部最优，保证了在奖励稀疏环境中易收敛；以及将策略动作指令以及融合得到的综合动作指令均输入预设损失函数，降低了单一采用DDPG算法时对应损失函数的不确定性，从而使学习过程更稳定。

技术关键词

算法模型移动机器人指令数据导航方法地图策略参数代表强度可读存储介质导航装置处理器存储器计算机控制模块噪声