摘要
本申请涉及基于人工智能算法的机器人自适应决策方法及系统。该方法包括:通过特征压缩编码算法对环境数据进行降维处理,得到压缩特征向量;采用模拟退火算法,构建退火策略空间,生成候选策略集合;基于该集合进行双层决策优化,其中全局探索层基于策略扰动生成探索策略,并基于探索策略通过环境交互获得即时奖励值,局部优化层基于热力学梯度规则更新Q值函数;通过更新后的Q值函数和即时奖励值调整模拟退火算法的温度参数,并通过策略选择与模型参数更新,输出最终执行策略。该方法通过多源数据融合、模拟退火与强化学习协同和动态温度调节等技术手段,显著提高了机器人决策策略的全局最优性和动态适应性,增强了在复杂环境下的鲁棒性。