一种动态决策与优化方法、系统、装置、电子设备及介质
申请号:CN202510804051
申请日期:2025-06-17
公开号:CN120317472B
公开日期:2025-09-30
类型:发明专利
摘要
本申请实施例提供了一种动态决策与优化方法、系统、装置、电子设备及介质,涉及数据处理技术领域,技术方案包括:获取时序数据,其中包括:在连续多个时刻下标绘对象的位置数据、状态数据和所处环境数据。然后依据时序数据对标绘对象进行风险检测,获得风险检测结果。当风险检测结果表示第一风险等级,基于时序数据,通过第一强化学习模型确定对标绘对象或标绘对象所处环境的第一调整策略。当风险检测结果表示第二风险等级,基于时序数据,通过第二强化学习模型确定对标绘对象或标绘对象所处环境的第二调整策略,其中,第一风险等级低于第二风险等级,第一强化学习模型与第二强化学习模型的模型参数不同。提高了风险检测后获得调整策略的效率。
技术关键词
强化学习模型
规划行驶路线
风险
对象
时序
策略
蒙特卡洛模拟方法
运输车
长短期记忆网络
贝叶斯算法
插值算法
数据采集节点
因子
决策
曲线
标识
通信接口
电子设备