一种基于改进元学习的优化深度强化学习集群调度的方法

申请号：CN202510471169

申请日期：2025-04-15

公开号：CN120317335A

公开日期：2025-07-15

类型：发明专利

摘要

本发明公开了一种基于改进元学习的优化深度强化学习集群调度的方法，属于计算机集群调度技术领域。针对深度强化学习在调度任务中泛化能力不足和训练缓慢的问题，提出一种改进的元学习机制，通过引入扩散模型的数据生成模块和经验回放模块，对元学习的训练数据与经验利用方式进行改进。扩散模型的数据生成模块能够合成多样化的训练数据，显著增强元学习训练数据的泛化性；经验回放模块通过整合历史经验与生成的合成经验，改进元学习跨任务知识的提取效率。基于上述改进的元学习机制，深度强化学习智能体可在面对复杂动态的环境时更快速地实现参数初始化与策略微调，使调度策略具备更强的泛化能力和更高的训练效率，有效提升集群调度的整体性能。

技术关键词

深度强化学习回放模块参数调度算法数据集群调度技术缓冲池多层感知机样本网络梯度下降法序列噪声强度注意力机制令牌策略

系统为您推荐了相关专利信息

一种曲面构件地面拼装胎架的自动建模及深化方法

自动建模方法拼装胎架伸缩杆件地面胎架曲面

一种切割机火焰状态实时监测系统和方法

状态实时监测系统火焰切割机状态实时监测方法信号数据采集模块

烟草生产设备的异常运行监控方法、系统、介质及终端

设备运行数据物联网模型支持向量机分类监控方法高斯径向基函数

一种基于元学习的域泛化血压估计训练方法

血压估计模型信号特征特征提取模块传感血压估计方法

基于视觉检测技术实时监测负泊松比轮胎安全状态的方法

负泊松比视觉检测技术信号显示装置显示机构数据处理模块