等离子体位形控制代理策略模型构建方法、装置及介质

申请号：CN202511280083

申请日期：2025-09-09

公开号：CN120762290B

公开日期：2025-11-07

类型：发明专利

摘要

本发明公开了一种等离子体位形控制代理策略模型构建方法、装置及介质，通过构建托卡马克仿真环境，识别出PID控制器控制下失控场景的环境配置参数，得到配置的训练环境；采用强化学习代理模型进行学习，生成电流命令；基于托卡马克仿真环境中计算各时刻的控制点状态；将各时刻的控制点状态，电流命令与PID控制器得到的动作命令输入到奖励函数中，计算环境奖励；根据环境奖励、各时刻的控制点状态以及电流命令进行强化学习训练，更新命令策略；当强化学习代理模型符合收敛条件时，输出代理策略模型。本申请方案提供一种在非线性和复杂动态环境中应对瞬态较大扰动的能力的策略模型，保障托卡马克装置的稳定性和安全性。

技术关键词

强化学习代理模型构建方法仿真环境控制点命令 PID控制器模型构建装置电流参数托卡马克装置可读存储介质强化学习策略强化学习算法场景计算机误差模块