一种基于负载感知的GPU算力资源调度方法、设备及介质
申请号:CN202510673986
申请日期:2025-05-23
公开号:CN120653430A
公开日期:2025-09-16
类型:发明专利
摘要
本申请公开了一种基于负载感知的GPU算力资源调度方法、设备及介质,算力调度涉及技术领域。方法包括:根据GPU的显存容量和计算核心数量,将显存容量划分为多个连续片段,将计算核心划分为多个逻辑计算组,得到子资源单元;实时记录子资源单元的占用状态和负载指标,得到资源池;对用户提交的作业解析,采集作业运行时内核函数的执行周期、显存访问模式和指令流水线阻塞率;基于强化学习算法,根据负载指纹模型预测作业的资源需求拐点,基于虚拟化隔离与多维资源量化评估,对子资源单元分层调度,生成子资源单元的抢占式分配策略。本申请通过上述方法通过动态粒度切分、负载感知调度与硬件级安全隔离的协同设计,实现了GPU资源的高效利用与安全共享。
技术关键词
资源调度方法
指令流水线
强化学习算法
指纹模型
调度系统
核心
计算机可执行指令
策略
内核
拓扑图
资源调度设备
周期
蚁群优化算法
逻辑
异构
集群
分层
模式