一种基于负载感知的GPU算力资源调度方法、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于负载感知的GPU算力资源调度方法、设备及介质
申请号:CN202510673986
申请日期:2025-05-23
公开号:CN120653430A
公开日期:2025-09-16
类型:发明专利
摘要
本申请公开了一种基于负载感知的GPU算力资源调度方法、设备及介质,算力调度涉及技术领域。方法包括:根据GPU的显存容量和计算核心数量,将显存容量划分为多个连续片段,将计算核心划分为多个逻辑计算组,得到子资源单元;实时记录子资源单元的占用状态和负载指标,得到资源池;对用户提交的作业解析,采集作业运行时内核函数的执行周期、显存访问模式和指令流水线阻塞率;基于强化学习算法,根据负载指纹模型预测作业的资源需求拐点,基于虚拟化隔离与多维资源量化评估,对子资源单元分层调度,生成子资源单元的抢占式分配策略。本申请通过上述方法通过动态粒度切分、负载感知调度与硬件级安全隔离的协同设计,实现了GPU资源的高效利用与安全共享。
技术关键词
资源调度方法 指令流水线 强化学习算法 指纹模型 调度系统 核心 计算机可执行指令 策略 内核 拓扑图 资源调度设备 周期 蚁群优化算法 逻辑 异构 集群 分层 模式
系统为您推荐了相关专利信息
抽水蓄能电站 智能调度方法 高斯混合模型聚类 抽蓄电站 智能进化算法
注意力模型 解码器 集装箱 语义特征 启发式规则
多智能体强化学习 决策系统 隐私保护模块 策略 数据访问控制
协同调度系统 控制方舱 语义标签 人机 语义向量
功率约束条件 网络资源调度方法 网络节点 随机森林模型 终端