用于人工智能模型的GPU资源动态调度方法及装置

申请号：CN202510136898

申请日期：2025-02-07

公开号：CN120066782A

公开日期：2025-05-30

类型：发明专利

摘要

本申请涉及一种用于人工智能模型的GPU资源动态调度方法及装置。该方法包括：通过任务感知机制，识别人工智能模型任务对GPU的资源需求；在所述人工智能模型任务的执行过程中，实时监测GPU负载情况；根据所述GPU负载情况确定GPU的资源需求以动态挂载GPU资源；通过所述GPU资源执行所述人工智能模型任务，得到输出结果；在满足GPU回收策略时，动态卸载所述GPU资源。本申请涉及的用于人工智能模型的GPU资源动态调度方法及装置，能够实现GPU资源的分时共享，显著提高了GPU利用率，降低了用户使用成本，同时支持多种自定义回收策略，增强了系统的灵活性和适用性。

技术关键词

人工智能模型 Kubernetes集群资源动态调度方法自定义资源动态调度装置策略工作流机制挂载模块监测模块控制器接口软件参数