摘要
本发明提出基于数据特征的动态显存分配方法及系统,涉及数据存储技术领域,方法包括在GP U显存中预分配多个不同大小的显存块,形成三级显存池;实时获取模型输入的数据特征,建立多维特征向量;基于LSTM网络构建时序预测模型,通过输入连续多次推理的特征向量序列,预测显存需求值;根据预测的显存需求值及场景特征矩阵选择分级分配策略;构建显存依赖关系图,动态追踪显存块的最早释放时间,通过复用策略优化显存利用率;监控GPU显存状态指标;根据所述显存状态指标,触发显存优化策略;通过精准预测显存需求、合理分级分配、优化显存利用率及应对不同场景,解决深度学习模型推理中显存管理难题,提升显存使用效率与系统稳定性。