摘要
本发明公开了一种电力时序预测数据集构建方法及系统,所述方法包括获取电力负荷与天气数据,构成电力数据集并进行清洗对齐;同时获取能源、气象等多源公共时序数据;将两类数据统一格式化并归一化处理,提取时频特征并计算序列间相似度,筛选出与电力负荷显著相关的公共数据;采用动态采样加权方法为每条数据分配权重,设定采样频率,最终构建出用于大模型预训练与微调的异构电力时序数据集;本发明通过整合多源异构数据,构建统一的标准化数据格式,并基于时间戳对齐与多源数据融合,显著提高了数据的一致性和可用性,提升了数据融合效率与模型泛化能力。