摘要
本申请公开了一种基于表结构相似度的宽表数据模型替换方法及相关装置。在执行本申请实施例提供的方法时,首先提取待替换存量数据模型的表结构信息并进行文本拼接生成详细的描述信息。同时对各个可替换宽表数据模型的表结构信息进行文本拼接形成各自的描述信息。然后对这些描述信息进行分词处理,生成分词序列。利用TF‑IDF余弦相似性算法,计算待替换存量数据模型与每个宽表数据模型之间的相似度,这些相似度值与宽表数据模型具有对应关系。最后根据筛选条件挑选出符合条件的相似度对应的宽表数据模型,作为后续数据模型替换的参考和指导。本申请不仅能够自动化地识别出最合适的宽表进行替换,还能提高整体的数据处理效率和准确性。