摘要
本发明公开了一种基于数据挖掘的多源数据集成方法及系统,涉及数据管理技术领域,通过对前端数据源所上传的数据进行数据特征提取,并根据所提取到的数据特征对所上传的数据划分至不同的数据子集内,完成对各个数据子集内的数据优化后,通过贝叶斯网络模型确定不同数据子集内的数据之间所存在的数据关联关系,再利用数据之间的数据关联关系,对存在数据关联关系的数据构建对应的集成类数据库,利用不同层级的索引序列将存在数据关联关系的数据进行绑定关联,从而实现不同前端数据源所上传的数据的归类整理,使得数据的管理更加高效。