摘要
本发明公开了基于复合匹配的数据发现系统,具体包括:存储层:存储层主要负责存放各类数据集的数据以及保存算法的运行结果,模型层:模型层主要是各类复合匹配方案的具体实现模块,应用层:应用层以网页前端的形式将各类信息暴露给用户,为用户提供了不同方法的选择、算法参数的选择、数据集的选择以及计算结果的查询。本发明通过设计了一种匹配器组合方案(IWIU)以及基于机器学习的方法,用于提高数据发现的准确性和效率,相较于传统的静态权重分配方法,本方案能够更加准确地反映每个匹配器在不同阶段的表现,自动优化权重分配,提高了匹配的准确性和系统的效率,避免不准确的匹配器过多参与,从而提高了匹配的准确性和效率。