摘要
本发明涉及金融文本核查领域,具体涉及一种基于大模型的金融知识库构建方法与系统,包括文本转化,获得带有修正术语的第一语义单元和确定的第二语义单元,建立以所述第一语义单元为输入的场景-隐意双层修正模型,输出获得语义确定的第一语义单元以及场景标签,确定唯一定义;存在有待修正术语的所述第一语义单元中的术语于场景定义映射库无定义,建立目标词映射,基于语义相似度映射至显式语义;将各语义单元根据原始文本位置合并。本发明通过为多义术语绑定唯一定义,对场景定义映射库中无定义的隐意术语,通过语义相似度与共现频率分析实现显式化,有效消除金融语义的歧义与隐意解读难题,避免因语义混淆导致的知识库数据偏差甚至错误。