摘要
本发明公开了基于大模型交互的长文本敏感数据治理方法及系统,属于数据治理及大模型技术领域,本发明要解决的技术问题为如何实现脱敏规则与脱敏带代码的解耦以及识别出长文本中敏感数据,采用的技术方案为:在本地部署nifi数据同步工具和大语言模型或集成nifi数据同步工具和大语言模型的平台,基于nifi数据同步工具实现整体脱敏流程的编排与运行,基于大语言模型实现长文本数据的敏感数据识别,基于nifi数据同步工具自定义nifi处理器,并在nifi数据同步工具的流程编排界面编写数据脱敏流程,具体如下:数据输入;集成敏感信息;识别敏感数据;脱敏敏感数据;数据输出:将脱敏后的数据输出到指定数据库,配置输出数据库的相关信息。