自适应敏感信息智能识别方法、装置、设备、存储介质及产品
申请号:CN202411657783
申请日期:2024-11-19
公开号:CN119599130A
公开日期:2025-03-11
类型:发明专利
摘要
本申请公开一种自适应敏感信息智能识别方法、装置、设备、存储介质及产品,涉及敏感信息检测技术领域,公开了自适应敏感信息智能识别方法、装置、设备、存储介质及产品,包括:对企业敏感信息流批数据进行分块处理,得到数据分块,并对数据分块进行特征提取与向量化处理,得到特征向量;基于企业敏感信息流批数据构建检索二叉树;基于检索二叉树和特征向量进行模糊检索,得到敏感实体特征集;对敏感实体特征集的特征向量分别进行特征向量检索和语义结构信息检索,分别得到各预设数量的相关上下文,并对各预设数量的相关上下文进行重排序,得到目标上下文;将目标上下文输入至大语言模型,得到企业敏感信息识别结果,实现对企业敏感信息准确识别。
技术关键词
信息智能识别方法
敏感信息识别
语义结构
初始聚类中心
实体
信息检索
节点
敏感信息检测技术
分块
企业
索引
大语言模型
计算机程序产品
智能识别设备
智能识别装置
邻域
数据处理模块
特征值