基于词典的政企非结构化数据要素解析组件实现方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于词典的政企非结构化数据要素解析组件实现方法
申请号:CN202511249144
申请日期:2025-09-03
公开号:CN120745604A
公开日期:2025-10-03
类型:发明专利
摘要
本发明提供基于词典的政企非结构化数据要素解析组件实现方法,涉及数据处理技术领域,包括对非结构化数据分词,构建特征矩阵;在纵向建立字符前缀树,横向构建属性关联表,设置交叉引用指针及属性继承机制;将属性增强实体词划分为子词典分片,根据语义关联强度分配至多个要素解析通道并行处理;最后合并解析结果生成结构化数据要素集合。本发明提高了政企数据要素解析的准确性和效率。
技术关键词
词典 分片 生成结构化数据 节点 字符 哈希算法 指针 多维特征向量 通道 计算机程序指令 深度优先搜索算法 双向注意力机制 属性匹配 拓扑特征 语义依存分析 关系网络 矩阵 信息熵
系统为您推荐了相关专利信息
转码方法 语义 预训练模型 节点 模板
教学 实验室测试设备 钢筋桁架楼板 门式刚架 构件截面尺寸
节点 关键词 层级 文本 BERT模型
多模态数据融合 亲和力 分子 药物 序列特征
节点 卫星轨道参数 通信接口 星历信息 边缘计算方法