基于NLP处理的文本可读性分析方法、系统及电子设备
申请号:CN202511292497
申请日期:2025-09-11
公开号:CN120805849A
公开日期:2025-10-17
类型:发明专利
摘要
本申请公开了一种基于NLP处理的文本可读性分析方法、系统及电子设备,该方法通过提取多个人物角色实体;将预处理后的待分析文本进行分词处理,得到词语序列,并构建依存句法树;基于多个人物角色实体、预处理后的待分析文本和依存句法树,提取角色数量特征、角色性格多样性熵特征、冲突密度特征、对话占比特征、关系密度特征以及关系复杂度特征;将角色数量特征、角色性格多样性熵特征、冲突密度特征、对话占比特征、关系密度特征以及关系复杂度特征进行特征处理和融合,得到融合后的特征向量;将融合后的特征向量输入编码器中,得到初步评分向量;根据初步评分向量,确定待分析文本的可读性评分。本申请能够提高文本可读性分析的准确度。
技术关键词
复杂度特征
依存句法树
分析方法
文本可读性分析
密度
实体
关系抽取模型
词语
计算机可执行指令
编码器
特征提取单元
三元组
电子设备
可读存储介质
数据处理单元
分词
序列
处理器