基于文本信息的关键词分类方法、装置、设备及存储介质
申请号:CN202510227917
申请日期:2025-02-27
公开号:CN120067334A
公开日期:2025-05-30
类型:发明专利
摘要
本申请公开一种基于文本信息的关键词分类方法、装置、设备及存储介质,涉及计算机技术领域,该方法包括:获取原始文本信息,利用预设语言模型对至少一条文本进行评分,对至少一条文本进行择优筛选,得到一条或多条目标文本;利用预设模型计算一条或多条目标文本对应的至少一个嵌入向量,并将至少一个嵌入向量输入至文本处理算法进行语义相似度评估,得到至少一个关键词,以及每个关键词与目标文本之间的对应关系;通过聚类算法对至少一个关键词分类,生成关键词摘要和对一条或多条目标文本的分类结果。本方法通过嵌入向量计算词语间的语义相似度,更准确地捕捉文本间的细微语义差异,从而提取出与文本内容高度相关的关键词,提高准确性和相关性。
技术关键词
关键词分类方法
文本处理算法
语义
聚类算法
词语
生成关键词
关系
可读存储介质
摘要
存储计算机程序
排序算法
身份证号
分类装置
处理器
计算机设备
字符
冗余
模块