长文本的标签分类方法、装置、设备、存储介质及产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
长文本的标签分类方法、装置、设备、存储介质及产品
申请号:CN202411940628
申请日期:2024-12-26
公开号:CN119782531A
公开日期:2025-04-08
类型:发明专利
摘要
本申请公开了一种长文本的标签分类方法、装置、设备、存储介质及产品,涉及计算机技术领域,公开了长文本的标签分类方法,包括:获取待分类文本;基于所述待分类文本,通过预设的大语言模型进行标签分类处理,得到标签分类结果。本申请中大语言模型通过位置编码将待分类文本转换为文本序列向量,再利用多头自注意力机制并行计算文本序列向量间的相关性,也即大语言模型能够并行处理文本序列向量,以此提高大语言模型的显存利用率,而显存利用率的提高能够实现大语言模型处理更多字符的长文本,也即大语言模型无需对长文本进行分割,从而避免分割所导致的语义丢失,进而提高长文本的标签分类准确性。
技术关键词
标签分类方法 文本 大语言模型 注意力机制 梯度下降算法 矩阵 误差 计算机程序产品 字符 信息编码 语义 序列 更新模型参数 分类设备 分段 特征值 处理器
系统为您推荐了相关专利信息
自然语言推理 ASR系统 意图分类方法 文本 时间序列模型
复发预测模型 补丁 复发预测方法 胃癌 交叉注意力机制
排序模型 样本 对象 排序方法 多媒体
无监督分类方法 无人机 语义知识图谱 多角度 元素
代表 企业 指令 文本 语音特征