一种基于Bert的学术论文标题分级装置和方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于Bert的学术论文标题分级装置和方法
申请号:CN202511512415
申请日期:2025-10-22
公开号:CN120996032A
公开日期:2025-11-21
类型:发明专利
摘要
本发明涉及一种基于Bert的学术论文标题分级装置和方法,分级装置包括数据读取模块、特征融合模块、分级预测模块、动态上下文扩展模块和结构化标题树构建模块;其中,特征融合模块提取布局特征并归一化,然后将其线性投影后,复制到对应的标题文本块经分词后所有token对应的嵌入位置;最后将复制后的布局特征向量与对应token的文本嵌入向量在特征维度上拼接,并将拼接后的高维特征降维融合,输出融合多模态信息的嵌入向量;分级预测模块内置应用YARN算法分阶段训练后的分级模型,分级模型采用分阶段训练策略,为针对不同的目标上下文长度范围设定不同的旋转位置编码的基频参数和缩放因子。本发明分类准确率高,分类速度快。
技术关键词
融合多模态信息 文本 分级装置 分阶段 编码 动态上下文 数据读取模块 布局特征 因子 线性 序列 层级 扩展模块 页面宽度 页面高度 参数 电子设备