一种基于深度学习的ncRNA与蛋白质相互作用的预测方法
申请号:CN202411931046
申请日期:2024-12-26
公开号:CN119763670A
公开日期:2025-04-04
类型:发明专利
摘要
本发明公开了一种基于深度学习模型对于ncRNA与蛋白质相互作用的预测方法,使用的是公共数据库四个数据集(RPI488,NPInter2.0,RPI1807,RPI7317),kmer编码策略对ncRNA和蛋白质的序列进行提取高维稀疏特征后,通过Embedding层将稀疏特征映射为低维稠密向量;使用ResNet结合SE注意力机制提取关键的局部特征;随后通过Transformer利用位置编码和多头注意力捕捉长程依赖并提取全局特征;最终,将ResNet和Transformer的特征与线性变换后的蛋白质特征拼接,并通过DNN层进一步提炼特征后使用Sigmoid激活函数输出分类概率。通过正则化等技术来防止模型过拟合,使用十折交叉验证以及独立测试集来对模型进行性能测试。该方法使用k‑mer进行特征编码,不需要生物学的先验知识,并且通过局部特征提取与全局特征建模相结合的方式,充分捕获序列中的关键信息,利用深度学习的计算方法提高了预测ncRNA与蛋白质相互作用的准确率。
技术关键词
稀疏特征
编码策略
深度学习模型
多头注意力机制
局部特征提取
正则化技术
上下文特征
序列特征
输出特征
融合特征
数据
计算方法
编码器
模块
模式
关系