一种融合多肽理化性质、序列特征及词向量嵌入的多肽免疫活性预测和生成方法
申请号:CN202411079363
申请日期:2024-08-07
公开号:CN119068997A
公开日期:2024-12-03
类型:发明专利
摘要
本发明提供了一种融合多肽理化性质、序列特征及词向量嵌入的多肽免疫活性预测和生成方法,属于生物信息学领域。本发明考虑了多肽在不同方面的可利用的特征,将多肽的理化信息、词向量嵌入信息以及多肽序列特征融合在一起,增加了多肽特征提取的有效性。而且本发明利用ResNet网络模型对多肽序列及词向量嵌入和理化性质特征建模,有效地学习了多肽的多方面特征,采用多特征权重特征融合的方式得到预测结果,因此预测和生成模型都具较好的效果。本发明使用不同的策略获得多肽的特征表示,并分别进行特征提取,包含了多肽序列信息和理化性质,序列中局部关键信息和整体依赖关系,更好地提高了多肽免疫活性预测的准确率以及生成具有免疫活性的多肽。
技术关键词
序列特征
融合多肽
ResNet网络
特征描述符
权重特征融合
编码生成方法
存储单元
预训练模型
数据
随机噪声
网络架构
代表
样本
特征提取模块