摘要
本发明公开了一种基于双分支网络预测转录因子结合位点的方法,包括:将DNA序列转换为K‑mer标记的序列;将K‑mer标记的序列依次输入至基于BERT架构的预训练模型、循环神经网络BiLSTM中、CNN模块中、双分支Dual‑Branch模块中,输出第二全局特征矩阵和第二局部特征矩阵;将第二全局特征矩阵和第二局部特征矩阵分别输入多层感知器中,输出转录因子结合位点的两个概率;将转录因子结合位点的两个概率整合,输出转录因子结合位点的预测结果。本发明可解释性强决策过程透明化、泛化能力强,对TFBS的预测任务准确率高且当数据量较少时,依旧能够保证良好性能,能够在某细胞系中训练之后预测另一细胞系中的转录因子。