一种基于多模态融合的面试视频行为特征分析与排序方法

申请号：CN202511497401

申请日期：2025-10-20

公开号：CN120997744A

公开日期：2025-11-21

类型：发明专利

摘要

本发明公开了一种基于多模态融合的面试视频行为特征分析与排序方法，包括如下步骤：步骤S1、处理输入的面试视频数据，分别提取视觉模态特征、音频模态特征和文本模态特征；步骤S2、将提取的所述视觉模态特征、音频模态特征和文本模态特征输入至多模态融合网络模型；步骤S3、所述多模态融合网络模型根据输入的特征进行特征融合，再输出多个预设维度的行为特质评分；步骤S4、对所述多个预设维度的行为特质评分进行排序，获得排序结果。本发明可以实现多模态数据的标准化采集、全面特征提取及精准关联分析，最终输出可直接用于辅助决策的客观特征排序结果，提升在线面试数据处理的效率与精度。

技术关键词

排序方法排序损失训练神经网络模型视频文本分支特征提取器面部滑动窗口采样音频特征时序神经网络多模态特征融合混合损失函数人脸检测模型短时傅里叶变换 BERT模型