一种融合多模态信息的深度伪造视频检测方法及装置
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种融合多模态信息的深度伪造视频检测方法及装置
申请号:
CN202411489055
申请日期:
2024-10-24
公开号:
CN119251738B
公开日期:
2025-10-10
类型:
发明专利
摘要
本发明涉及一种融合多模态信息的深度伪造视频检测方法及装置,应用于视频检测技术领域。本发明采用了多头自注意力机制分别处理待检测视频的视频帧特征向量Xv和音频MEL频谱图的音频特征向量Xa,然后将所述待检测视频的视频帧特征向量Xv和所述音频MEL频谱图的音频特征向量Xa的两种模态特征进行加权融合,从而提升深度伪造视频检测方法的准确性与鲁棒性。多模态特征的融合能够充分利用不同模态信息的互补性,确保捕捉到更全面的特征,从而提升深度伪造视频检测的准确性与鲁棒性。
技术关键词
伪造视频检测方法
融合多模态信息
融合特征
视频帧
音频
高维特征向量
浮点型数据
计算机执行指令
注意力机制
多模态注意力
视频检测装置
特征加权融合
视频检测技术
交互注意力
多模态特征
图像块
处理器