基于多模态大模型的传统媒体广告分离识别方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于多模态大模型的传统媒体广告分离识别方法
申请号:CN202510483820
申请日期:2025-04-16
公开号:CN120340545A
公开日期:2025-07-18
类型:发明专利
摘要
本发明公开了一种基于多模态大模型的传统媒体广告分离识别方法,包括S1:提取电视、广播中的广告音视频信号,并对其进行预处理;S2:从预处理后的音视频信号提取电视、广播的音频特征,通过特征提取及特征检索的方式从连续视频中找出最长相同片段的子集,并记录该时间点头尾;S3:利用过往人工经验数据搭建传统媒体广告知识库,运用大语言模型及增强检索的方式,判断片段是否为广告,并提取出广告的文本边界;S4:利用VAD静音检测及说话人同步的方式,修订广告开头结尾边界。本方法在电视、广播特征提取过程中,运用神经网络和注意力机制,有效解决了传统媒体音频时间跨度长的问题,能够更好地提取音频的时序特征,提高广告匹配的准确性。
技术关键词
音频特征 识别方法 多模态 VAD算法 文本 大语言模型 广告特征 电视 数据建立索引 时序特征 短时傅里叶变换 前馈神经网络 信号 对音视频 端点