视频背景物体识别方法和装置、电子设备及存储介质

申请号：CN202411539948

申请日期：2024-10-29

公开号：CN119296006A

公开日期：2025-01-10

类型：发明专利

摘要

本申请实施例提供了一种视频背景物体识别方法和装置、电子设备及存储介质，属于图像处理和人工智能技术领域。该方法包括：获取包含背景图像的当前视频流数据；基于当前视频流数据，对背景图像进行物体识别，得到视频模态物体类别数据；对当前视频流数据进行视频抽帧，得到视频帧数据；对视频帧数据进行进行图像分割，得到图像模态物体类别数据；基于视频帧数据，对背景图像进行文本描述，得到背景描述文本；对背景描述文本进行命名实体识别，得到文本模态物体类别数据；基于视频模态物体类别数据、图像模态物体类别数据及文本模态物体类别数据，对当前视频流数据进行背景物体类别识别。本申请实施例能够提高视频背景物体的识别准确率。

技术关键词

视频帧物体识别方法视频背景视频流文本数据命名实体识别图像分割图像特征提取上下文语义理解实例分割物体识别装置序列电子设备全局特征提取局部特征提取注意力

系统为您推荐了相关专利信息

一种基于大模型的金融知识库构建方法与系统

知识库构建方法术语金融场景指纹定义

一种基于AI对话场景的媒体文件查询调取方法与系统

调取方法文本数据提取关键词查询意图编辑距离算法

一种多数据源数据处理方法、设备及存储介质

数据处理方法 Word2Vec模型文本特征向量图像特征向量样本

基于人工智能的保险产品个性化推荐系统

疾病诊断信息客户个性化推荐系统深度神经网络技术画像

一种印章识别方法、装置、设备、存储介质及产品

识别印章文本识别模型印章识别方法图像坐标