摘要
本申请实施例提供了一种视频背景物体识别方法和装置、电子设备及存储介质,属于图像处理和人工智能技术领域。该方法包括:获取包含背景图像的当前视频流数据;基于当前视频流数据,对背景图像进行物体识别,得到视频模态物体类别数据;对当前视频流数据进行视频抽帧,得到视频帧数据;对视频帧数据进行进行图像分割,得到图像模态物体类别数据;基于视频帧数据,对背景图像进行文本描述,得到背景描述文本;对背景描述文本进行命名实体识别,得到文本模态物体类别数据;基于视频模态物体类别数据、图像模态物体类别数据及文本模态物体类别数据,对当前视频流数据进行背景物体类别识别。本申请实施例能够提高视频背景物体的识别准确率。