跨模态电力视频定位方法、系统、电子设备和存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
跨模态电力视频定位方法、系统、电子设备和存储介质
申请号:CN202411913811
申请日期:2024-12-24
公开号:CN119888563B
公开日期:2026-01-02
类型:发明专利
摘要
本发明涉及视频理解技术领域,具体公开一种跨模态电力视频定位方法、系统、电子设备和存储介质,包括:对每个样本电力视频依次进行视觉边界分割、语义边界分割与上下文动态聚合,得到每个样本电力视频对应的至少一个目标伪监督对;每个目标伪监督对包括:对应的样本电力视频、伪查询文本以及伪查询文本对应在样本电力视频中的起止时间;基于每个样本电力视频对应的目标伪监督对,对预设的跨模态电力视频定位模型进行训练,得到训练好的跨模态电力视频定位模型;将待测电力视频与查询文本输入训练好的跨模态电力视频定位模型,得到视频定位结果。本发明实现了稳健且高效的零样本跨模态电力异常行为定位,提高了跨模态电力视频定位的准确性和效率。
技术关键词
视频定位方法 电力 视觉 视频定位系统 关键帧 样本 跨模态 标签文本 语义 大语言模型 电子设备 可读存储介质 动态 理解技术 模块 处理器 计算机 多模态