一种视频理解的处理方法、装置、设备以及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种视频理解的处理方法、装置、设备以及存储介质
申请号:CN202510738183
申请日期:2025-06-04
公开号:CN120564105A
公开日期:2025-08-29
类型:发明专利
摘要
本申请提供一种视频理解的处理方法、装置、设备以及存储介质,属于视频理解的技术领域。所述方法包括获取目标视频和目标提问文本,并根据所述目标提问文本,生成视频段检索指示文本;将所述目标视频、目标提问文本和所述视频段检索指示文本输入所述粗粒度视频大语言模型,所述视频段检索指示文本用于指示所述粗粒度视频大语言模型在所述目标视频中提取与所述目标提问文本相关的关键片段;将所述粗粒度视频大语言模型输出的所述关键片段和所述目标提问文本输入所述细粒度视频大语言模型,所述细粒度视频大语言模型用于根据所述关键片段和所述目标提问文本输出最终回答。本申请旨在提高视频理解结果准确性。
技术关键词
大语言模型 文本 视频段 非易失性可读存储介质 样本 强化学习策略 视觉 处理器 存储器 标签 电子设备 模块
系统为您推荐了相关专利信息
人工智能AI模块 感兴趣 报告 参数 传感器
通道注意力机制 颜色 特征金字塔网络 深度学习模型 加权特征
融合特征 降维特征 信息推荐方法 模态特征 计算机可执行指令
分时电价优化 负荷 阶梯 序列 样本
命名实体识别方法 层级 代表 命名实体识别系统 跨模态