基于文本引导的级联网络行人过街意图预测方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于文本引导的级联网络行人过街意图预测方法及系统
申请号:CN202511406677
申请日期:2025-09-29
公开号:CN120913180B
公开日期:2026-01-02
类型:发明专利
摘要
本发明提出了一种基于文本引导的级联网络行人过街意图预测方法及系统,涉及智能交通系统中的行人行为分析技术领域,该方法包括:使用车载摄像机采集道路视频,基于YOLO算法检测道路视频中的行人,提取具有连续帧的行人坐标序列;对行人坐标序列依次进行维度扩展和特征提取,获取与行人坐标序列对应的预测行人坐标;将行人坐标序列与预测行人坐标进行拼接,获取完整坐标序列特征;基于大语言模型生成的结构化提示词和行人过街视频,生成与结构化提示词对应的过街行为描述,将过街行为描述编码为行为描述特征;通过余弦相似度函数将完整坐标序列特征与行为描述特征进行特征对齐,获取行人意图预测结果。本申请有助于提升对行人动态意图的表达能力。
技术关键词
意图预测方法 坐标 序列特征 大语言模型 YOLO算法 车载摄像机 级联 输入解码器 文本特征向量 编码器 视频 分类策略 度函数 多层感知机 网络 视觉特征 预测系统