基于自适应多模态融合的具身智能机器人行为识别方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于自适应多模态融合的具身智能机器人行为识别方法
申请号:CN202511032220
申请日期:2025-07-25
公开号:CN120808036A
公开日期:2025-10-17
类型:发明专利
摘要
本发明提供一种基于自适应多模态融合的具身智能机器人行为识别方法,对输入视频由多模态特征提取模块进行特征提取分别得到RGB模态原始特征、光流模态原始特征和边缘模态原始特征;由跨模态自适应模块采用自注意力机制和交叉注意力机制实现不同模态特征的自适应对齐,得到对齐后的融合特征;得到时序编码后的特征;将时序编码后的特征通过全连接分类器预测得到行为类别;对多模态融合行为识别模型进行训练后得到训练后的模型;得到行为识别结果;本发明能够从不同维度更全面描述视频行为特征,能够实现多模态数据的有效融合与对齐,能够显著提升识别准确率,降低计算复杂度,并能够提高复杂环境下的鲁棒性。
技术关键词
智能机器人 多模态 特征提取器 识别方法 特征提取模块 时序 交叉注意力机制 边缘检测算法 输出特征 分类器 跨模态 模态特征 融合特征提取 图像 视频