基于几何与时序建模分层上下文对齐的三维语义场景补全方法、装置及介质
申请号:CN202510614868
申请日期:2025-05-14
公开号:CN120543989A
公开日期:2025-08-26
类型:发明专利
摘要
本发明涉及一种基于几何与时序建模分层上下文对齐的三维语义场景补全方法、装置及介质,获取深度特征和上下文特征,通过深度置信度感知交叉注意力机制,利用上下文特征补充低深度置信度区域的信息,生成当前帧相关特征;从姿态网络中获取历史帧相关特征,计算跨帧特征亲和度并对历史帧相关特征进行动态优化,得到多层历史帧聚合特征;在统一空间中,采用时间特征体素的深度假设作为距离轴,并将体积特征体素投影到统一空间,对几何特征体素和时间特征体素进行全局对齐和组合,得到最终聚合特征。与现有技术相比,本发明通过引入基于几何和时序建模的层次化上下文对齐机制,能够更准确地理解复杂3D场景,尤其适用于自动驾驶系统中的环境感知。
技术关键词
语义场景
补全方法
上下文特征
交叉注意力机制
时序
体积特征
分层
交互特征
自动驾驶系统
网络
可读存储介质
模板特征
采样点
处理器
动态
矩阵
视觉
计算机
电子设备