摘要
本发明涉及图像检测技术领域,可应用于金融科技、医疗健康等业务系统平台中,公开了一种基于平面图生成三维场景方法、装置、设备及介质,包括:获取数据集,对数据集进行多模态特征提取与预处理,得到结构化数据;对结构化数据进行模态对齐,得到统一特征空间下的融合数据;利用预设的自回归变换器架构对融合数据进行三维场景预测,得到三维场景预测结果;根据三维场景预测结果对自回归变换器架构进行损失计算和参数优化迭代,得到优化模型;利用优化模型将预设平面图构建成三维场景。解决了现有技术中基于平面图生成三维场景中准确性和效率的问题。