一种耳廓指代分割方法和系统

申请号：CN202510140742

申请日期：2025-02-08

公开号：CN119579905B

公开日期：2025-05-30

类型：发明专利

摘要

本发明提供一种耳廓指代分割方法和系统，包括：将待分割人耳图像和文本描述输入耳廓指代分割模型，模型包括文本编码模块、文本引导的视觉编码模块和视觉解码模块、角度变换模块；文本编码模块得到文本特征；视觉编码模块通过组织成四阶段的结构实现文本特征与图像特征的融合，每个阶段的视觉编码器生成视觉特征，跨模态感知模块对齐与得到多模态特征，中的每个元素由注意力门控模块进行加权获得加权多模态特征，按元素与相加产生增强视觉特征，将输入视觉解码模块逐步恢复图像的空间分辨率，进一步融合文本和视觉特征输出多尺度特征；角度变换模块对多尺度特征进行角度变换，输出与文本描述相关区域的分割掩码。本发明可以对耳廓进行指代分割。

技术关键词

视觉特征多模态特征文本解码模块多尺度特征人耳图像阶段编码模块跨模态注意力双线性插值分割方法分辨率上采样冗余特征非线性

系统为您推荐了相关专利信息

中医古籍知识图谱构建方法、设备、介质

知识图谱构建方法实体识别模型注意力机制上下文特征预训练语言模型

一种基于多模态大模型的火电厂设备缺陷智能监测、预警方法及系统

火电厂设备缺陷智能多模态预警方法融合特征

一种迷彩伪装人员分割方法

图像分割模型层级分割方法多层次特征融合融合特征

智能问答方法、装置、设备及存储介质

智能问答方法数据问答模型检索方法智能问答装置

基于自适应图卷积与Transformer的工业零件编号提取与识别方法

预处理图像数据零件节点工业直方图均衡化图像