摘要
本发明提供一种耳廓指代分割方法和系统,包括:将待分割人耳图像和文本描述输入耳廓指代分割模型,模型包括文本编码模块、文本引导的视觉编码模块和视觉解码模块、角度变换模块;文本编码模块得到文本特征;视觉编码模块通过组织成四阶段的结构实现文本特征与图像特征的融合,每个阶段的视觉编码器生成视觉特征,跨模态感知模块对齐与得到多模态特征,中的每个元素由注意力门控模块进行加权获得加权多模态特征,按元素与相加产生增强视觉特征,将输入视觉解码模块逐步恢复图像的空间分辨率,进一步融合文本和视觉特征输出多尺度特征;角度变换模块对多尺度特征进行角度变换,输出与文本描述相关区域的分割掩码。本发明可以对耳廓进行指代分割。