一种耳廓指代分割方法和系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种耳廓指代分割方法和系统
申请号:CN202510140742
申请日期:2025-02-08
公开号:CN119579905B
公开日期:2025-05-30
类型:发明专利
摘要
本发明提供一种耳廓指代分割方法和系统,包括:将待分割人耳图像和文本描述输入耳廓指代分割模型,模型包括文本编码模块、文本引导的视觉编码模块和视觉解码模块、角度变换模块;文本编码模块得到文本特征;视觉编码模块通过组织成四阶段的结构实现文本特征与图像特征的融合,每个阶段的视觉编码器生成视觉特征,跨模态感知模块对齐与得到多模态特征,中的每个元素由注意力门控模块进行加权获得加权多模态特征,按元素与相加产生增强视觉特征,将输入视觉解码模块逐步恢复图像的空间分辨率,进一步融合文本和视觉特征输出多尺度特征;角度变换模块对多尺度特征进行角度变换,输出与文本描述相关区域的分割掩码。本发明可以对耳廓进行指代分割。
技术关键词
视觉特征 多模态特征 文本 解码模块 多尺度特征 人耳图像 阶段 编码模块 跨模态 注意力 双线性插值 分割方法 分辨率 上采样 冗余特征 非线性
系统为您推荐了相关专利信息
知识图谱构建方法 实体识别模型 注意力机制 上下文特征 预训练语言模型
火电厂设备 缺陷智能 多模态 预警方法 融合特征
图像分割模型 层级 分割方法 多层次特征融合 融合特征
智能问答方法 数据 问答模型 检索方法 智能问答装置
预处理图像数据 零件 节点 工业 直方图均衡化图像