基于注意力机制和风格混合技术的内窥镜息肉图像分割方法
申请号:CN202411521427
申请日期:2024-10-29
公开号:CN119380026B
公开日期:2025-12-16
类型:发明专利
摘要
本发明公开了一种基于注意力机制和风格混合技术的内窥镜息肉图像分割方法,包括基于注意力机制和风格混合技术的内窥镜息肉图像分割方法,基于编码器‑解码器架构,构建息肉图像分割模型基本架构,使用MSCAN作为编码器,融合并提取多尺度特征,并在编码器的stage之间应用MixStyle技术,提升模型的域泛化性能。在解码器中,使用UAM聚合编码器生成的多尺度特征,再对聚合后的特征依次从通道和空间表示中检测更重要的上下文信息;使用OAM追踪目标和互补边缘信息,构建编码器和解码器特征之间的联系,减少两者特征之间的分布差异,获得更精准的分割图。在训练过程中,本发明使用API loss采用自适应的方式指导模型的训练,整体提升息肉图像分割模型的性能。
技术关键词
图像分割方法
注意力机制
编码器
内窥镜
图像分割模型
风格
解码器架构
sigmoid函数
通道
模块
矩阵乘法运算
正则化模型
解码器执行
自动化工具
噪声像素
多尺度特征
上采样