摘要
本发明公开了一种检测媒体字体素材的方法,结合特征金字塔网络(FPN)、通道注意力机制(SE Block)和自注意力机制(Self‑Attention),极大增强了模型在多种复杂场景下的泛化能力和适应性。FPN 提供了多尺度特征融合,使模型能够在不同的分辨率下处理文本颜色信息;SE Block 通过调整特定通道的权重,增强了模型对关键颜色通道的感知能力;Self‑Attention 则进一步捕捉图像中全局颜色的相关性,确保模型在不同颜色分布和复杂背景下仍能稳定提取颜色信息。这种多模块的协同工作有效提升了模型的整体性能,能够应对多种类型的文本和背景颜色组合,确保在多种复杂场景中都能准确识别出背景色、填充色和描边色。