检测媒体字体素材的方法及装置

申请号：CN202510834079

申请日期：2025-06-20

公开号：CN120808368A

公开日期：2025-10-17

类型：发明专利

摘要

本发明公开了一种检测媒体字体素材的方法，结合特征金字塔网络（FPN）、通道注意力机制（SE Block）和自注意力机制（Self‑Attention），极大增强了模型在多种复杂场景下的泛化能力和适应性。FPN 提供了多尺度特征融合，使模型能够在不同的分辨率下处理文本颜色信息；SE Block 通过调整特定通道的权重，增强了模型对关键颜色通道的感知能力；Self‑Attention 则进一步捕捉图像中全局颜色的相关性，确保模型在不同颜色分布和复杂背景下仍能稳定提取颜色信息。这种多模块的协同工作有效提升了模型的整体性能，能够应对多种类型的文本和背景颜色组合，确保在多种复杂场景中都能准确识别出背景色、填充色和描边色。

技术关键词

通道注意力机制颜色特征金字塔网络深度学习模型加权特征生成多尺度字体媒体图像标签全局平均池化文本特征提取模块数据处理模块像素多模块调度器