一种面向不完整文本图像的图像修复方法

申请号：CN202411850294

申请日期：2024-12-16

公开号：CN119887586B

公开日期：2025-11-28

类型：发明专利

摘要

本发明公开了一种面向不完整文本图像的图像修复方法。该方法主要包括两个阶段：文本结构重建和文本图像重建。在文本结构重建阶段，接收不完整文本图像作为输入，并通过编码器、中间模块和解码器的协同工作，实现文本结构的精确分割与预测，从而获得完整文本结构二进制图像。随后，在文本图像重建阶段，将重建后的完整文本结构图像与原始不完整文本图像共同作为条件输入。该阶段由识别引导模型和扩散模型组成。识别引导模型，即场景文本识别器，它通过分析不完整文本图像，预测每个字符属于特定字符集的概率分布，为文本修复提供语义指导。在语义指导的基础上，扩散模型对不完整文本图像进行精细化修复，显著提升了文本区域的可读性和图像的保真度。

技术关键词

图像修复方法图像重建识别器编码器解码器文本识别通道注意力机制噪声参数阶段数据分布语义特征分辨率场景字符超参数

系统为您推荐了相关专利信息

一种变电站的标准化智能控制系统

梯度提升决策树智能控制系统强化学习模型变电站长短期记忆网络

一种基于合成畸变增强的鱼眼图像矫正方法及系统

鱼眼图像矫正方法畸变特征编码器样本通道注意力机制

图像处理方法、模型训练方法、装置及电子设备

图像编码器图像处理方法模型训练方法网络语义特征

一种基于双编码器与扩散模型的脑疾病预测方法

疾病预测方法双编码器节点特征功能磁共振图像网络

交叉眼干扰对抗环境下基于深度学习的无网格DOA估计方法及装置

DOA估计方法方位角回波网格引入神经网络模型