摘要
本发明公开了一种面向不完整文本图像的图像修复方法。该方法主要包括两个阶段:文本结构重建和文本图像重建。在文本结构重建阶段,接收不完整文本图像作为输入,并通过编码器、中间模块和解码器的协同工作,实现文本结构的精确分割与预测,从而获得完整文本结构二进制图像。随后,在文本图像重建阶段,将重建后的完整文本结构图像与原始不完整文本图像共同作为条件输入。该阶段由识别引导模型和扩散模型组成。识别引导模型,即场景文本识别器,它通过分析不完整文本图像,预测每个字符属于特定字符集的概率分布,为文本修复提供语义指导。在语义指导的基础上,扩散模型对不完整文本图像进行精细化修复,显著提升了文本区域的可读性和图像的保真度。