摘要
一种支持细粒度定制的故事可视化方法,包括:输入参考图像与叙事文本,通过身份解耦编码器分离参考图像的身份特征与非身份可编辑属性,利用故事语义解析器解析叙事文本时序属性变化趋势生成调节参数,经跨模态融合控制器融合生成细粒度控制特征,再由跨帧一致性维护模块结合扩散模型生成时序连贯图像序列,最终输出符合细粒度属性控制与跨帧身份一致性的结果。相比现有方法,本发明的显著优势在于通过四阶段处理,解决了身份保真与动态属性调节矛盾,保障了多帧时空连贯,核心指标全面超越了基线方法,为单参考图像下的高保真故事可视化提供了完整解决方案。