摘要
本发明涉及人工智能及计算机视觉安全领域,具体为一种基于风格抑制和频域限制的语义攻击方法。所述方法包括:向良性样本添加微小噪声生成初始对抗样本,计算该样本与良性样本的语义相似度以获得语义损失;将初始对抗样本输入自适应实例规范化层,使用参考样本进行风格转换,生成风格化对抗样本,并计算风格抑制损失;通过离散小波变换对风格化对抗样本进行频率分解,得到低频和高频分量,计算二者之间的频率差异,获得频率损失;结合风格抑制损失与频率损失生成总体损失,基于总体损失优化对抗样本,生成最终优化的对抗样本。本发明能够提升对抗攻击的稳定性和有效性,对神经网络模型具有较好的欺骗效果。