一种基于模型决策边界的通用模型窃取防御方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于模型决策边界的通用模型窃取防御方法及系统
申请号:CN202411041458
申请日期:2024-07-31
公开号:CN119180009A
公开日期:2024-12-24
类型:发明专利
摘要
本发明提供一种基于模型决策边界的通用模型窃取防御方法及系统,包括:训练阶段:获得用户预测样本,将样本和云平台模型针对预测样本的置信度分布向量作为输入,输出原始扰动样本;将原始扰动样本添加到用户预测样本,作为输入得到迭代扰动样本;推理阶段:当原始置信度分布向量得到的预测标签和隐藏置信度分布得到的预测标签相同时,则继续迭代;当不同时则停止迭代,根据迭代次数确定预测样本到决策边界的距离;根据得到的距离与给定的比较结果确定恶意样本;返回恶意样本扰动置信度分布向量,并限制该用户访问。本发明在不改变目标模型输出标签下,最大程度改变了目标模型输出置信度分布向量,以降低窃取模型的可用性。
技术关键词
恶意样本 生成算法 决策 云平台服务器 标签 HTTP请求 深度学习框架 阶段 防御系统 图像像素 格式 数据 训练集 指标 客户端 端点