摘要
本申请涉及人工智能技术领域,公开了一种算法模型评测方法及系统,该方法包括:由评测策略元学习框架根据评测历史,在激活行为探索策略与激活认知诊断策略中选择一个评测动作;当激活行为探索策略时,根据当前状态向量识别脆弱维度以生成扰动输入;当激活认知诊断策略时,解析先前错误评测实例以定位缺陷并生成诊断式探针输入;将输入施加于被测模型,多维状态向量监视模块采数据生成新状态向量;框架据新向量算奖励,将动作、向量及奖励追加至历史,形成决策反馈闭环。本发明通过构建一个自适应的决策与反馈机制,能够实现评测过程的高度自动化与智能化,提升对算法模型进行评测的深度、广度与效率。