摘要
本说明书实施例提供一种基于事务决策的基于事务决策的模型训练方法、装置与电子设备,该方法包括:通过获取模型集合和样本用户的样本用户特征,模型集合包括目标事务方模型和至少一个关联事务方模型,将样本用户特征分别输入模型集合中的各模型,基于全局状态参数、样本用户特征、各模型的内部状态参数和行为规则生成各模型对应的样本事务决策结果,确定样本用户针对目标事务方模型的样本事务决策结果的真实选择结果,基于真实选择结果确定针对各模型的决策奖惩值,根据各模型的目标函数、决策奖惩值和样本事务决策结果更新模型集合,训练好的模型集合中的目标事务方模型用于基于目标用户的目标用户特征生成事务决策结果。