摘要
本申请公开了一种基于大模型的病例数据模拟生成方法、系统及介质,主要涉及病例数据模拟技术领域,用以解决现有的模拟范式生成的数据质量不高,需要人工验证拟合数据是否偏离真实数据、模拟范式在拟合过程中难以捕捉复杂生物系统中的非线性交互关系的问题。包括:提取实际病历数据的分布特征和预设变量之间的关联关系;获得预设聚类数量个第一聚类中心;获取模拟病例数据的提示词,利用大模型模拟生成预设数量的拟合病历数据;将拟合病历数据添加至实际病历数据,获得总病历数据,获得预设聚类数量个第二聚类中心;计算第一聚类中心与对应第二聚类中心之间的距离,当预设聚类数量个距离均小于预设最大距离时,确定拟合病历数据合格。