一种基于大语言模型文本生成内容的双阶段协同验证偏见检测方法
申请号:CN202510451694
申请日期:2025-04-11
公开号:CN120745605A
公开日期:2025-10-03
类型:发明专利
摘要
一种基于大语言模型文本生成内容的偏见检测方法,包括生成内容分析模块,构建基于人口普查数据的加权姓氏库与职业分类的组合提示词矩阵,通过多轮交互生成标准化简历文本;采用基于语义规则的关键信息抽取引擎与标准化处理技术对提取的性别标识、年龄区间、学历层级和地理区域信息进行结构化处理,通过独立样本T检验进行职业关联性判别;构建可解释的偏见指数计算模型评估偏见程度;简历评分分析模块,创建简历多维变体生成机制,采用多变量方差分析与回归分析相结合的方法验证模型输出与人口统计学特征的关联性。建立双阶段协同验证机制,可有效识别大语言模型在职场应用场景中的隐性偏见,提供量化评估工具。
技术关键词
大语言模型
职业
变量
年龄
文本
空间聚类分析
广义线性模型
分析模块
状态自动机
统计学特征
偏差分析系统
语义规则
生成机制
混合效应模型
矩阵
指数
模糊匹配算法
标准化模板
匹配器