此功能计算聚合统计数据,旨在通过分析不同人群群体的性能差异,从而检测机器学习模型中的偏见。它计算关键指标,如人口均等性 (demographic parity)、均衡机会 (equalized odds) 和差异影响比率 (disparate impact ratios),以确保符合伦理人工智能标准。该系统按子群体汇总预测结果和真实标签,并应用统计测试,以识别与企业治理政策中定义的公平阈值存在显著偏差的情况。
该功能启动对模型输出的深入分析,并将结果按受保护属性(如年龄、性别或种族)进行分段。
统计算法会计算特定的公平性指标,包括真阳性率均等性和假阴性率相等性。
结果将与预先设定的监管阈值进行比较,以便及时识别潜在的算法歧视风险。
从训练数据集和推理数据集提取受保护属性的标签。
根据人口统计学标识符,将模型预测结果划分为不同的组别。
为每个子组分别计算准确率、精确率、召回率和 F1 分数。
采用统计显著性检验,以确定是否存在非随机性差异。
安全上传包含受保护属性字段的标注数据集,用于子组分析。
用于监管审查的公平性评分和偏差热图的实时可视化。
当计算出的指标超过可接受的偏差容忍度阈值时,系统将自动触发相应操作。