公_MODULE
模型评估

公平性指标

在模型评估流程中,计算统计指标,以量化模型在受保护属性上的人口统计公平性(demographic parity)和机会均等性(equalized odds)。

High
机器学习伦理专家
A person monitors multiple screens showing network performance and data flow visualizations.

Priority

High

Execution Context

此功能计算聚合统计数据,旨在通过分析不同人群群体的性能差异,从而检测机器学习模型中的偏见。它计算关键指标,如人口均等性 (demographic parity)、均衡机会 (equalized odds) 和差异影响比率 (disparate impact ratios),以确保符合伦理人工智能标准。该系统按子群体汇总预测结果和真实标签,并应用统计测试,以识别与企业治理政策中定义的公平阈值存在显著偏差的情况。

该功能启动对模型输出的深入分析,并将结果按受保护属性(如年龄、性别或种族)进行分段。

统计算法会计算特定的公平性指标,包括真阳性率均等性和假阴性率相等性。

结果将与预先设定的监管阈值进行比较,以便及时识别潜在的算法歧视风险。

Operating Checklist

从训练数据集和推理数据集提取受保护属性的标签。

根据人口统计学标识符,将模型预测结果划分为不同的组别。

为每个子组分别计算准确率、精确率、召回率和 F1 分数。

采用统计显著性检验,以确定是否存在非随机性差异。

Integration Surfaces

数据摄取接口

安全上传包含受保护属性字段的标注数据集,用于子组分析。

合规仪表盘

用于监管审查的公平性评分和偏差热图的实时可视化。

告警通知系统

当计算出的指标超过可接受的偏差容忍度阈值时,系统将自动触发相应操作。

FAQ

Bring 公平性指标 Into Your Operating Model

Connect this capability to the rest of your workflow and design the right implementation path with the team.