该计算密集型函数通过绘制不同概率阈值下的精确率与召回率之间的关系,对二元分类器的性能进行全面评估。它将模型预测结果与真实标签进行比对,以计算曲线下面积 (AUC-PR),从而提供关于灵敏度和特异性之间权衡的重要见解。该分析对于以下场景至关重要:在这些场景中,误报会产生显著的运营成本,或者类别不平衡会影响传统的准确率指标。通过进行此分析,数据科学家可以在模型部署前验证模型的鲁棒性。
该系统从训练流程中接收原始预测数组以及对应的真实标签,用于初始化评估引擎。
一种迭代阈值化算法,通过在预定义的概率阈值范围内计算精确率和召回率指标,从而生成曲线上的坐标点。
计算得到的各项指标被汇总到一个可可视化的数据集,并计算出统计摘要,包括AUC-PR值以及置信区间。
从源数据集检索二元分类预测结果以及对应的真实标签。
定义精确率-召回率计算的阈值范围和粒度。
遍历阈值,计算每个点对应的精确率和召回率。
将结果汇总到一个结构化的曲线对象中,包括AUC-PR值以及置信区间。
从模型训练的制品库中,自动提取预测向量和真实标签。
实时计算精确率和召回率,涵盖连续的分类阈值范围。
生成交互式图表,直观展示曲线轨迹,并附带性能统计数据,方便用户即时查看。