该函数执行全面的二元分类模型统计评估,通过计算受试者工作特征曲线 (ROC curve) 及其对应的曲线下面积 (AUC) 值。它处理预测概率分布与实际标签,以可视化真阳性率与假阳性率之间的权衡。输出结果提供一个标量指标,用于模型排序和阈值优化,这对于企业级决策,尤其是在高风险分类场景中至关重要。
该系统接收原始的预测数组和二元标签向量,并对数据类型进行标准化,以确保与统计评估算法的兼容性。
计算资源被分配用于计算每个独特概率阈值下的真正阳性率 (Recall) 和假阳性率 (FPR)。
最终指标会被汇总到标准格式中,包括可视化曲线数据点和标量AUC值,以便立即进行报告。
将预测的概率分数和真实标签加载到评估缓冲区中。
计算在所有可能的分类阈值范围内,灵敏度和特异性指标。
绘制ROC曲线轨迹,以可视化模型的区分能力。
使用梯形法则进行数值积分,计算最终的AUC分数。
验证预测数组是否包含介于零和一之间的连续概率值,同时验证标签向量是否仅包含二进制整数。
自动生成一系列精细的阈值候选值,以确保决策边界的精确映射。
执行数值积分算法,以计算精确的AUC值,并导出定义完整ROC曲线的坐标对。