この関数は、二値分類モデルの包括的な統計評価を実行し、受信者動作特性曲線(ROC曲線)と、それに対応する曲線下面積(AUC)を算出します。予測された確率分布と実際の正解ラベルを比較し、真陽性率と偽陽性率のトレードオフを可視化します。出力は、モデルのランキングや閾値の最適化に不可欠な、単一のスカラー指標であり、企業レベルでの意思決定において、特に重要な分類タスクにおいて活用できます。
システムは、生の予測データ配列と二値ラベルベクトルを取り込み、統計評価アルゴリズムとの互換性を確保するために、データ型を正規化します。
計算リソースは、各ユニークな確率閾値において、真陽性率(再現率、Recall)と偽陽性率(偽陽性率、FPR)を算出するために割り当てられます。
最終的な指標は、視覚的な曲線データポイントやスカラーAUC値を含む、標準化された形式に集計され、即時レポートに使用されます。
予測された確率スコアと正解ラベルを評価バッファに読み込みます。
分類の閾値として考えられるすべての範囲において、感度と特異度の指標を算出します。
モデルの識別能力を可視化するために、ROC曲線の軌跡をプロットします。
数値積分法(台形公式)を用いて、最終的なAUCスコアを算出します。
予測配列が0から1の間の連続した確率値を含んでいること、およびラベルベクトルが完全に二値の整数で構成されていることを検証します。
決定境界の全体像を詳細に把握するために、高解像度のマッピングを可能にする、細かく調整された閾値候補を自動的に生成します。
数値積分アルゴリズムを実行し、正確なAUC値を算出するとともに、完全なROC曲線を定義する座標ペアをエクスポートします。