混同行列(Confusion Matrix)機能は、予測結果と実際のラベルを比較した詳細な表形式のデータを提供します。この機能は、精度(Accuracy)、適合率(Precision)、再現率(Recall)、およびF1スコアといった正確な指標を計算し、二値分類または多クラス分類モデルの性能を評価します。このツールは、医療診断における偽陰性や、不正検知システムにおける偽陽性など、特定の種類の誤りを特定するために不可欠です。正りの正(True Positives)、偽りの正(False Positives)、負りの負(True Negatives)、および偽りの負(False Negatives)を単一の構造化された出力に集約することで、データサイエンティストは分類器の閾値を最適化し、システム全体の信頼性を向上させることができます。
この関数は、トレーニングまたは推論パイプラインから入力される生の予測配列と、正解ラベルを読み込むことで初期化されます。
その後、予測されたクラスと実際の観測値との照合を行う行列計算アルゴリズムを実行し、その結果に基づいてセルカウントを算出します。
最後に、システムは統計的な指標を算出するとともに、その結果を標準化されたJSON形式に変換し、その後の分析に利用できるようにします。
ソースデータセットから予測結果の集合と正解ラベルを取得します。
配列の長さとデータ型を検証し、計算の正確性を確保します。
予測されたクラスと実際のラベルを照合し、その結果をマトリックスのセルに格納します。
派生指標を算出하고, その結果を企業向けレポートの形式に整形します。
システムは、計算を開始する前に、予測配列が実際のデータと同じ次元とデータ型を持つことを検証します。
主要なアルゴリズムは、真陽性、偽陽性、真陰性、および偽陰性における細胞の頻度を算出します。
エンジンは、入力された混同行列の値に基づいて、精度(accuracy)、適合率(precision)、再現率(recall)、およびF1スコアを算出します。