このConfusion Matrix Calculatorについて
感度、専門性などのいくつかの統計的尺度を決定します。
この混同行列計算機は、感度、特異度、正の予測値(精度)、負の予測値、偽陽性率、偽発見率、偽陰性率、精度、マシューズ相関係数など、分類モデルのパフォーマンスに関連するいくつかの統計的尺度を決定します。 。
混同行列に基づく統計的尺度
混同行列は、分類モデルのパフォーマンスの一般的な表現であり、テストデータの実際の結果と比較して正しく分類された値と誤って分類された値が含まれます。 4つの変数は次のとおりです。
真陽性(TP)–モデルが陽性クラスを正しく予測した結果です(条件が存在する場合は正しく検出されます)。
真のネガティブ(TN)–モデルがネガティブクラスを正しく予測した結果です(存在しない場合、状態は検出されません)。
誤検出(FP)–モデルが正のクラスを誤って予測した結果です(条件が存在しないにもかかわらず検出されます)。
偽陰性(FN)–モデルが負のクラスを誤って予測した結果です(状態が存在しているにもかかわらず検出されません)。
最も一般的に決定される統計的尺度の1つは、感度(リコール、ヒット率、または真陽性率TPRとも呼ばれます)です。感度は、ポジティブとして正しく識別された実際のポジティブの割合を測定します。
感度= TP /(TP + FN)
特異度は、選択性または真の陰性率(TNR)とも呼ばれ、陰性として正しく識別された実際の陰性の割合を測定します。
特異性= TN /(FP + TN)
正の予測値(PPV)は、精度および負の予測値(NPV)とも呼ばれ、それぞれ真の正である正の結果と真の負の結果の比率です。それらは、ポジティブまたはネガティブの予測合意とも呼ばれ、診断テストのパフォーマンスの尺度です。
正の予測値(適合率)= TP /(TP + FP)
負の予測値= TN /(TN + FN)
偽陽性率(FPR)またはフォールアウトは、誤って陽性として分類された陰性イベントの数(偽陽性)と実際の陰性イベントの総数(分類に関係なく)の比率です。
偽陽性率= FP /(FP + TN)
偽発見率(FDR)は、多重比較を修正するために多重仮説検定で使用される統計的アプローチです。
偽発見率= FP /(FP + TP)
False Negative Rate(FNR)は、テスト結果が陰性である状態が存在する個人の割合を測定します。
偽陰性率= FN /(FN + TP)
精度(ACC)は統計的バイアスの尺度です
精度=(TP + TN)/(TP + TN + FP + FN)
F1スコアは、適合率と再現率の調和平均として定義される、テストの精度の尺度です。
F1スコア= 2TP /(2TP + FP + FN)
Matthews Correlation Coefficient(MCC)は、ある変数の値を変更すると別の変数の値にどのように影響し、-1から1までの値を返すかを説明します。
+1は完全な予測を表します。
0有効な情報を返すことができません(ランダムな予測に勝るものはありません)。
-1は、予測と観測の間の完全な不一致を表します。
マシューズ相関係数=(TP x TN – FP x FN)/(sqrt((TP + FP)x(TP + FN)x(TN + FP)x(TN + FN)))