Tablica pomyłek
Tablica pomyłek (macierz błędów) jest stosowana przy ocenie jakości klasyfikacji binarnej (na dwie klasy). Dane oznaczone etykietami: pozytywną i negatywną poddawane są klasyfikacji, która przypisuje im predykowaną klasę pozytywną albo predykowaną klasę negatywną. Możliwa jest sytuacja, że dana oryginalnie oznaczona jako pozytywna zostanie omyłkowo zaklasyfikowana jako negatywną. Wszystkie takie sytuacje przedstawia tablica pomyłek.
Tablica ma dwa wiersze i dwie kolumny. Wiersze przedstawiają klasy predykowane, kolumny zaś klasy rzeczywiste.
|
Na bazie częstości występowania rzeczywistego stanu pozytywnego w populacji oraz wzajemnych relacji prawidłowych i nieprawidłowych klasyfikacji można wyróżnić szereg miar wartości diagnostycznej testu. Poniższy wykres podsumowuje ich powiązania, przy czym jest ułożony odwrotnie niż tablica powyżej:
Klasa predykowana – wynik testu | |||||
Populacja | Klasyfikacja pozytywna | Klasyfikacja negatywna | Częstość występowania, chorobowość | ||
Klasa rzeczywista | Stan pozytywny | prawdziwie dodatnia, TP | fałszywie ujemna (błąd drugiego rodzaju, FN) | czułość, TPR | FNR |
Stan negatywny | fałszywie dodatnia (błąd pierwszego rodzaju, FP) | prawdziwie ujemna, TN | FPR | swoistość, SPC, TNR | |
dokładność, ACC | precyzja, PPV | FOR | LR+ | DOR | |
FDR | NPV | LR- |
Miary:
- prawdziwie pozytywna (ang. true positive, TP)
- prawdziwie negatywna (ang. true negative, TN)
- fałszywie pozytywna (ang. false positive, FP), błąd pierwszego rodzaju
- fałszywie negatywna (ang. false negative, FN), błąd drugiego rodzaju
- czułość (ang. sensitivity, recall) lub odsetek prawdziwie pozytywnych (ang. true positive rate, TPR)
- swoistość (ang. specificity, SPC) lub odsetek prawdziwie negatywnych (ang. true negative rate, TNR)
- precyzja (ang. precision, lub positive predictive value, PPV – wartość predykcyjna dodatnia)
- dokładność (ang. accuracy, ACC)
Przykład
|