Akurasi klasifikasi adalah pembagian dari jumlah prediksi benar terhadap jumlah total prediksi. Akurasi bisa saja “menyesatkan”, dalam kasus dimana ketidakseimbangan kelas yang besar (large class imbalance). Model klasifikasi dapat memprediksi nilai pada kelas terbesar untuk semua prediksi dan bisa memberikan nilai akurasi yang tinggi dan tentu saja model yang dihasilkan dapat memprediksikan nilai yang salah, sehingga perlu metrik evaluasi lain yang dapat mengukur performa model klasifikasi yang kita buat. Metrik yang dimaksudkan adalah Precision, Recall dan Confusion Matrix. Sebenarnya ada metrik lainya yang dapat digunakan, nampun 3 jenis metrik ini sudah cukup untuk langkah awal.
Dalam kasus binary classification seperti contoh prediksi kredit macet pinjaman bank, kita akan dihadapkan pada hasil prediksi berupa True Positive (TF), True Negative (TN), False Positive (FP), False Negative (FN).
Contoh kasus : Prediksi pasien hamil atau tidak.
True positives: model memprediksikan pasien hamil dan kenyataanya memang pasien hamil
False positives: model memprediksikan pasien hamil dan kenyataanya pasien tidak hamil
True negatives: model memprediksikan pasien tidak hamil dan kenyataanya pasien tidak hamil
False negatives: model memprediksikan pasien tidak hamil dan kenyataanya pasien hamil
Nah setelah familiar dengan TP, FP, TN, FN, selanjutnya akan lebih mudah dalam memahami confusion matrix.
Confusion Matrix merepresentasikan prediksi dan kondisi sebenarnya(aktual) dari data yang dihasilkan oleh algoritma ML. Berdasarkan Confusion Matrix, kita bisa menentukan Precision dan Recall.
Recall dapat didefinisikan sebagai rasio dari jumlah total contoh positif yang diklasifikasikan bernilai benar dibagi dengan jumlah total contoh positif. High Recall menunjukkan kelas dikenali dengan baik (FN rendah).
Precision merupakan pembagian dari jumlah total contoh positif yang diklasifikasikan bernilai benar dengan jumlah total contoh positif yang diprediksi. High Precision menunjukkan contoh berlabel positif memang positif (FP rendah).
Referensi