Skip to main content

Day 4 - Model Evaluation

Akurasi klasifikasi adalah pembagian dari jumlah prediksi benar terhadap jumlah total prediksi. Akurasi bisa saja “menyesatkan”, dalam kasus dimana ketidakseimbangan kelas yang besar (large class imbalance). Model klasifikasi dapat memprediksi nilai pada kelas terbesar untuk semua prediksi dan bisa memberikan nilai akurasi yang tinggi dan tentu saja model yang dihasilkan dapat memprediksikan nilai yang salah, sehingga perlu metrik evaluasi lain yang dapat mengukur performa model klasifikasi yang kita buat. Metrik yang dimaksudkan adalah Precision, Recall dan Confusion Matrix. Sebenarnya ada metrik lainya yang dapat digunakan, nampun 3 jenis metrik ini sudah cukup untuk langkah awal.


Binary Classification Problem

Dalam kasus binary classification seperti contoh prediksi kredit macet pinjaman bank, kita akan dihadapkan pada hasil prediksi berupa True Positive (TF), True Negative (TN), False Positive (FP), False Negative (FN).

 

https://miro.medium.com/max/1302/1*_uBoIR6nBHkusk150vZD2Q.jpeg

Contoh kasus : Prediksi pasien hamil atau tidak.

  • True positives: model memprediksikan pasien hamil dan kenyataanya memang pasien hamil

  • False positives: model memprediksikan pasien hamil dan kenyataanya pasien tidak hamil

  • True negatives: model memprediksikan pasien tidak hamil dan kenyataanya pasien tidak hamil

  • False negatives: model memprediksikan pasien tidak hamil dan kenyataanya pasien hamil

Confusion Matrix

Nah setelah familiar dengan TP, FP, TN, FN, selanjutnya akan lebih mudah dalam memahami confusion matrix.   

 https://miro.medium.com/max/1094/1*aj4wZbT8ZNOCyljLqkKcfg.png

Confusion Matrix merepresentasikan prediksi dan kondisi sebenarnya(aktual) dari data yang dihasilkan oleh algoritma ML. Berdasarkan Confusion Matrix, kita bisa menentukan Precision dan Recall.

Recall

Recall dapat didefinisikan sebagai rasio dari jumlah total contoh positif yang diklasifikasikan bernilai benar dibagi dengan jumlah total contoh positif. High Recall menunjukkan kelas dikenali dengan baik (FN rendah).

Precision

Precision merupakan pembagian dari jumlah total contoh positif yang diklasifikasikan bernilai benar dengan jumlah total contoh positif yang diprediksi. High Precision menunjukkan contoh berlabel positif memang positif (FP rendah).

 


Referensi



Last modified: Friday, 17 February 2023, 12:11 AM