Cara Hitung RMSE , MSE, MAPE, dan MAE Dengan Excel
Penulis -
Abdul Muiz Khalimi, S.Kom
Assalamulaikum Wr. Wb - Salam Sejahtera dan Salam Budaya
Dalam sebuah metode pembelajaran machine learning penting untuk dilakukan. Hal itu disebabkan karena bertujuan untuk mengukur tingkat keakuratan kinerja metode yang digunakan. Untuk itu maka pada tahap ini salah satu metode yang perlu dilakukan untuk mengukur kinerja suatu algoritma, yaitu dengan menghitung Root Mean Square Error, Mean Square Error dan Mean Absolute Error.
Namun, sebelum itu perlu juga diketahui bahwa dalam pembelajaran machine learning terdapat dua kriteria yaitu Klasifikasi dan Regresi. Istilah Klasifikasi digunakan utnuk menetapkan objek-objek data ke dalam sejumlah kelas atau kategori yang terbatas (Suyanto, 2018). Misalnya kelas tersebut bernilai positif atau negatif. Dalam masalah klasifikasi, model algoritmik mencoba memprediksi kelas menggunakan data selama selama fase pelatihan, hal ini biasa disebut dengan data latih.
Untuk menguji atau mengevaluasi kinerja algoritma klasfikasi adalah dengan menggunakan metode pengujian dengan confusion matrix. Ada dua tipe yaitu biner classification dan multi-class classfication.
Sedangkan Regresi adalah proses identifikasi relasi dan pengaruhnya pada nilai-nilai objek. Regresi sendiri bertujuan untuk menemukan sutau fungsi yang memodelkan data dengan meminimalisir galat atau selisih antra nilai prediksi dengan nilai sebenarnya (Suyanto, 2018).
Sedangkan untuk pengujian model algoritmanya adalah dengan menentukan nilai Root Mean Square Error, Mean Square Error dan Mean Absolute Error.Bagaimana cara menghitungnya ?. Yuk kita bahas dengan seksama sampai kesimpulan.
Root Mean Square Error (RMSE)
Root Mean Square Error (RMSE), adalah jumlah dari kesalahan kuadrat atau selisih antara nilai sebenarnya dengan nilai prediksi yang telah ditentukan. Rumus formula RMSE adalah sebagai berikut :
Y ' = Nilai Prediksi
Y = Nilai Sejati
n = Jumlah Data
Contoh Penyelesaian
Pada gambar Tabel di atas, terlihat bahwa ada dua warna yang berbeda antara hijau dan kuning. Hijau menunjukkan data sebenarnya, sedangkan kuning adalah data niai prediksi yang dihasilkan.
Nah, sekarang untuk menghindari kebingungan dalam proses perhitungan, kita akan mencoba menghitung secara terpisah. Pertama, hitung dulu kuadratnya pada masing-masing nilai. Dengan rumus (Y'-Y)^2. Contoh nilai yang pertama
(1879.8 - 1866.30) ^ 2 = 182, 25
Selanjutnya, Rangkum semua hasil proses tersebut . Kemudian bentuk tabel seperti gambar Tabel dibawah ini
Kemudian jumlah kan semua hasil tersebut, dan dibagi dengan jumlah total data yang diuji dan diakarkan. Jika dalam formula Excel akan tertulis seperti ini :
=SQRT( 7925,8425 / 5 )
Maka hasil RMSE yang dihasilkan adalah 39,8142
Mean Square Error (MSE)
Untuk menghitung nilai MSE sama halnya dengan RMSE. Hanya saja tidak menggunakan proses akar. Pada tahap ini, jika nilai error nya semakin besar maka semakin besar nilai MSE yang dihasilkan.
Y ' = Nilai Prediksi
Y = Nilai Sebenarnya
n = Jumlah Data
Dengan rumus (Y'-Y)^2. (1879.8 - 1866.30) ^ 2 = 182, 25 . Kemudian jumlah dan dibagi jumlah data yang di uji
MAE atau Mean Absolute Error menunjukkan nilai kesalahan rata-rata yang error dari nilai sebenarnya dengan nilai prediksi. MAE sendiri secara umum digunakan untuk pengukuran prediksi error pada analisis time series. Rumus dari MAE sendiri didefinisikan sebagai berikut :
Y ' = Nilai Prediksi
Y = Nilai Sebenarnya
n = Jumlah Data
Berbeda dengan penyelesaian dari RMSE, pada Mean Absolute Error MAE ini cukup sederhana, yaitu dengan cara nilai prediksi dikurangi nilai sebenarnya |Y'-Y|
|1879.8 - 1866.30| = 13.50
Tentukan pada setiap nilainya kemudian jumlah keseluruhan dan dibagi jumlah data uji. Jika divisualisasi dalam bentuk tabel akan terlihat seperti ini.
Mean Precentage Absolute Error (MAPE)
Sebenarnya nilai ini adalah lanjutan dari penentuan nilai MAE dengan menentukan nilai presentase yang dihasilkan. Formula dari rumus MAPE sendiri adalah sebagai berikut ;
Y ' = Nilai Sebenarnya
Y = Nilai Prediksi
Pertama, kita akan menghitung satu nilai pertama dengan (Y-Y') / Y.
(1879.8 - 1866.30) / 1866.30 = 0,00723 * 100
= 0,723
Hasil diatas adalah hasil nilai pada kolom pertama. Untuk kolom selanjutnya lakukan perhitungan yang sama, kemudian hasil akhirnya adalah cari nilai rata-rata nya. Dengan cara jumlah seluruh hasil MAPE kemudian dibagi Jumlah total data uji. Atau jika dalam formula Excel, kamu bisa menggunakan rumus =AVERAGE( Kolom hasil MAPE ).
Menurut Lewis (1982), nilai MAPE dapat diinterpretasikan atau ditafsirkan ke dalam 4 kategori yaitu:
< 10% = "Sangat Baik"
10-20% = "Baik"
20-50% = "Wajar
> 50% = "Tidak Akurat" atau "Gagal".
Kesimpulan
Dalam model regresi, untuk mengetahui keakuratan kinerja model suatu algoritma, kita dapat mengambilnya dari nilai yang memiliki kesalahan kecil. Dengan kata lain, semakin kecil nilai error yang dihasilkan maka semakin dekat nilai atau jarak antara nilai aktual dengan nilai prediksi.
Terimakasih, semoga informasi ini bisa bermanfaat, apabila kamu berkenan bisa bantu donasi untuk pengembangan blog yang saya bangun melalui link ini https://saweria.co/PenS .
Nah itulah cara penyelesain masalah pada kasus atribut data numerik pada proses perhitungan Algoritma C4.5 dan jika kamu ingin belajar lebih dalam lagi, kamu bisa mendapatkan file excelnya.