Menentukan Confusion Matrix dengan Rapidminer Studio

Menghitung Accuracy, Precision dan Recall

Assalamualaikum Wr. Wb, Salam Sejahtera dan Salam Budaya

Pada ilmu data mining ada beberapa pembelajaran yang dilakukan untuk mengolah sebuah data. Supervised Learning adalah salah satu pembelajaran di bidang data, sebuah ilmu yang akan membahasa teknik-teknik klasifikasi yang bersifat analitik prediktif. Ada lima jenis teknik atau metode pada supervised learaning salah satunya adalah pada meode klasifikasi.

Metode klasifikasi adalah sebuah metode yang melakukan analisa prediktif dengan mempelajari data-data di masa lampau untuk hasil dimasa yang akan datang. Ada juga beberapa algoritma yang diterapkan seperti naive bayes, decision tree, k-NN, atau SVM. Penggunaan algoritma tersebut juga mengacu pada data yang diperoleh.

Dengan memanfaatkan algoritma klasifikasi, tentunya kita juga harus mencari atau mengetahui tingkat keakuratan atau kepercayaan pada hasil yang diperoleh guna untuk melakukan prediksi. Salah satu metode yang dilakukan untuk mengetahui peforma dari agoritma tersebut adalah dengan mencari nilai accuracy, precission, dan Recall.

Pada pembahasan diartikel ini akan ditunjukkan cara mengetahui nilai precisson, recall dan accuracy menggunakan aplikai Rapidminer Studio. Oke langsung kita ketahap yang pertama yaitu

Persiapan Data

Pada halaman Repository akan muncul data teman-teman yang sudah Terimpor oleh sistem. Kemudian Drag atau seret ke halaman kerja RapidMiner.

Pilih Model Metode atau Algoritma

Dalam contoh kita akan memakai algoritam k-NN. Tahap selanjutnya kita aka memilih algoritma klasifikasi k-NN dengan cara kita menuju kotak dialog Operators , pilih menu k-NN . Kemudian Drag atau seret ke halaman lembar kerja halaman proses.

Selanjutnya pada operator Split Data klik 2x, kemudian atur Sampling Type pada kota Parameters , ini bertujuan untuk memisah atau membagi menjadi data latih dan data uji guna untuk mengetahui permorma dari model yang dibentuk oleh k-NN

Setelah itu atur porposisi atau kapasitas antara data latih dan data uji. Klik pada menu edit Enumeration. kemudian akan muncul kotak dialog sepeti dibawah ini

Add Entry kemudain Ok. Maksud dari 0.9 adalah data latih diambil 90% dan 0.1 adalah Data Uji diambil 10% dari perbandiingan Seluruh Dataset.

Atur Performance

Tahap selanjutnya adalah mengatur operators yang akan menghitung atau menampilkan hasil akurasi, presisi dan sensitifiti.

Pada menu operators temukan dan pilih operator Apply Model dan Performance dan jangan lupa untuk drag atau seret ke halaman proses. Kemudian sambungkan semua operators seperti yang terlihat pada gambar dibawah ini

Selanjutnya adalah klik button Play atau mulai prosessnya

Maka setelah itu akan muncul tampilan seperti ini

Penjelasan arah panah dengan nomor
1. Hasil total yang sudah dilakukan proses Split data
2. Hasil dari nilai Performa menggunakan Algoritma k-NN
3. Total Dataset asli
4. Beberapa Kriteria Evaluasi untuk mengukur performa Suatu Algoritma (accuracy, precission, recall dan AUC atau area under curve.

Nah, Selesai sudah dan sudah selesai teman-teman, gimana ribet atau simple. Ya itu semua tergantung sudut pandang kalian sendiri. Sejauh mana anda mau belajar dan terus melangkah kedepan
.
Sekian Terimasih sudah mampir dan percaya sudah belajar disini, pantau terus Pengalaman Edukasi karena SistemKu adalah InformasiMu

Satu Kata “TETAP BERSYUKUR DAN JANGAN LUPA BERNAFAS”.
See YOU.

Menentukan Confusion Matrix dengan Rapidminer Studio

Persiapan Data

Pilih Model Metode atau Algoritma

Atur Performance

Menu Halaman Statis