Tutorial Rapidminer Mengatasi atribut Missing Value
Assalamualikum Wr.Wb, Salam Sejahtera dan Salam Budaya
Dalam suatu data yang besar sering kali ditemukan data yang cacat seperti missing value atau data yang hilang. Missing Value adalah record yang salah satu atau bahkan lebih atributnya tidak diketahui nilainya, pada kasus missing value sering kali penelitian dilakukan dengan cara imputasi atau mengisi dengan nilai rata–rata yang sering muncul dan juga menghapus atributnya (Effendy and Purbandini 2018).
Pada suatu data menurut (Waqas I, 2016) apabila data yang memiliki nilai missing value di atas 50% maka atirbut bisa diabaikan atau dihapus pada tahap data cleaning.
Pada pembahasan ini saya akan memberikan kalian pengalaman tentang cara Mengisi atau Replace Missing Velaues menggunakan Aplikasi Rapiminer Studio. Kita akan ke tahap pertama
1. Persiapan Data
Pastikan anda sudah mengimpor data kalian dan jika sudah terimpor ke dalam aplikasi rapidminer maka selanjutnya cek atribut mana yang mengalami missing value. contoh
- Drag Data set ke halaman prosess
- sambungkan ke garis akhir
- Klik jalankan atau Mulai
- Lihat Result History dibagian statistik
2. Pilih Operator Select Atribute
- Pada bagian kotak dialog operator pilih select atribute. Kedian Drag atau seret kehalaman Proses dan sambungkan dengan data set yang sudah di letakkan dihalaman proses.
Kemudian atur parameternya dengan cara klik operator select atribute dan pilih subset kemudian pilih atributnya.
Selanjutnya jika sudah muncul kotak dialog seperti gambar dibawah ini. Maka Geser atau pindahkan atribut yang mengalami missing value kebagian kanan. Dan Klik apply.
3. Pilih Operator Replace Missing Values
Selanjutnya Pada bagian kotak dialog operator pilih Replace Missing Values. Kedian Drag atau seret kehalaman Proses dan sambungkan dengan data set yang sudah di letakkan dihalaman proses.
Kemudian atur parameternya dengan cara klik operator select atribute dan pilih subset kemudian pilih atributnya
Selanjutnya jika sudah muncul kotak dialog seperti gambar dibawah ini. Maka Geser atau pindahkan atribut yang mengalami missing value kebagian kanan. Dan Klik apply.
4. Sambungkan Semua Operator
Langkah Terakhir adalah menyambungkan semua operator diatas dan klik Button Play atau Mulai
Lihat Result History dibagian statistik. Maka pada bagian Missing Nilainya adalah Nol.
.
Baca Juga :
- Cara Hapus Atribut dengan Nilai Missing Values diatas 50 %
- Cara Imputasi data Missing Values dengan beberapa algoritma Klasifikasi
See YOU.
Sumber Pustaka
Effendy, Faried, and Purbandini Purbandini. 2018. “Klasifikasi Rumah Tangga Miskin Menggunakan Ordinal Class
Classifier.” Jurnal Teknologi dan Sistem Informasi 4 (1): 30–36.
Waqas I, S. S.-U.-R. (2016). Treatment of Missing Values in Data Mining. Journal of Computer Science & Systems
Biology, 9 (2) : 051-053.