Skip to content Skip to sidebar Skip to footer

Cara Imputasi k-NN Menggunakan Rapidminer Studio

 

Impute Missing Value With k-NN

Assalamualaikum Wr. Wb, Salam Sejahtera dan Salam Budaya

Oke, mungkin kalian akan menemukan perbedaan sedikit dengan aplikasi Rapidminer Studio pada vers 9.10 ini. Iya Rapidminer saat ini telah mengubah logonya dari totalitas warna orange menjadi warna ungu tua atau biru tua atau apalah itu, pokoknya warnanya sekarang sudah jauh berbeda dengan versi-versi sebelumnya.

Lantas apakah fitur-fitur didalamnya juga ikutan berubah ?. Untuk sebagian masih tetap sama dan yang berbeda adalah pada aplikasi Rapidminer yang terbaru ini kalian sudah bisa menggunakan fitur Auto Model dan Turbo Prep pada lisensi education studendt, yang dimana pada versi-versi sebelumnya jika ingin menggunakan fitur tersebut harus membeli versi bussines terlebih dahulu.

Namun disamping itu kali ini saya akan sedikit memberikan mengalaman saya terkait mengatasi missing vealur dengan cara imputasi yang diterapkan menggunakan algoritma k-NN (k-nearest neighbor).

Nah, pada artikel saya sebelumnya yang pernah saya tuliskan adalah cara mengatasi dengan replace missing value pada cara tersebut kita hanya bisa mengatasi missing value jika data yang hilang tidak lebih dari 30%. 

Perbedaan dari cara ini adalah kita bisa memadukan teknik imputasi dengan algoritma knn, yang nantinya akan mengambil nilai k terdekat dari data aslinya. teknik ini juga bisa mengatasi missing value yang lebih dari 30% data yang hilang. Nah langsung saja kita bahas cara-caranya dibawah ini.

Cara Imputasi kNN pada Rapidminer Studio

1. Tahap Pertama

Persiapkan dataset kamu terlebih dahulu, dan sebagai catatan kecil set data yang harus kamu persiapkan adalah sebuah data yang sudah memenuhi kaidah klasifkasi prediksi, yaitu ada satu spesial atribut yang dijadikan kelas/tupel/label.

Baca Juga : Himpunan Data dan Macam-Macam Fitur dalam Machine Learning

Setelah itu, Impor Dataset kedalam Local Repository. Jika kamu belum bisa mengimpor data silahkan cara artikel saya tentang mengimpor data di halaman Tutorial -- Rapidminer.

2. Tahap Kedua

Tahap selanjutnya adalah kamu persiapkan Operators yang bernama Impute Missing Value. Lalu klik 2x atau drag atau seret ke halaman proses.

Impute Missing Value With k-NN

Kemudian pada operators tersebut klik dua kali 2x. Setelah muncul halaman proses baru kamu cari Operators k-NN kemudian kamu sambungkan seperti gambar dibawah ini. Dan jika kamu ingin kembali ke halaman awal kamu tinggal klik menu Process.

Impute Missing Value With k-NN

Selain itu, kamu juga bisa mengatur parameter-parameter taham imputasi tersebut. Seperti kamu ingin mengimputasi hanya beberapa atribut saja, atau kamu lakukan imputasi pada semua atribut atau berdasarkan isi datanya pada kotak dialog Parameters yang ada pada sisi kanan halaman proses.

Impute Missing Value With k-NN

3. Tahap Ketiga

Setelah itu, tahap terakhir adalah kamu sambungkan semua Operators seperti pada gambar dibawah ini

Impute Missing Value With k-NN

.Nah, setelah itu kamu tinggal klik Run atau jalankan proses tersebut. Maka kemudian Rapidminer akan menampilkan hasil dari proses imputasi menggunakan k-NN.

Apabil kamu ingin mengekspornya dalam bentuk Excel / CSV. Kamu tinggal menambahkan Operators Write Excel atau  Write CSV. Selanjutnya kamu tentukan nama file ekspornya dan lokasi penyimpananya pada Parameters di sebelah sisi kanan halaman proses. kemudian sambungkan seperti ini.

Impute Missing Value With k-NN

Hasil akhirnya akan ditampilkan dan file ekspor akan otomatis tersimpan di lokasi penyimpanan yang sudah kamu tentukan.

Tahap Tambahan

Nah, pada tahap tambahan ini akan saya informasikan pada ternyata kita juga bisa menggabungkan teknik imputasi ini dengan tahapan atau penerapan cross validation untuk mencari informasi akurasi, presisi dan recall guna untuk mengetahui performa dari teknik imputasi tersebut.

Caranya kamu hanya tinggal menambahkan operators Cross Validation seperti yang terlihat pada gambar dibawah ini

Impute Missing Value With k-NN

Untuk mengetahui teknik-tenik dari penerapan Cross Validation kamu bisa membaca artikel saya di bawah ini 

Baca Juga : Tutorial Belajar Rapidminer Uji Model dengan Cross Validation

Kesimpulan

Teknik Imputasi Missing Value ini ternyata bisa juga diterapkan sebagai teknik imputasi k-NN dimana teknik ini berfungsi sebagai data cleansing atau masuk pada tahapan pra-proses data.

Dan sebagai catatan lain, bahwasanya tahap-tahap yang saya tuliskan diatas adalah berdasar pada pengalaman pribadi saya. Jika kamu masih ragu dan belum yakin, alangkah baiknya kamu konsultasikan dulu kepada guru pembimbing atau yang benar-benar ahlinya.

Terimakasih, semoga bermanfaat dan kamu bisa menemukan apa yang kamu cari. "Jangan lupa bernafas dan tetap bahagia dalam tautan rasa syukur".

Wassalamulaikum Wr.Wb,  Sampai Jumpa