Cara Imputasi k-NN Menggunakan Rapidminer Studio
Assalamualaikum Wr. Wb, Salam Sejahtera dan Salam Budaya
Oke, mungkin kalian akan menemukan perbedaan sedikit dengan aplikasi Rapidminer Studio pada vers 9.10 ini. Iya Rapidminer saat ini telah mengubah logonya dari totalitas warna orange menjadi warna ungu tua atau biru tua atau apalah itu, pokoknya warnanya sekarang sudah jauh berbeda dengan versi-versi sebelumnya.
Lantas apakah fitur-fitur didalamnya juga ikutan berubah ?. Untuk sebagian masih tetap sama dan yang berbeda adalah pada aplikasi Rapidminer yang terbaru ini kalian sudah bisa menggunakan fitur Auto Model dan Turbo Prep pada lisensi education studendt, yang dimana pada versi-versi sebelumnya jika ingin menggunakan fitur tersebut harus membeli versi bussines terlebih dahulu.
Namun disamping itu kali ini saya akan sedikit memberikan mengalaman saya terkait mengatasi missing vealur dengan cara imputasi yang diterapkan menggunakan algoritma k-NN (k-nearest neighbor).
Nah, pada artikel saya sebelumnya yang pernah saya tuliskan adalah cara mengatasi dengan replace missing value pada cara tersebut kita hanya bisa mengatasi missing value jika data yang hilang tidak lebih dari 30%.
Perbedaan dari cara ini adalah kita bisa memadukan teknik imputasi dengan algoritma knn, yang nantinya akan mengambil nilai k terdekat dari data aslinya. teknik ini juga bisa mengatasi missing value yang lebih dari 30% data yang hilang. Nah langsung saja kita bahas cara-caranya dibawah ini.
Cara Imputasi kNN pada Rapidminer Studio
1. Tahap Pertama
Persiapkan dataset kamu terlebih dahulu, dan sebagai catatan kecil set data yang harus kamu persiapkan adalah sebuah data yang sudah memenuhi kaidah klasifkasi prediksi, yaitu ada satu spesial atribut yang dijadikan kelas/tupel/label.
Baca Juga : Himpunan Data dan Macam-Macam Fitur dalam Machine Learning
Setelah itu, Impor Dataset kedalam Local Repository. Jika kamu belum bisa mengimpor data silahkan cara artikel saya tentang mengimpor data di halaman Tutorial -- Rapidminer.
2. Tahap Kedua
Selain itu, kamu juga bisa mengatur parameter-parameter taham imputasi tersebut. Seperti kamu ingin mengimputasi hanya beberapa atribut saja, atau kamu lakukan imputasi pada semua atribut atau berdasarkan isi datanya pada kotak dialog Parameters yang ada pada sisi kanan halaman proses.
3. Tahap Ketiga
Setelah itu, tahap terakhir adalah kamu sambungkan semua Operators seperti pada gambar dibawah ini
.Nah, setelah itu kamu tinggal klik Run atau jalankan proses tersebut. Maka kemudian Rapidminer akan menampilkan hasil dari proses imputasi menggunakan k-NN.
Apabil kamu ingin mengekspornya dalam bentuk Excel / CSV. Kamu tinggal menambahkan Operators Write Excel atau Write CSV. Selanjutnya kamu tentukan nama file ekspornya dan lokasi penyimpananya pada Parameters di sebelah sisi kanan halaman proses. kemudian sambungkan seperti ini.
Tahap Tambahan
Nah, pada tahap tambahan ini akan saya informasikan pada ternyata kita juga bisa menggabungkan teknik imputasi ini dengan tahapan atau penerapan cross validation untuk mencari informasi akurasi, presisi dan recall guna untuk mengetahui performa dari teknik imputasi tersebut.
Caranya kamu hanya tinggal menambahkan operators Cross Validation seperti yang terlihat pada gambar dibawah ini
Untuk mengetahui teknik-tenik dari penerapan Cross Validation kamu bisa membaca artikel saya di bawah ini
Baca Juga : Tutorial Belajar Rapidminer Uji Model dengan Cross Validation
Kesimpulan
Teknik Imputasi Missing Value ini ternyata bisa juga diterapkan sebagai teknik imputasi k-NN dimana teknik ini berfungsi sebagai data cleansing atau masuk pada tahapan pra-proses data.
Dan sebagai catatan lain, bahwasanya tahap-tahap yang saya tuliskan diatas adalah berdasar pada pengalaman pribadi saya. Jika kamu masih ragu dan belum yakin, alangkah baiknya kamu konsultasikan dulu kepada guru pembimbing atau yang benar-benar ahlinya.
Terimakasih, semoga bermanfaat dan kamu bisa menemukan apa yang kamu cari. "Jangan lupa bernafas dan tetap bahagia dalam tautan rasa syukur".
Wassalamulaikum Wr.Wb, Sampai Jumpa