Tutorial Rapidminer Menghapus Atribut Missing Value
Assalamualikum Wr.Wb, Salam Sejahtera dan Salam Budaya
Pada suatu penelitian yang akan memanfaatkan atau mengimplentasikan ilmu data (data science) entah itu di bidang statistika maupun di bidang data mining, pastinya kalian akan bergulat dengan yang namanya data.
Pada suatu data yang besar sering kali akan diperoleh data yang missing atau tidak diketahui nilainya. Nah bagaimana mengatasinya ? . Pada beberapa penelitian yang sudah ditulis di jurnal nasional, ada beberapa cara sepeti menghapus, melakukan imputasi, atau ada juga yang membiarkan data tetap missing.
Baca Juga : Algoritma yang cocok untuk kasus missing value
Pada artikel ini saya akan memberikan kalian pengalaman yang beredukasi tentang bagaimana cara menghapus atribut data yang missing value menggunakan aplikasi rapidminer ?.
Pada saat penghapusan atribut data yang missing perlu diketahui tahap ini tidak sembarangan. Data yang akan dihapus harus dipastikan kurang lebih yang memiliki missing value 50 % dari set data original.
Oke langsung saja kita ketahap pertama.
1. Persiapan Data
Pastikan anda sudah mengimpor data kalian dan jika sudah terimpor ke dalam aplikasi rapidminer maka selanjutnya cek atribut mana yang mengalami missing value. contoh
- Pada bagian kotak dialog operator pilih filter example. Kemudian Drag atau seret kehalaman Proses dan sambungkan dengan data set yang sudah di letakkan dihalaman proses.
3. Atur Parameters
- Kemudian atur parameternya dengan cara klik operators filter example dan pilih add filters
- Setelah itu akan terbuka kotak dialog baru, dan disitulah atur dan pilih atribut yang mengalami missing value. Dalam contoh atribut yang akan hapus adalah atribut IPS_S2 dan IPS_S3 karena sudah mencapai hampir 50% total missing dari jumlah set data original
4. Sampungkan Operators
- Langkah Terakhir adalah menyambungkan semua operator
- Selanjutnya adalah klik button Play atau mulai prosessnya
- Kemudian Lihat Result History perbedaan antara set data original dan set data yang sudah di filter.
Jumlah Set Data yang sudah di Filter Example |
Jumlah Set Data Original |
- Dan Lihat Result History dibagian statistik. Maka pada bagian Missing dari atribut yang sudah di Filter Nilainya adalah Nol.
Nah, Selesai sudah dan sudah selesai teman-teman, gimana ribet atau simple. Ya itu semua tergantung sudut pandang kalian sendiri. Sejauh mana anda mau belajar dan terus melangkah kedepan
.
.
"Jangan Lupa Bernafas dan Tetap Bersyukur"
Wassalamualikum Wr. Wb
See You.