Skip to content Skip to sidebar Skip to footer

Tutorial Rapidminer Menghapus Atribut Missing Value



Assalamualikum Wr.Wb, Salam Sejahtera dan Salam Budaya

Pada suatu penelitian yang akan memanfaatkan atau mengimplentasikan ilmu data (data science) entah itu di bidang statistika maupun di bidang data mining, pastinya kalian akan bergulat dengan yang namanya data.

Pada suatu data yang besar sering kali akan diperoleh data yang missing atau tidak diketahui nilainya. Nah bagaimana mengatasinya ? . Pada beberapa penelitian yang sudah ditulis di jurnal nasional, ada beberapa cara sepeti menghapus, melakukan imputasi, atau ada juga yang membiarkan data tetap missing


Pada artikel ini saya akan memberikan kalian pengalaman yang beredukasi tentang bagaimana cara menghapus atribut data yang missing value menggunakan aplikasi rapidminer ?. 
Pada saat penghapusan atribut data yang missing perlu diketahui tahap ini tidak sembarangan. Data yang akan dihapus harus dipastikan kurang lebih yang memiliki missing value 50 % dari set data original. 

Oke langsung saja kita ketahap pertama.

1. Persiapan Data

Pastikan anda sudah mengimpor data kalian dan jika sudah terimpor ke dalam aplikasi rapidminer maka selanjutnya cek atribut mana yang mengalami missing value. contoh 
  1. Drag Data set ke halaman prosess
  2. sambungkan ke garis akhir
  3. Klik jalankan atau Mulai 
  4. Lihat Result History dibagian statistik
Missing Value Data Mining

2. Pilih Operator Filter Example

Missing Value Data Mining
  • Pada bagian kotak dialog operator pilih filter example. Kemudian Drag atau seret kehalaman Proses dan sambungkan dengan data set yang sudah di letakkan dihalaman proses.










3. Atur Parameters 

  • Kemudian atur parameternya dengan cara klik operators filter example dan pilih add filters
Missing Value Data Mining
  • Setelah itu akan terbuka kotak dialog baru, dan disitulah atur dan pilih atribut yang mengalami missing value. Dalam contoh atribut yang akan hapus adalah atribut IPS_S2 dan IPS_S3 karena sudah mencapai hampir 50% total missing dari jumlah set data original
Missing Value Data Mining

4. Sampungkan Operators

  • Langkah Terakhir adalah menyambungkan semua operator
Missing Value Data Mining
  • Selanjutnya adalah klik button Play atau mulai prosessnya
Running Process

  • Kemudian Lihat Result History perbedaan antara set data original dan set data yang sudah di filter.
Result
Jumlah Set Data yang sudah di Filter Example


Example
Jumlah Set Data Original

  • Dan Lihat Result History dibagian statistik. Maka pada bagian Missing dari atribut yang sudah di Filter Nilainya adalah Nol.

Nah, Selesai sudah dan sudah selesai teman-teman, gimana ribet atau simple. Ya itu semua tergantung sudut pandang kalian sendiri. Sejauh mana anda mau belajar dan terus melangkah kedepan
.
"Jangan Lupa Bernafas dan Tetap Bersyukur"
Wassalamualikum Wr. Wb
See You.