Skip to content Skip to sidebar Skip to footer

Tutorial RapidMiner Teknik Sampling Data

Berikut cara atau teknik sampling data menggunakan aplikasi rapidminer studio dengan tiga metode
  1. Linier Sampling
  2. Stratified Sampling dan,
  3. Shuffeld Sampling

Assalamualikum Wr. Wb
Jadi,, Bisa kita mem filter atau menyampling banyak data menggunakan rapidminer ?

Sebelum kita ke tahap menggunakan aplikasinya, saya akan menjelaskan sedikit tentang apa itu Linier sampling, Stratified Sampling dan Shuffeld Sampling.

Stratified Sampling, adalah digunakan pada populasi berkelompok, pemilihan sampel dilakukan secara acak dan terstruktur pada masing-masing kelompok.

Linear Sampling, adalah teknik pengambilan sampel yang hanya membagi sampel set menjadi partisi tanpa mengubah urutan .

Shuffled Sampling, adalah pengambilan sampel secara acak membuat subset acak dari sebagian contoh data.

Dari sedikit penjelasan diatas, maka sekarang bagaimana cara menggunakannya ? ... Kita akan membahas atau memakai aplikasi rapidminer untuk ketiga teknik tersebut. Berikut tahapan-tahapan yang harus kalian lakukan.

1. Persiapan Data
Persiapan data ini adalah kalian harus menyiapkan data yang akan disampling atau di ambil sampelnya yang sudah kalian impor kedalam kotak Repository. Jika sudah siap maka Drag atau seret kehalaman kerja. 
Split Data Rapidminer


2. Operators Split Data
Selanjutnya, pergi ke kotak Operators kemudian tuliskan "sampling" dan pilih Split Data . Jika sudah siap Drag atau seret ke halaman proses dan sambungkan dengan data sampel.


Split Data Rapidminer


Operator Split Data Rapidminer

3. Pilih Metode Sampling
Klik pada kotak Split Data kemudian pergi ke kotak Parameters. Maka disitulah pilih metode yang kalian inginkan.
Parameter Split Data Rapidminer
4. Atur atau set jumlah sampel data
setelah berhasil memilih tipe atau metode sampling selanjutnya tentukan jumlah data sampel yang diambil pada menu button Edit Enumeration maka akan muncul kotak dialog seperti ini.


Split Data Rapidminer

Kemudian Add Entry kemudain Ok.  Maksud dari 0.9 adalah data sampel yang akan diambil dari teknik sampling dan nilai 0.1 adalah sisa jumlah atau data yang tidak akan di ambil sampelnya.

Langkah terakhir adalah sambungkan semua Operators dan klik start, maka selesai sudah hasil akan muncul, dan kalian akan mengucapkan terimakasih untuk tutorial yang sudah saya berikan.

Setelah kita sampling apakah kita biarkan seperti itu,apakah perlu kita ekspor menjadi file excel,? 

sekian, itulah sedikit pengalaman saya yang bisa saya bagikan, Terimakasih sudah percaya dan mau belajar disini, satu kata "Jangan Lupa Bernafas dan Tetap Bersyukur".
See You.