Tutorial Rapidminer Cara Optimasi 2 Model Algoritma
when we are doing comparisons for the performance of an algorithm we will also need a proper way to find out the results. So, here's how to optimize two classification algorithm models in one process in Rapidminer Studio.
Assalamualaikum Wr. Wb, Salam Sejahtera dan Salam Budaya
Pada artikel ini saya akan membagikan suatu pengalaman edukasi tentang cara mengoptimalkan dua model algoritma klasifikasi guna untuk melakukan perbandingan tingkat performanya. Ada berbagai cara untuk hal tersebut, diantaranya adalah dengan menggunakan fitur Auto Model yang sudah tersedia di Rapidminer Studio Versi Premium yang biasaya digunakan untuk para pakar data science.
Baca Juga : How to use Auto Optimization using the Auto Model feature ?
Pengalaman yang saya berikan ini, terkhusus untuk para adik-adik yang sedang duduk di bangku kuliah untuk menggapai cita-citanya, namun terkadang juga terkendala malasah biaya. Oleh karena itu tulisan ini akan membahas tentang optimasi dua model algoritma dalam satu proses di Rapidminer Studio
1. Pertama yang harus lakukan adalah set data latih sudah terimpor di Repository dalam aplikasi Rapidminer studio. Jika belum bisa melakukan, kamu bisa membaca tutorialnya disini---
2. Next, kamu drag atau seret set data latih kalian yang sudah terimpor ke dalam halaman proses yang ada ditengah itu.
3. Selanjutnya, pada menu atau sidebar sebelah kiri di kotak Opeartors kalian cari menu-menu yang akan diproses diantaranya
- Decision Tree & Naive Bayes (example model algorithm)
- Apply Model (For use the model)
- Performance (performance measure )
- Split Data (to distribute training data and test data )
- Sambungkan retrieve set data kamu dengan operator split data kemudian atur paramter nya dengan cara klik 2x operator split data dan langsung fokuslah pada sidebar sebelah kanan
- Atur tipe samplingnya sesuai kebutuhan
- Klik edit enumeration untuk mendistribusikan data latih dan data uji (to distribute training data and test data)
- Langkah pertama pilih Add Entry kemudian isikan berapa presentase data latih yang akan diambil (tulis dalam bentuk desimal)
- Langkah kedua pilih lagi Add Entry tentukan presentase data yang akan dijadikan set data uji
- Ex : distribute training data and test data
7. Tahapan terkahir kamu hubungkan lagi dengan operator Performance 1 dan 2 sesuai dengan Apply Model 1 dan 2. Dan kemudian jalankan atau running
- Untuk performance vector 2 adalah hasil dari algoritma Naive Bayes sedangkan
- Untuk perfomance vector adalah hasil dari algoritma Decision Tree