Cara menggunakan Logistic Regression (SVM) Rapidminer Tutorial
how to implement logistic regression algorithm with rapidminer studio?
Okay friends, in this article I will write an experience that is useful for those of you who are still reaching educational goals
Salam Sejahtera dan Salam Budaya.
Dewasa ini dalam pembelajaran supervised learning telah mempelajari teori atau algoritma SVM atau Support Vector Machine untuk kasus klasifikasi. Dalam bagian ini akan dibahas penerapan SVM untuk kasus regresi atau bisa juga disebut dengan Support Vector Regresi (SVR). Dalam kasus klasifikasi set data yang kita miliki Output data berupa bilangan diskrit atau polynominal. Sedangkan dalam kasus regresi, output data berupa bilangan rill atau kontinyu. Dalam tahap implementasi, perbedaan ini harus diperhatikan manakala harus memilih antara klasifikasi atau regresi.
Baca Juga : Pemahaman tentang Machine Learning , Supervised Learnig dan Unsupervised Learning
Regresi Logistik atau dalam bahasa inggris adalah Logistic Regression sebenarnya bukanlah metode untuk memecahkan permasalahan regresi, melainkan klasifikasi. Seperti yang sudah di jelaskan di atas, bahwa permasalahan regresi memiliki output nilai yang kontinyu, sedangkan permasalahan klasifikasi memiliki nilai output yang diskrit. Logostic Regression adalah pengembangan dari metode regresi yang digunakan untuk memecahkan permasalahan klasifikasi.
Asal ide dari Logistic Regression adalah ditujukan untuk menyelesaikan permasalahan klasifikasi dengan dua kelas (binary classification). Kali ini saya akan menuliskan sebuah tulisan tentang bagaimana cara menerapkan atau menggunakan algoritma Logistic Regression atau Regresi logistik dengan Rapidminer Studio.
Tulisan ini akan sangat bermanfaat untuk kamu yang masih berjuang menggapai cita-cita. Pengalaman edukasi yang kamu dapatkan ini semoga benar dan tidak keliru. Oke, langsung saja kita cuss
Pertama-tama kalian harus mempunyai software aplikasi rapidminer studio . Jika kalian belum punya aplikasinya kalian bisa unduh dilaman resminya.
1. Pertama, kamu harus dan sangat diharuskan sudah menyiapkan set data latih untuk proses klasifikasi dan selanjutnya set data tersebut sudah terimpor di dalam Repository. Jika belum bisa lakukan impor kamu bisa belajar tutorial nya disini 👇-----
2. Kedua, jika sudah terimpor kamu seret dataset ke lembar halaman proses.
3. Selanjutnya, kamu fokus pada kotak atau sidebar Operators kamu cari dan temukan menu-menu diantaranya, Split Data, Logistic Regression (SVM), Apply Model & Performance.
- Logistic Regression SVM (example model algorithm)
- Apply Model (For Modelling)
- Performance (performance measure )
- Split Data (to distribute training data and test data )
- Atur tipe samplingnya sesuai kebutuhan. Klik edit enumeration untuk mendistribusikan data latih dan data uji (to distribute training data and test data)
- Langkah pertama pilih Add Entry kemudian isikan berapa presentase data latih yang akan diambil (tulis dalam bentuk desimal)
- Langkah kedua pilih lagi Add Entry tentukan presentase data yang akan dijadikan set data uji
- Kemudian klik Apply & Ok
- Ex : distribute training data and test data