Tutorial Rapidminer Menentukan Cluster KMeans
Assalamualikum Wr. Wb, Salam Rahayu dan Salam Budaya
Cluster atau yang biasa kita kenal sebagai clustering merupakan salah atu teknik algoritma dari machine learning yang bertipe unsupervised learning. Dimana teknik ini tidak membutuhkan kelas atau tupel sebagai hasil keputusan yang dibuat, melainkan cara kerjanya yaitu membagi populasi data dengan sifat yang sama ke beberapa kelompok kecil untuk dikelompokkan.
Teknik dari cluster ini biasa digunakan oleh perusahaan untuk melakukan segmentasi kepada customer guna untuk meningkatkan penjualannya. Salah satu metode yang kerap digunakan adalah Kmeans Clustering.
K-Means Clustering
KMeans Clustering adalah sebuah metode iteratif yang digunakan untuk mengelompokkan kumpulan data ke dalam klaster yang sebelumnya telah ditentukan. Nah, inilah cara kerja dari KMeans Clustering yang terbagi menjadi 4 bagian.
- Menentukan nilai dari klaster K(nilai K adalah nilai sembarang yang bisa ditentukan, layaknya menentukan nilai K pada algoritma k-NN.)
- Menempatkan data point ke setiap cluster yang ada
- Menentukan centroid dengan mengacak atau teknik sampling set data yang ada dan juga secara acak menentukan nilai K data point untuk tempat centroid
- Hal ini dilakukan sacara berulang hingga tidak lagi ada perubahan pada centroids
- Setelah didapatkan hasil akhir dari KMeans clustering, maka dilakukan evaluasi.
Namun perlu diperhatikan juga jika kamu menggunakan aplikasi Rapidminer Studio, hal pertama yang harus kamu ketahui adalah kamu harus paham betul dasar-dasar dari algoritma, model, dan metode dari Machine Learning dalam contoh ini adalah algoritma KMeans yang sudah saya jelaskan secara singkat diatas.
Daripada semakin ribet kamu membaca tulisan yang telah saya tuliskan ini yang pada dasarnya hanya untuk mengisi kata-kata agar memenuhi setandar SEO yuk langsung saja kita bahas tutorialnya berikut ini;
Tutorial Rapidminer Studio
Tahap Pertama
kamu harus dan sangat harus mempunyai set data yang akan dilakukan klaster untuk proses selanjutnya dan juga sudah terimpor di dalam Repository. Jika belum bisa lakukan impor kalian bisa baca di tutorial dibalik ini 👉----
Tahap Kedua
kamu seret set data yang sudah terimpor ke halaman proses
Tahap Ketiga
Tahap selanjutnya alihkan pandanganmu ke dalam Kotak Dialog Operators dan kamu cari masing-masing operators antara lain KMeans, Evaluation, SVDReduction. Keemudian masing-masing kamu seret ke halaman proses atau kamu juga bisa klik 2x.
Tahap Ke-Empat
Setelah berhasil menemukan masing-masing operators selanjutnya kamu sambungkan semua operator seperti
- Set data dengan KMeans
- Kemudian untuk KMeans kamu sambungkan dengan Evaluation.
- KMeans clu atas kamu sambungkan dengan Evaluation clu
- KMenas clu kedua kamu sambungann dengan Evaluation exa
- Tahap selanjutnya adalah kamu sambungkan semua operators seperti yang tampak pada gambar dibawah ini dan setalah itu kamu klik tombol PLAY diatas yang bewarna biru.
Kesimpulan
Setalah kamu berhasil menekan tombol PLAY Buttons yang bewarna biru tersebut, maka hasil yang akan ditampilkan 3 kategori yang meliputi SDVReduction, Perbandingan Cluster & Hasil Evaluasi KMeans. Hasil dari masing-masing tersebut juga disajikan dengan berbagai aspek visualisasi dalam bentuk tabel dan grafik.
Nah, mungkin saat ini hanya itu informasi yang bisa saya berikan dan semoga bisa bermanfaat serta memberikan kamu pengalaman yang beredukasi. Semoga kamu juga bisa menemukan apa yang kamu cari, "Jangan Lupa Bernafas dan Tetap Bahagia dalam Tautan Rasa Syukur".
Wassalamualaikum Wr.Wb, Sampai Jumpa Lagi