k-NN atau kepanjangan dari k-Nearest Neighbor adalah sebuah algoritma klasifikasi dari sebuah pembelajaran supervised learning. Algoritma ini juga termasuk dalam model prediktif di dalam ilmu data mining itu disebabkan karena proses klasifikasinya harus terdapat atribut label atau kelasnya.
Proses atau tahapan dari perhitungan algoritma k-Nearest Neighbor adalah melakukan proses normalisasi dan menentukan Euclidean Distance dan memasukkan nilai k guna memperoleh hasil terdakat dari nilai itu sendiri.
Pada artikel yang akan saya tuliskan disini adalah proses perhitungan algoritma k-NN dengan menggunakan microsoft excel dengan mudah agar bisa memberikan kamu pengalaman edukasi mengenai bagaimana cara menghitung algoritma k-NN di excel.
Proses Perhitungan k-NN dengan Excel.
1. Persiapan Data
Tahap pertama adalah kamu harus menyiapkan data latih terlebih dahulu, apa itu data latih ? data latih adalah data atau informasi yang diambil dari waktu sebelumnya yang sudah di ketahui kelas atau labelnya. Misalnya ; Jika kamu ingin mengklasifikasi untuk memprediksi Lulus atau Tidak nya siswa maka kamu harus mencari informasi data siswa yang Lulus dan Tidak Lulus di tahun-tahun sebelumnya.
Nah, berikut adalah contoh dari data latih yang akan di klasifikasikan dengan algoritma k-NN.
Data latih yang saya gunakan diatas memiliki 6 atribut data yang bertipe numerik. Dan untuk atribut kelasnya saya menggunakan angka 1 untuk kategori Keluar dan angka 2 untuk Lulus.
2. Hitung Normalisasi
Tahap selanjutnya adalah kamu buat tabel untuk perhitungan normalisasinya. Rumus dari normalisasinya sendiri adalah
Dimana data x adalah baris pertama dari satu atribut data latih, kemudian data min adalah nilai terkecil dari seluru data pada atribut x berlaku juga untuk data max yang mencari nilai terbesar dari semua atribut data x. Dibawah ini adalah contoh dari perhitungan atribut Jumlah MK dari baris kesatu.
=( Baris 1 atribut Jumlah MK - MIN(Blok Kolom Jumlah MK ) / ( MAX(Blok Kolom Jumlah MK) - MIN(Blok Kolom Jumlah MK ).
atau dalam rumus manual seperti dibawah ini
Baris kesatu atribut Jumlah MK = 60
Angka minimal = 35
Angka Maksimal = 66, maka
=(60-35) / (66-35)
Lakukan perhitungan tersebut pada masing-masing semua atribut, dan pastikan hasil yang diperoleh interval antara angka 0 s/d 1 seperti hasil yang sudah saya peroleh dibawah ini.
3. Euclidean Distance atau jarak
Tahap selanjutnya adalah menghitung jarak euclidean, adalah dengan rumus seperti
Xi adalah data yang atributnya sudah di normalisasi dan
Yi adalah data uji baru selain data latih.
Dengan memperhatikan konsep rumus diatas maka kita harus memiliki data uji baru untuk di klasifikasikan jarak eulicedan-nya. Data uji diperoleh dari mana ? Data uji bisa diperoleh dari data baru yang belum di ketahui hasil kelas nya. Contoh data uji yang akan saya hitung.
Jumlah MK = 50, ACsensi = 48,00, Jumlah SKS 1-3 = 100, IPS S1 = 2, IPS S2 = 2.1, IPS S3 = 1.5
Data diatas adalah data uji atau data baru yang belum diketahui atribut kelasnya yaitu Lulus atau Tidak Lulus. Untuk penulisan Formula atau Rumus excelnya adalah sebagai berikut.
=SQRT((Baris satu normalisasi atribut Jumlah MK - Nilai Data uji atribut Jumlah MK)^2 + rumus yang sama untuk atribut yang lainnya. Contoh ;
Baca Juga :Source Code Sistem Informasi Algoritma k-NN Menggunakan PHP&MySQL
Lakukan perhitungan tersebut pada semua data dari masing-masing barisnya. Dan dibawah ini adalah contoh tabel hasil perhitungan Euclidean Distance.
4. Menghitung nilai k atau nilai tetangga terdekat.
Tahapan ini adalah menentukan atau pemilihan nilai distance terkecil yang masuk peringkat sejumlah nilai k. Misalnya jika nilai k adalah 2 maka harus mencari nilai distance terkecil sebanyak dua nilai.
Contoh : Nilai k = 1 maka kita ambil satu nilai distance terkecil yaitu 120.393 dan nilai ini memiliki atribut kelas nomor 2 maka statusnya adalah Lulus (Lihat Tabel Diatas)
Bagaimana menentukan atribut kelasnya ?. Untuk menentukan atribut kelasnya maka kita hanya memvoting dari semua nilai k yang telah ditentukan. Untuk Formula / Rumus Excelnya adalah seperti ini.
=IF(Baris satu nilai Distance <= SMALL(Blok semua kolom disctance, Nilai k), Baris satu atribut Kelas, "")
Contoh dengan nilai k = 1
=IF(120,52 <= SMALL(Blok baris satu sampai terakhir, 1), kolom atribut kelas baris 1, "") hasilnya jika bukan nilai terkecil maka kolom akan kosong dan jika nilai nya adalah nilai terkecil maka akan muncul atribut kelas nya.
Tabel dibawah ini adalah contoh penentuan nilai k = 1, k = 5 dan k = 9.
Dengan 4 tahap perhitungan k-NN dengan menggunakan excel maka selesai sudah proses perhitungannya. Nah, sedangkan untuk menentukan hasil akhirnya adalah kamu voting atribut kelas mana yang paling banyak muncul. Contoh diatas menunjukkan bahwa atribut kelas nomor 2 atau Lulus yang paling banyak muncul.
Dengan begitu maka dapat disimpul kan bahwa suatu data dengan nilai
Jumlah MK = 50, ACsensi = 48,00, Jumlah SKS 1-3 = 100, IPS S1 = 2, IPS S2 = 2.1, IPS S3 = 1.5
Maka hasilnya prediksinya adalah Lulus.
Nah itulah cara penyelesaian masalah pada proses perhitungan Algoritma k-NN dan jika kamu ingin belajar lebih dalam lagi, kamu bisa mendapatkan file excelnya.
Selesai sudah dan sudah selesai, itulah cara menghitung algoritma k-NN menggunakan Ms. Excel dengan mudah dan cepat. Sekian, dan terimakasih sudah berkunjung dan belajar bersama Pengalaman-Edukasi, Semoga bermanfaat karena Sistemku adalah Informasimu.