Skip to content Skip to sidebar Skip to footer

Machine Learning dan Supervised Learning


Apa itu Machine Learning


MATERI 3. APA ITU MACHINE LEARNING ?

Machine Learning adalah suatu area dalam kecerdasan buatan atau artificial intelligence yang saling berhubungan dengan teknik-teknik yang dikembangkan serta bisa diprogramkan dan belajar dari kejadian-kejadian yang sudah terlewatkan. Pengenelan pola, data mining dan machine laearning sering dipakai untuk menyebut sesuatu yang sama. Bidang ini juga sedikit saling berhubungan dengan ilmu statistic, kadang juga optimasi dan ilmu probability.

Berikut ini adalah perbedaan-perbedaan yang bisa diberikan. Iini pun tidak secara jelas membedakan karena masih ada titik yang saling bersinggungan.

     • Statistic : lebih berdasarkan teori-teori dan lebih fokus pada pengujian hipotesis

     • Machine Learning : lebih bersifat heuristic, fokus pada perbaikan performansi dari suatu teknik learning, juga meliputi real-time learning dan robotic area yang tidak termasuk dalam data mining

   • Data mining : gabungan teori dan heuristic, fokus pada seluruh penemuan knowledge atau pola temasuk data cleaning, learning dan visualisasi dari hasilnya.
Jadi dari ketiga perbedaan diatas, secara berurutan yang harus dipahami pertama adalah ilmu statistic, kemudian memehami teknik dari machine learning yang nantinya akan bermanfaat untuk proses, penentuan guna untuk ke tahap ilmu data mining.

Sebelum kita mempelajari teknik-teknik yang dgunakan dalam data mining, ada baiknya kita bedakan dulu meode belajar (learning) secara garis besar kedalam dua pendekatan.

1. UNSUPERVISED LEARNING

Adalah metode yang diterapkan tanpa adalanya latihan (training), dan tanpa adanya guru (teacher). Dalam proses data mining unsupervised learning melakukan pengamatan atau data tanpa adanya label/kelas/keputusan. Biasanya dalam metode ini juga termasuk kategori tugas data mining antara lain teknik klastering dan asosiasi.

2. SUPERVISED LEARNING

Yaitu metode belajar berbanding terbaik dengan teknik diatas. Pada metode ini harus ada pelatihan atau training dan pelatih atau lebel/kelas. Banyak teknik dalam algoritma masuk dalam kategori ini. Sebagai contoh algoritma logistic regresi, suppor vector machine, serta dari algoritma dari klasifikasi seperti naïve bayes, decision tree, dan artificial neural network. 

Dalam pendeketan ini, untuk menentukan fungsi keputusan kita menggunakan beberapa data yang mempunyai output label yang akan digunakan untuk proses training atau pelatihan.

Selanjutnya, fungsi atau model yang sudah ditentukan selama proses training, kita uji dengan set data validasi. Jika performa pada saat validasi atau testing belum memenuhi harapan, kita bisa mengatur nilai parameter model lagi. Untuk proses bisa dilihat pada gambar dibawah ini.

proses supervised learning


Untuk mengetahui seberapa bagus model learning, kita perlu mengukur performansinya. Untuk kasus supervised learning, pengukuran performa sangat penting untuk membandingkan proses training dengan ground truth labelnya. Untuk kasus ini alat yang digunakan mengukur performa palig popular adalah menggunakan Confusion Matrix. Apa itu ? ikuti terus ke materi selanjutnya, MATERI 4. Confusion Matrix Table.

Satu Kata " Jangan Lupa Bernafas dan Tetap Bersyukur "
See You