Langsung ke konten utama

Unggulan

Metric untuk Mengevaluasi Model Machine Learning

  Agar dapat menentukan model mana yang paling baik dari beberapa model yang telah dibuat dalam machine learning dapat menggunakan salah satu teknik yaitu confusion matrix.  Confusion Matrix  Confusion matrix juga sering disebut error matrix. Pada dasarnya confusion matrix memberikan informasi perbandingan hasil klasifikasi yang dilakukan oleh sistem (model) dengan hasil klasifikasi sebenarnya. Confusion matrix berbentuk tabel matriks yang menggambarkan kinerja model klasifikasi pada serangkaian data uji yang nilai sebenarnya diketahui. True Positive (TP)              Merupakan data positif yang diprediksi benar.  True Negative (TN)              Merupakan data negatif yang diprediksi benar.  False Postive (FP) — Type I Error              Merupakan data negatif namun diprediksi sebagai data positif.  False Negative (FN) — Type II Error ...

Machine Learning dengan model klasifikasi Support Vector Machine (SVM)

 


Support Vector Machine (SVM)

Support Vector Machine (SVM) merupakan salah satu metode dalam supervised learning yang biasanya digunakan untuk klasifikasi (seperti Support Vector Classification) dan regresi (Support Vector Regression). Dalam pemodelan klasifikasi, SVM memiliki konsep yang lebih matang dan lebih jelas secara matematis dibandingkan dengan teknik-teknik klasifikasi lainnya. SVM juga dapat mengatasi masalah klasifikasi dan regresi dengan linear maupun non linearSVM digunakan untuk mencari hyperplane terbaik dengan memaksimalkan jarak antar kelas. Hyperplane adalah sebuah fungsi yang dapat digunakan untuk pemisah antar kelas. 
  • Apabila atribut ada 1 pemisahnya berupa titik
  • Apabila atribut ada 2 pemisahnya berupa garis
  • Apabila atribut ada 3 pemisahnya berupa bidang
  • Apabila atribut >/ 4  pemisahnya berupa hyperplan. 
Hyperplane yang ditemukan SVM diilustrasikan seperti Gambar 1 posisinya berada ditengah-tengah antara dua kelas, artinya jarak antara hyperplane dengan objek-objek data berbeda dengan kelas yang berdekatan (terluar) yang diberi tanda bulat kosong dan positif. Dalam SVM objek data terluar yang paling dekat dengan hyperplane disebut support vector. Objek yang disebut support vector paling sulit diklasifikasikan dikarenakan posisi yang hampir tumpang tindih (overlap) dengan kelas lain. Mengingat sifatnya yang kritis, hanya support vector inilah yang diperhitungkan untuk menemukan hyperplane yang paling optimal oleh SVM.


Dari contoh diatas, didapatkan plot contoh data yang dijelaskan pada Gambar 2.

Pada Gambar 2 menjelaskan bahwa terdapat 2 kelas yang terdiri dari -1 ditunjukkan dengan warna biru dan 1 ditunjukkan dengan warna orange. Pada masing-masing titik tersebut digunakan untuk mencari pemisah antara data positif dan data negatif. Penyelesaian sebagai berikut :
Diketahui :
Dengan syarat :
yi(xi . w +b) -1 ≥ 0, i = 1,2,3,….,n
yi(x1.w1 + x2.w2 + b) ≥ 1

sehingga ditemukan persamaan sebagai berikut:
  • (𝑀1 + 𝑀2 + 𝑏 ) ≥ 1 untuk y1 = 1, x1=1, x2=1
  • (−𝑀1 + 𝑀2 − 𝑏 ) ≥ 1 untuk y2 = -1, x1=1, x2=-1
  • (𝑀1 − 𝑀2 − 𝑏 ) ≥ 1 untuk y3 = -1, x1=-1, x2=1
  • (𝑀1 + 𝑀2 − 𝑏 ) ≥ 1 untuk y1 = -1, x1=-1, x2=-1

Berdasarkan persamaan diatas, maka didapatkan nilai dari setiap variabel. Dari persamaan 1 dan 2 didapatkan:


Komentar

Postingan Populer