Langsung ke konten utama

Unggulan

Metric untuk Mengevaluasi Model Machine Learning

  Agar dapat menentukan model mana yang paling baik dari beberapa model yang telah dibuat dalam machine learning dapat menggunakan salah satu teknik yaitu confusion matrix.  Confusion Matrix  Confusion matrix juga sering disebut error matrix. Pada dasarnya confusion matrix memberikan informasi perbandingan hasil klasifikasi yang dilakukan oleh sistem (model) dengan hasil klasifikasi sebenarnya. Confusion matrix berbentuk tabel matriks yang menggambarkan kinerja model klasifikasi pada serangkaian data uji yang nilai sebenarnya diketahui. True Positive (TP)              Merupakan data positif yang diprediksi benar.  True Negative (TN)              Merupakan data negatif yang diprediksi benar.  False Postive (FP) — Type I Error              Merupakan data negatif namun diprediksi sebagai data positif.  False Negative (FN) — Type II Error ...

Machine Learning dengan Pendekatan Supervised Learning dan metode Regresi

Machine Learning

    Machine Learning merupakan salah satu cabang ilmu dari artificial intelligence (kecerdasan buatan). Ilmu ini berfokus untuk membuat sistem atau algoritma yang terus belajar dari data dan meningkatkan akurasinya dari waktu ke waktu tanpa pemrograman tertentu. Dalam aplikasi machine learning, algoritma atau urutan proses statistik dilatih untuk menemukan pola dan fitur tertentu dalam jumlah data yang besar. Hal ini bertujuan untuk membuat suatu keputusan maupun prediksi berdasarkan data-data tersebut. Semakin bagus algoritmanya, akurasi keputusan dan prediksi sistem akan semakin baik. Mesin yang mengolah semakin banyak data akan menghasilkan output yang makin akurat. Cara kerja machine learning sebenarnya berbeda-beda sesuai dengan teknik atau metode pembelajaran seperti apa digunakan pada machine learning. Namun pada dasarnya prinsip cara kerja pembelajaran mesin masih sama, meliputi pengumpulan data, eksplorasi data, pemilihan model atau teknik, memberikan pelatihan terhadap model yang dipilih dan mengevaluasi hasil dari machine learning.

Ada 3 pendekatan yang digunakan dalam machine learning, diantaranya:

1. Supervised Learning

2. Unsupervised Learning

3. Reinforcement Learning


Pada pembahasan kali ini kita akan memfokuskan kepada Supervised Learning

Supervised Learning

    Supervised Learning adalah model machine learning yang mengajarkan pengetahuan sehingga dapat memprediksikannya di masa mendatang. Supervised Learning mengajarkan model dan melatihnya dengan beberapa data dari dataset  yang berlabel.  Tugas khas dari supervised learning adalah memprediksi nilai numerik target, seperti harga mobil, diberikan serangkaian fitur (jarak tempuh, usia, merek, dll.) Yang disebut prediktor. Tugas semacam ini disebut regresi. Untuk melatih sistem, Anda perlu memberikan banyak contoh mobil, termasuk prediktor dan labelnya (mis, Harga mereka).

Tipe Supervised Learning ada 2 yaitu:

1. Klasifikasi yaitu proses memprediksi label atau kategori kelas diskrit.

2. Regresi yaitu proses memprediksi nilai kontinu sebagai lawan dari prediksi nilai kategorikal dalam Klasifikasi.

 

Regresi

    Regresi juga diartikan sebagai teknik yang mencari hubungan antara variabel dependen dengan variabel dependen.  Menurut Wahyono, 2018, dalam buku "Python for Machine Learning", regresi berarti analisa untuk mempelajari dan mengukur hubungan yang terjadi antara dua variabel atau lebih. Dalam regresi terdapat variabel dependen ataupun variabel terikat dan variabel independen ataupun variabel bebas.

Contoh Regresi ialah: 

- lama belajar mempengaruhi nilai

- tingkat pendidikan mempengaruhi gaji

- promosi penjualan mempengaruhi barang yang terjual 


Jenis-jenis Regresi 

  • Regresi Linear Sederhana (Simple Regression)
  • Regresi Multilinear (Multiple Regression)
  • Regresi Polynomial (Polynomial Regression)
  • Support Vector Regression
  • Decision Tree Regression
  • Random Forest Regression
  • GAM (Generalized Additive Models)

Regresi Linier Sederhana

    Persamaan regresi linier sederhana merupakan suatu model persamaan yang menggambarkan hubungan satu variabel bebas/ predictor (X) dengan satu variabel tak bebas/ response (Y), yang biasanya digambarkan dengan garis lurus, seperti disajikan pada Gambar 1.



Contoh Kasus Analisis Regresi Linear Sederhana 

Seorang Engineer ingin mempelajari Hubungan antara Suhu Ruangan dengan Jumlah Cacat yang diakibatkannya, sehingga dapat memprediksi atau meramalkan jumlah cacat produksi jika suhu ruangan tersebut tidak terkendali. Engineer tersebut kemudian mengambil data selama 30 hari terhadap rata-rata (mean) suhu ruangan dan Jumlah Cacat Produksi.

Penyelesaian:

Penyelesaiannya mengikuti Langkah-langkah dalam Analisis Regresi Linear Sederhana adalah sebagai berikut :

Langkah 1 : Penentuan Tujuan

Tujuan : Memprediksi Jumlah Cacat Produksi jika suhu ruangan tidak terkendali

Langkah 2 : Identifikasikan Variabel Penyebab dan Akibat

Varibel Faktor Penyebab (X) : Suhu Ruangan,
Variabel Akibat (Y) : Jumlah Cacat Produksi

Langkah 3 : Pengumpulan Data

Berikut ini adalah data yang berhasil dikumpulkan selama 30 hari (berbentuk tabel) :

TanggalRata-rata Suhu RuanganJumlah Cacat
12410
2225
3216
4203
5226
6194
7205
8239
92411
102513
11217
12204
13206
14193
152512
162713
172816
182512
192614
202412
212716
22239
232413
242311
25227
26215
272612
282511
292613
302714

Langkah 4 : Hitung X², Y², XY dan total dari masing-masingnya

Berikut ini adalah tabel yang telah dilakukan perhitungan X², Y², XY dan totalnya :

TanggalRata-rata Suhu Ruangan (X)Jumlah Cacat        (Y)X2Y2XY
12410576100240
222548425110
321644136126
4203400960
522648436132
61943611676
720540025100
823952981207
92411576121264
102513625169325
1121744149147
122044001680
1320640036120
14193361957
152512625144300
162713729169351
172816784256448
182512625144300
192614676196364
202412576144288
212716729256432
2223952981207
232413576169312
242311529121253
2522748449154
2621544125105
272612676144312
282511625121275
292613676169338
302714729196378
Total (Σ)6992821648731126861

Langkah 5 : Hitung a dan b berdasarkan rumus Regresi Linear Sederhana

Menghitung Konstanta (a) :

a =   (Σy) (Σx²) – (Σx) (Σxy)
.               n(Σx²) – (Σx)²

a = (282) (16.487) – (699) (6.861)
                30 (16.487) – (699)²

a = -24,38

 

Menghitung Koefisien Regresi (b)

b =   n(Σxy) – (Σx) (Σy)
.           n(Σx²) – (Σx)²

b = 30 (6.861) – (699) (282)
.          30 (16.487) – (699)²

b = 1,45

Langkah 6 : Buat Model Persamaan Regresi

Y = a + bX
Y = -24,38 + 1,45X

Langkah 7 : Lakukan Prediksi atau Peramalan terhadap Variabel Faktor Penyebab atau Variabel Akibat

I. Prediksikan Jumlah Cacat Produksi jika suhu dalam keadaan tinggi (Variabel X), contohnya : 30°C

Y = -24,38 + 1,45 (30)
Y = 19,12

Jadi Jika Suhu ruangan mencapai 30°C, maka akan diprediksikan akan terdapat 19,12 unit cacat yang dihasilkan oleh produksi.

II. Jika Cacat Produksi (Variabel Y) yang ditargetkan hanya boleh 4 unit, maka berapakah suhu ruangan yang diperlukan untuk mencapai target tersebut ?

4 = -24,38 + 1,45X
1,45X = 4 + 24,38
X = 28,38 / 1,45
X = 19,57

Jadi Prediksi Suhu Ruangan yang paling sesuai untuk mencapai target Cacat Produksi adalah sekitar 19,57°C


Selain menghitung secara manual, penyelesaian kasus analisis regresi linear sederhana dapat juga diselesaikan dengan python yaitu dengan menggunakan jupiter notebook atau dapat juga menggunakan google colab. 


Komentar

Postingan Populer