Langsung ke konten utama

Unggulan

Metric untuk Mengevaluasi Model Machine Learning

  Agar dapat menentukan model mana yang paling baik dari beberapa model yang telah dibuat dalam machine learning dapat menggunakan salah satu teknik yaitu confusion matrix.  Confusion Matrix  Confusion matrix juga sering disebut error matrix. Pada dasarnya confusion matrix memberikan informasi perbandingan hasil klasifikasi yang dilakukan oleh sistem (model) dengan hasil klasifikasi sebenarnya. Confusion matrix berbentuk tabel matriks yang menggambarkan kinerja model klasifikasi pada serangkaian data uji yang nilai sebenarnya diketahui. True Positive (TP)              Merupakan data positif yang diprediksi benar.  True Negative (TN)              Merupakan data negatif yang diprediksi benar.  False Postive (FP) — Type I Error              Merupakan data negatif namun diprediksi sebagai data positif.  False Negative (FN) — Type II Error ...

Machine Learning dengan model klasifikasi Decision Tree


Decision Tree

Decision Tree atau yang juga disebut dengan pohon keputusan merupakan model klasifikasi yang menggunakan struktur pohon, dimana setiap node merepresentasikan atribut dan cabangnya merepresentasikan nilai dari atribut, sedangkan daunnya digunakan untuk merepresentasikan kelas. 

Contoh Decision Tree

Tahapan Algoritma Decision Tree

1. Siapkan Data Training

2. Pilih atribut sebagai akar.

3. Buat cabang untuk tiap-tiap nilai

4. Ulangi proses untuk setiap cabang sampai semua kasus pada cabang memiliki kelas yg sama

Tujuan Decision Tree 

Tujuan dalam menggunakan Decision tree untuk membantu mengidentifikasi strategi yang paling mungkin untuk mencapai tujuan dan merupakan alat yang populer dalam machine learning.

Kelebihan & Kekurangan Decision Tree 

Kelebihan
  • Menghilangkan perhitungan yang tidak dibutuhkan. Sample yang diuji hanya berdasarkan kriteria atau kelas tertentu.
  • Pengambilan keputusan yang diubah lebih simpel dan spesifik.
  • Menghindari munculnya permasalahan dengan menggunakan kriteria yang jumlahnya lebih sedikit pada setiap node internal tanpa banyak mengurangi kualitas keputusan yang dihasilkan.
  • Bersifat fleksibel, memilih fitur dari internal node yang berbeda, fitur yang terpilih akan membedakan suatu kriteria dibandingkan kriteria yang lain dalam node yang sama. Kefleksibelan metode ini meningkatkan kualitas keputusan yang dihasilkan.
Kekurangan
  • Terjadi overlap, hal ini sering saya temui ketika menggunakan kelas-kelas dan kriteria yang digunakan dalam jumlah besar. Hal tersebut juga dapat menyebabkan meningkatnya waktu pengambilan keputusan dan jumlah memori yang diperlukan.
  • Pengakumulasian jumlah eror dari setiap tingkat dalam sebuah pohon keputusan yang besar.
  • Kesulitan dalam mendesain pohon keputusan yang optimal.
  • Hasil kualitas keputusan yang didapatkan dari metode pohon keputusan sangat tergantung pada bagaimana pohon tersebut didesain.

Istilah dalam Decision Tree
  • Root (simpul akar). Simpul ini merupakan atribut utama ataru atribut terbesar dalam suatu kelas tertentu. Simpul ini tiak memiliki cabang masuk sama sekali namun memiliki lebih dari satu cabang yang keluar.
  • Node (simpul internal). Simpul yang memiliki satu cabang masuk yang diturunkan dari root dan memiliki lebih dari satu cabang yang keluar.
  • Leaf (simpul daun). Simpul akhir yang memiliki satu cabang masung dan tidak memiliki cabang yang keluar.Dari simpul ini akan diketahui keputusan terbaik daru suatu masalah yang dibahas.


Komentar

Postingan Populer