Langsung ke konten utama

Unggulan

Metric untuk Mengevaluasi Model Machine Learning

  Agar dapat menentukan model mana yang paling baik dari beberapa model yang telah dibuat dalam machine learning dapat menggunakan salah satu teknik yaitu confusion matrix.  Confusion Matrix  Confusion matrix juga sering disebut error matrix. Pada dasarnya confusion matrix memberikan informasi perbandingan hasil klasifikasi yang dilakukan oleh sistem (model) dengan hasil klasifikasi sebenarnya. Confusion matrix berbentuk tabel matriks yang menggambarkan kinerja model klasifikasi pada serangkaian data uji yang nilai sebenarnya diketahui. True Positive (TP)              Merupakan data positif yang diprediksi benar.  True Negative (TN)              Merupakan data negatif yang diprediksi benar.  False Postive (FP) — Type I Error              Merupakan data negatif namun diprediksi sebagai data positif.  False Negative (FN) — Type II Error ...

Machine Learning dengan Algoritma Agglomerative Hierarchical Clustering( AHC)

 


Agglomerative Hierarchical Clustering( AHC)

Hierarchical Clustering adalah metode analisis kelompok yang berusaha untuk membangun sebuah hirarki kelompok data dengan berdasarkan tingkatan tertentu sehingga menyerupai struktur pohon. Dengan demikian proses pengelompokannya dilakukan secara bertingkat atau bertahap. Pada umumnya, algoritma ini digunakan pada data yang jumlahnya tidak terlalu banyak dan jumlah cluster yang akan dibentuk belum diketahui.

Strategi pengelompokannya umumnya ada 2 jenis, yaitu Agglomerative (Bottom-Up) dan Devisive (Top-Down). Agglomerative atau metode penggabungan adalah strategi pengelompokan hirarki yang dimulai dengan setiap objek dalam satu cluster yang terpisah kemudian membentuk cluster yang semakin membesar. Sehingga banyaknya cluster awal adalah sama dengan banyaknya objek. Berbeda dengan Divisive atau metode pembagian adalah strategi pengelompokan hirarki yang dimulai dari semua objek dikelompokkan menjadi cluster tunggal kemudian dipisah hingga setiap objek berada dalam cluster yang terpisah.


Algoritma Agglomerative Hierarchical Clustering :

  1. Hitung Matrik Jarak antar data.
  2. Ulangi langkah 3 dan 4 hingga hanya satu kelompok yang tersisa.
  3. Gabungkan dua kelompok terdekat berdasarkan parameter kedekatan yang ditentukan. ( Single Linkage, Complete Linkage, Average Linkage)
  4. Perbarui Matrik Jarak antar data untuk merepresentasikan kedekatandiantara kelompok baru dan kelompok yang masih tersisa.
  5. Selesai.

Komentar

Postingan Populer