Perbandingan Metode Klasterisasi Data Bertipe Campuran: One-Hot-Encoding, Gower Distance, dan K-Prototype Berdasarkan Akurasi (Studi Kasus: Chronic Kidney Disease Dataset)
Penelitian ini bertujuan untuk membandingkan metode one-hot-encoding, Gower distance yang dikombinasikan dengan algoritma k-means, DBSCAN, dan OPTICS, serta k-prototype untuk pengelompokan data bertipe campuran. Dataset yang digunakan dalam penelitian ini adalah dataset penyakit ginjal kronis (CKD)...
Saved in:
Published in: | Journal of Applied Informatics and Computing Vol. 7; no. 1; pp. 57 - 67 |
---|---|
Main Authors: | , |
Format: | Journal Article |
Language: | English |
Published: |
Politeknik Negeri Batam
31-07-2023
|
Subjects: | |
Online Access: | Get full text |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Summary: | Penelitian ini bertujuan untuk membandingkan metode one-hot-encoding, Gower distance yang dikombinasikan dengan algoritma k-means, DBSCAN, dan OPTICS, serta k-prototype untuk pengelompokan data bertipe campuran. Dataset yang digunakan dalam penelitian ini adalah dataset penyakit ginjal kronis (CKD) yang bersumber dari UCI Machine Learning Repository. Berdasarkan evaluasi dengan menggunakan indeks siluet, diketahui bahwa k-prototype dengan jumlah cluster k=2 merupakan metode clustering yang paling optimal karena memberikan nilai indeks siluet paling tinggi dibandingkan keempat metode lainnya, yaitu dengan nilai 0,3796. Cluster 1 berisi 175 observasi, sedangkan cluster 2 berisi 225 observasi. Jika dikaitkan dengan label pada dataset, hasil clustering memberikan nilai akurasi sebesar 81,25 persen. |
---|---|
ISSN: | 2548-6861 2548-6861 |
DOI: | 10.30871/jaic.v7i1.5857 |