Perbandingan Metode Klasterisasi Data Bertipe Campuran: One-Hot-Encoding, Gower Distance, dan K-Prototype Berdasarkan Akurasi (Studi Kasus: Chronic Kidney Disease Dataset)

Penelitian ini bertujuan untuk membandingkan metode one-hot-encoding, Gower distance yang dikombinasikan dengan algoritma k-means, DBSCAN, dan OPTICS, serta k-prototype untuk pengelompokan data bertipe campuran. Dataset yang digunakan dalam penelitian ini adalah dataset penyakit ginjal kronis (CKD)...

Full description

Saved in:
Bibliographic Details
Published in:Journal of Applied Informatics and Computing Vol. 7; no. 1; pp. 57 - 67
Main Authors: Fadilah, Zahra Rizky, Wijayanto, Arie Wahyu
Format: Journal Article
Language:English
Published: Politeknik Negeri Batam 31-07-2023
Subjects:
Online Access:Get full text
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Penelitian ini bertujuan untuk membandingkan metode one-hot-encoding, Gower distance yang dikombinasikan dengan algoritma k-means, DBSCAN, dan OPTICS, serta k-prototype untuk pengelompokan data bertipe campuran. Dataset yang digunakan dalam penelitian ini adalah dataset penyakit ginjal kronis (CKD) yang bersumber dari UCI Machine Learning Repository. Berdasarkan evaluasi dengan menggunakan indeks siluet, diketahui bahwa k-prototype dengan jumlah cluster k=2 merupakan metode clustering yang paling optimal karena memberikan nilai indeks siluet paling tinggi dibandingkan keempat metode lainnya, yaitu dengan nilai 0,3796. Cluster 1 berisi 175 observasi, sedangkan cluster 2 berisi 225 observasi. Jika dikaitkan dengan label pada dataset, hasil clustering memberikan nilai akurasi sebesar 81,25 persen.
ISSN:2548-6861
2548-6861
DOI:10.30871/jaic.v7i1.5857