Perbandingan Metode Klasterisasi Data Bertipe Campuran: One-Hot-Encoding, Gower Distance, dan K-Prototype Berdasarkan Akurasi (Studi Kasus: Chronic Kidney Disease Dataset)

Penelitian ini bertujuan untuk membandingkan metode one-hot-encoding, Gower distance yang dikombinasikan dengan algoritma k-means, DBSCAN, dan OPTICS, serta k-prototype untuk pengelompokan data bertipe campuran. Dataset yang digunakan dalam penelitian ini adalah dataset penyakit ginjal kronis (CKD)...

Full description

Saved in:
Bibliographic Details
Published in:Journal of Applied Informatics and Computing Vol. 7; no. 1; pp. 57 - 67
Main Authors: Fadilah, Zahra Rizky, Wijayanto, Arie Wahyu
Format: Journal Article
Language:English
Published: Politeknik Negeri Batam 31-07-2023
Subjects:
Online Access:Get full text
Tags: Add Tag
No Tags, Be the first to tag this record!
Abstract Penelitian ini bertujuan untuk membandingkan metode one-hot-encoding, Gower distance yang dikombinasikan dengan algoritma k-means, DBSCAN, dan OPTICS, serta k-prototype untuk pengelompokan data bertipe campuran. Dataset yang digunakan dalam penelitian ini adalah dataset penyakit ginjal kronis (CKD) yang bersumber dari UCI Machine Learning Repository. Berdasarkan evaluasi dengan menggunakan indeks siluet, diketahui bahwa k-prototype dengan jumlah cluster k=2 merupakan metode clustering yang paling optimal karena memberikan nilai indeks siluet paling tinggi dibandingkan keempat metode lainnya, yaitu dengan nilai 0,3796. Cluster 1 berisi 175 observasi, sedangkan cluster 2 berisi 225 observasi. Jika dikaitkan dengan label pada dataset, hasil clustering memberikan nilai akurasi sebesar 81,25 persen.
AbstractList Penelitian ini bertujuan untuk membandingkan metode one-hot-encoding, Gower distance yang dikombinasikan dengan algoritma k-means, DBSCAN, dan OPTICS, serta k-prototype untuk pengelompokan data bertipe campuran. Dataset yang digunakan dalam penelitian ini adalah dataset penyakit ginjal kronis (CKD) yang bersumber dari UCI Machine Learning Repository. Berdasarkan evaluasi dengan menggunakan indeks siluet, diketahui bahwa k-prototype dengan jumlah cluster k=2 merupakan metode clustering yang paling optimal karena memberikan nilai indeks siluet paling tinggi dibandingkan keempat metode lainnya, yaitu dengan nilai 0,3796. Cluster 1 berisi 175 observasi, sedangkan cluster 2 berisi 225 observasi. Jika dikaitkan dengan label pada dataset, hasil clustering memberikan nilai akurasi sebesar 81,25 persen.
Author Wijayanto, Arie Wahyu
Fadilah, Zahra Rizky
Author_xml – sequence: 1
  givenname: Zahra Rizky
  surname: Fadilah
  fullname: Fadilah, Zahra Rizky
– sequence: 2
  givenname: Arie Wahyu
  surname: Wijayanto
  fullname: Wijayanto, Arie Wahyu
BookMark eNpN0U1PGzEQBmCrolIp5dyrjyCxwR-7Xi83GmiCQgVS27M1a0-oQ7Aj2wHlN_VPdjdUiNOMRppHo3k_k4MQAxLylbOJZLrl5yvwdvLcej5pdNN-IIeiqXWltOIH7_pP5DjnFWNMdFwowQ_J33tMPQTnwwME-gNLdEgXa8gFk8-QPb2CAvQbpuI3SKfwtNkmCBf0LmA1j6W6DjaO22d0Fl8w0SufCwSLZ9QN4KK6T7HEsht2B8NBhvQ4zC8fB2XAT36WrfN0AXmbL-j0T4rBW7rwLuBupBAy7i_IWE6_kI9LWGc8_l-PyO_v17-m8-r2bnYzvbytLGdKVBaaXjvBpAZnoXVOcyWklHwpuAStOi2FVNK5rq-hhl51Vi9VjeCYgg6YPCI3r66LsDKb5J8g7UwEb_aDmB4MDO-wazSdRewsB9GCrJUC3drGtrxWrkPZCzFY56-WTTHnhMs3jzOzj86M0ZkxOjNGJ_8B4oaQ6w
ContentType Journal Article
DBID AAYXX
CITATION
DOA
DOI 10.30871/jaic.v7i1.5857
DatabaseName CrossRef
Directory of Open Access Journals
DatabaseTitle CrossRef
DatabaseTitleList
CrossRef
Database_xml – sequence: 1
  dbid: DOA
  name: Directory of Open Access Journals
  url: http://www.doaj.org/
  sourceTypes: Open Website
DeliveryMethod fulltext_linktorsrc
EISSN 2548-6861
EndPage 67
ExternalDocumentID oai_doaj_org_article_9cee9c1a27a3466a87c5c7146d9e3b22
10_30871_jaic_v7i1_5857
GroupedDBID AAYXX
ALMA_UNASSIGNED_HOLDINGS
CITATION
GROUPED_DOAJ
ID FETCH-LOGICAL-c1062-ca5b8d2038adca7dd81623331f213a869832363dd9b4a4ab69c8f64ead06a9a03
IEDL.DBID DOA
ISSN 2548-6861
IngestDate Tue Oct 22 15:08:18 EDT 2024
Thu Nov 21 21:37:14 EST 2024
IsDoiOpenAccess true
IsOpenAccess true
IsPeerReviewed false
IsScholarly false
Issue 1
Language English
LinkModel DirectLink
MergedId FETCHMERGED-LOGICAL-c1062-ca5b8d2038adca7dd81623331f213a869832363dd9b4a4ab69c8f64ead06a9a03
OpenAccessLink https://doaj.org/article/9cee9c1a27a3466a87c5c7146d9e3b22
PageCount 11
ParticipantIDs doaj_primary_oai_doaj_org_article_9cee9c1a27a3466a87c5c7146d9e3b22
crossref_primary_10_30871_jaic_v7i1_5857
PublicationCentury 2000
PublicationDate 2023-07-31
PublicationDateYYYYMMDD 2023-07-31
PublicationDate_xml – month: 07
  year: 2023
  text: 2023-07-31
  day: 31
PublicationDecade 2020
PublicationTitle Journal of Applied Informatics and Computing
PublicationYear 2023
Publisher Politeknik Negeri Batam
Publisher_xml – name: Politeknik Negeri Batam
SSID ssj0002912621
Score 1.8911935
Snippet Penelitian ini bertujuan untuk membandingkan metode one-hot-encoding, Gower distance yang dikombinasikan dengan algoritma k-means, DBSCAN, dan OPTICS, serta...
SourceID doaj
crossref
SourceType Open Website
Aggregation Database
StartPage 57
SubjectTerms clustering
gower distance
k-prototype
mixed-data type
one-hot-encoding
Title Perbandingan Metode Klasterisasi Data Bertipe Campuran: One-Hot-Encoding, Gower Distance, dan K-Prototype Berdasarkan Akurasi (Studi Kasus: Chronic Kidney Disease Dataset)
URI https://doaj.org/article/9cee9c1a27a3466a87c5c7146d9e3b22
Volume 7
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
link http://sdu.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwrV1Lb9QwELbonrhURYBYKMgHDotUl_gRx-5ty25ZaQVUKki9RRPbkVaVktUmi8Rv4k8yk2yrcuLC1Uomzsx4Hvb4G8beSwOFq4IWNrlMGF17AUkB5jxKeZnyJB3dRl7dFF9v3WJJMDkPrb6oJmyEBx4Z99GjFfdBgipAG2vBFSEPBa7v6JOu1Gh9M_somSIbjN9RVskRy4dA7whnaBPOfxYbeY4RcvGXG3qE1j-4lasTdnyIB_l8nMcz9iQ1z9nva_zZ8b4JNPxL6tuY-Brj3AFYGboNX0AP_JJqoreJ0_nBHn3OBf_WJLFqe7FsQktvn_HP1AWNLyhKRPGe8YgE1-J61_Yt7b4SjQgd7O5wfH6HVJD4bCgu5Gvo9t0FP8Dn8vUmNukXkaITnWEGXeo_vGA_rpbfP63EoauCCMgnJQLklYsq0w5igCJGJzEE0lrWSmpw1uMa11bH6CsDBirrg6utQY3LLHjI9Es2adomvWLcZXUevdS1BG9iUj5XVltT1UZmUUc9ZbN7JpfbETyjxKRjkEdJ8ihJHiXJY8ouSQgPjxHq9TCAulAedKH8ly68_h9E3rCn1FJ-3L89ZZN-t09v2VEX9-8GHfsDjabYMw
link.rule.ids 315,782,786,866,2106,27933,27934
linkProvider Directory of Open Access Journals
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=Perbandingan+Metode+Klasterisasi+Data+Bertipe+Campuran%3A+One-Hot-Encoding%2C+Gower+Distance%2C+dan+K-Prototype+Berdasarkan+Akurasi+%28Studi+Kasus%3A+Chronic+Kidney+Disease+Dataset%29&rft.jtitle=Journal+of+Applied+Informatics+and+Computing&rft.au=Zahra+Rizky+Fadilah&rft.au=Arie+Wahyu+Wijayanto&rft.date=2023-07-31&rft.pub=Politeknik+Negeri+Batam&rft.eissn=2548-6861&rft.volume=7&rft.issue=1&rft.spage=63&rft.epage=73&rft_id=info:doi/10.30871%2Fjaic.v7i1.5857&rft.externalDBID=DOA&rft.externalDocID=oai_doaj_org_article_9cee9c1a27a3466a87c5c7146d9e3b22
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2548-6861&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2548-6861&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2548-6861&client=summon