Perbandingan Metode Klasterisasi Data Bertipe Campuran: One-Hot-Encoding, Gower Distance, dan K-Prototype Berdasarkan Akurasi (Studi Kasus: Chronic Kidney Disease Dataset)
Penelitian ini bertujuan untuk membandingkan metode one-hot-encoding, Gower distance yang dikombinasikan dengan algoritma k-means, DBSCAN, dan OPTICS, serta k-prototype untuk pengelompokan data bertipe campuran. Dataset yang digunakan dalam penelitian ini adalah dataset penyakit ginjal kronis (CKD)...
Saved in:
Published in: | Journal of Applied Informatics and Computing Vol. 7; no. 1; pp. 57 - 67 |
---|---|
Main Authors: | , |
Format: | Journal Article |
Language: | English |
Published: |
Politeknik Negeri Batam
31-07-2023
|
Subjects: | |
Online Access: | Get full text |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Abstract | Penelitian ini bertujuan untuk membandingkan metode one-hot-encoding, Gower distance yang dikombinasikan dengan algoritma k-means, DBSCAN, dan OPTICS, serta k-prototype untuk pengelompokan data bertipe campuran. Dataset yang digunakan dalam penelitian ini adalah dataset penyakit ginjal kronis (CKD) yang bersumber dari UCI Machine Learning Repository. Berdasarkan evaluasi dengan menggunakan indeks siluet, diketahui bahwa k-prototype dengan jumlah cluster k=2 merupakan metode clustering yang paling optimal karena memberikan nilai indeks siluet paling tinggi dibandingkan keempat metode lainnya, yaitu dengan nilai 0,3796. Cluster 1 berisi 175 observasi, sedangkan cluster 2 berisi 225 observasi. Jika dikaitkan dengan label pada dataset, hasil clustering memberikan nilai akurasi sebesar 81,25 persen. |
---|---|
AbstractList | Penelitian ini bertujuan untuk membandingkan metode one-hot-encoding, Gower distance yang dikombinasikan dengan algoritma k-means, DBSCAN, dan OPTICS, serta k-prototype untuk pengelompokan data bertipe campuran. Dataset yang digunakan dalam penelitian ini adalah dataset penyakit ginjal kronis (CKD) yang bersumber dari UCI Machine Learning Repository. Berdasarkan evaluasi dengan menggunakan indeks siluet, diketahui bahwa k-prototype dengan jumlah cluster k=2 merupakan metode clustering yang paling optimal karena memberikan nilai indeks siluet paling tinggi dibandingkan keempat metode lainnya, yaitu dengan nilai 0,3796. Cluster 1 berisi 175 observasi, sedangkan cluster 2 berisi 225 observasi. Jika dikaitkan dengan label pada dataset, hasil clustering memberikan nilai akurasi sebesar 81,25 persen. |
Author | Wijayanto, Arie Wahyu Fadilah, Zahra Rizky |
Author_xml | – sequence: 1 givenname: Zahra Rizky surname: Fadilah fullname: Fadilah, Zahra Rizky – sequence: 2 givenname: Arie Wahyu surname: Wijayanto fullname: Wijayanto, Arie Wahyu |
BookMark | eNpN0U1PGzEQBmCrolIp5dyrjyCxwR-7Xi83GmiCQgVS27M1a0-oQ7Aj2wHlN_VPdjdUiNOMRppHo3k_k4MQAxLylbOJZLrl5yvwdvLcej5pdNN-IIeiqXWltOIH7_pP5DjnFWNMdFwowQ_J33tMPQTnwwME-gNLdEgXa8gFk8-QPb2CAvQbpuI3SKfwtNkmCBf0LmA1j6W6DjaO22d0Fl8w0SufCwSLZ9QN4KK6T7HEsht2B8NBhvQ4zC8fB2XAT36WrfN0AXmbL-j0T4rBW7rwLuBupBAy7i_IWE6_kI9LWGc8_l-PyO_v17-m8-r2bnYzvbytLGdKVBaaXjvBpAZnoXVOcyWklHwpuAStOi2FVNK5rq-hhl51Vi9VjeCYgg6YPCI3r66LsDKb5J8g7UwEb_aDmB4MDO-wazSdRewsB9GCrJUC3drGtrxWrkPZCzFY56-WTTHnhMs3jzOzj86M0ZkxOjNGJ_8B4oaQ6w |
ContentType | Journal Article |
DBID | AAYXX CITATION DOA |
DOI | 10.30871/jaic.v7i1.5857 |
DatabaseName | CrossRef Directory of Open Access Journals |
DatabaseTitle | CrossRef |
DatabaseTitleList | CrossRef |
Database_xml | – sequence: 1 dbid: DOA name: Directory of Open Access Journals url: http://www.doaj.org/ sourceTypes: Open Website |
DeliveryMethod | fulltext_linktorsrc |
EISSN | 2548-6861 |
EndPage | 67 |
ExternalDocumentID | oai_doaj_org_article_9cee9c1a27a3466a87c5c7146d9e3b22 10_30871_jaic_v7i1_5857 |
GroupedDBID | AAYXX ALMA_UNASSIGNED_HOLDINGS CITATION GROUPED_DOAJ |
ID | FETCH-LOGICAL-c1062-ca5b8d2038adca7dd81623331f213a869832363dd9b4a4ab69c8f64ead06a9a03 |
IEDL.DBID | DOA |
ISSN | 2548-6861 |
IngestDate | Tue Oct 22 15:08:18 EDT 2024 Thu Nov 21 21:37:14 EST 2024 |
IsDoiOpenAccess | true |
IsOpenAccess | true |
IsPeerReviewed | false |
IsScholarly | false |
Issue | 1 |
Language | English |
LinkModel | DirectLink |
MergedId | FETCHMERGED-LOGICAL-c1062-ca5b8d2038adca7dd81623331f213a869832363dd9b4a4ab69c8f64ead06a9a03 |
OpenAccessLink | https://doaj.org/article/9cee9c1a27a3466a87c5c7146d9e3b22 |
PageCount | 11 |
ParticipantIDs | doaj_primary_oai_doaj_org_article_9cee9c1a27a3466a87c5c7146d9e3b22 crossref_primary_10_30871_jaic_v7i1_5857 |
PublicationCentury | 2000 |
PublicationDate | 2023-07-31 |
PublicationDateYYYYMMDD | 2023-07-31 |
PublicationDate_xml | – month: 07 year: 2023 text: 2023-07-31 day: 31 |
PublicationDecade | 2020 |
PublicationTitle | Journal of Applied Informatics and Computing |
PublicationYear | 2023 |
Publisher | Politeknik Negeri Batam |
Publisher_xml | – name: Politeknik Negeri Batam |
SSID | ssj0002912621 |
Score | 1.8911935 |
Snippet | Penelitian ini bertujuan untuk membandingkan metode one-hot-encoding, Gower distance yang dikombinasikan dengan algoritma k-means, DBSCAN, dan OPTICS, serta... |
SourceID | doaj crossref |
SourceType | Open Website Aggregation Database |
StartPage | 57 |
SubjectTerms | clustering gower distance k-prototype mixed-data type one-hot-encoding |
Title | Perbandingan Metode Klasterisasi Data Bertipe Campuran: One-Hot-Encoding, Gower Distance, dan K-Prototype Berdasarkan Akurasi (Studi Kasus: Chronic Kidney Disease Dataset) |
URI | https://doaj.org/article/9cee9c1a27a3466a87c5c7146d9e3b22 |
Volume | 7 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
link | http://sdu.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwrV1Lb9QwELbonrhURYBYKMgHDotUl_gRx-5ty25ZaQVUKki9RRPbkVaVktUmi8Rv4k8yk2yrcuLC1Uomzsx4Hvb4G8beSwOFq4IWNrlMGF17AUkB5jxKeZnyJB3dRl7dFF9v3WJJMDkPrb6oJmyEBx4Z99GjFfdBgipAG2vBFSEPBa7v6JOu1Gh9M_somSIbjN9RVskRy4dA7whnaBPOfxYbeY4RcvGXG3qE1j-4lasTdnyIB_l8nMcz9iQ1z9nva_zZ8b4JNPxL6tuY-Brj3AFYGboNX0AP_JJqoreJ0_nBHn3OBf_WJLFqe7FsQktvn_HP1AWNLyhKRPGe8YgE1-J61_Yt7b4SjQgd7O5wfH6HVJD4bCgu5Gvo9t0FP8Dn8vUmNukXkaITnWEGXeo_vGA_rpbfP63EoauCCMgnJQLklYsq0w5igCJGJzEE0lrWSmpw1uMa11bH6CsDBirrg6utQY3LLHjI9Es2adomvWLcZXUevdS1BG9iUj5XVltT1UZmUUc9ZbN7JpfbETyjxKRjkEdJ8ihJHiXJY8ouSQgPjxHq9TCAulAedKH8ly68_h9E3rCn1FJ-3L89ZZN-t09v2VEX9-8GHfsDjabYMw |
link.rule.ids | 315,782,786,866,2106,27933,27934 |
linkProvider | Directory of Open Access Journals |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=Perbandingan+Metode+Klasterisasi+Data+Bertipe+Campuran%3A+One-Hot-Encoding%2C+Gower+Distance%2C+dan+K-Prototype+Berdasarkan+Akurasi+%28Studi+Kasus%3A+Chronic+Kidney+Disease+Dataset%29&rft.jtitle=Journal+of+Applied+Informatics+and+Computing&rft.au=Zahra+Rizky+Fadilah&rft.au=Arie+Wahyu+Wijayanto&rft.date=2023-07-31&rft.pub=Politeknik+Negeri+Batam&rft.eissn=2548-6861&rft.volume=7&rft.issue=1&rft.spage=63&rft.epage=73&rft_id=info:doi/10.30871%2Fjaic.v7i1.5857&rft.externalDBID=DOA&rft.externalDocID=oai_doaj_org_article_9cee9c1a27a3466a87c5c7146d9e3b22 |
thumbnail_l | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2548-6861&client=summon |
thumbnail_m | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2548-6861&client=summon |
thumbnail_s | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2548-6861&client=summon |