PENGKLASTERAN DATA KATEGORIS DENGAN ALGORITMA SHARED NEAREST NEIGHBOR
Abstract
mempermudah dalam membaca data, terutama data berdimensi tinggi. Obyek-obyek data berada dalam satu klaster jika mempunyai kesamaan yang tinggi, dan sebaliknya, berada pada klaster berbeda jika menunjukkan ketidaksamaan. Data kategoris merupakan jenis data yang sering digunakan pada database/dataset. Data teks merupakan salah satu data kategoris. Pengklasteran dengan algoritma shared nearest neighbor (SNN) didasarkan pada anggapan bahwa titik-titik akan berada dalam klaster yang sama jika jumlah shared nearest neighbor melebihi ambang batas yang ditentukan. Algoritma SNN mampu memberikan hasil pengklasteran data teks dengan baik, dimana teks dengan tingkat kesamaan yang ditentukan, akan berada pada klaster yang sama.
Keywords
Full Text:
PDFReferences
Ertoz L., Steinbach M., dan Kumar V.(2002), "Finding topics in document, a Shared nearest neighbor Approach Clustering and Information Retrieval", Kluwer Academic Publisher.
Heidelberg (2005), "High Dimensional Shared Narest Neighbor Clustering Algorithm", Lecture Notes on Compuer Science, Publisher Springer Berlin vol.3614, Hal. 494-50
Jain A.K dan Dubes R.C (1988), "Algirthms for Clustering Data", Prentice Hall
Jarvis R.A. dan Patrick E. (1973), "Clustering Using a Similarity Measure based on Shared Nearest Neighbor", Proceeding IEEE Transaction on Computer, vol C-22, hal. 1025-1034.
Karphys G., Han E.H., dan Kumar V., (1999), "CHAMELEON : A Hierarchical Clustering Algorithm Using Dynamic Modeling", Proceedings IEEE Transaction on Computer, vol. 32, hal. 68-75.
Moosinghe H.D.K., dan Pang-Ning T. (2006), "Outlier Detection Using Random Walks", Department of Computer Science & Engineering Michigan State University.
Qing Zang dkk. (2004), "Cluster Cores-based Clustering for High Dimensional Data", Department of Computer Science, Hongkong university of Science & Technology
DOI: http://dx.doi.org/10.12962/j1829605X.v6i1.1432
Refbacks
- There are currently no refbacks.
Jumlah Kunjungan:
Limits: Journal Mathematics and its Aplications by Pusat Publikasi Ilmiah LPPM Institut Teknologi Sepuluh Nopember is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Based on a work at https://iptek.its.ac.id/index.php/limits.