PENGKLASTERAN DATA KATEGORIS DENGAN ALGORITMA SHARED NEAREST NEIGHBOR

Alvida Mustika Rukmi, Mohammad Isa Irawan, Nurul Hidayat

Abstract


Pengklasteran objek data merupakan salah satu cara untuk
mempermudah dalam membaca data, terutama data berdimensi tinggi. Obyek-obyek data berada dalam satu klaster jika mempunyai kesamaan yang tinggi, dan sebaliknya, berada pada klaster berbeda jika menunjukkan ketidaksamaan. Data kategoris merupakan jenis data yang sering digunakan pada database/dataset. Data teks merupakan salah satu data kategoris. Pengklasteran dengan algoritma shared nearest neighbor (SNN) didasarkan pada anggapan bahwa titik-titik akan berada dalam klaster yang sama jika jumlah shared nearest neighbor melebihi ambang batas yang ditentukan. Algoritma SNN mampu memberikan hasil pengklasteran data teks dengan baik, dimana teks dengan tingkat kesamaan yang ditentukan, akan berada pada klaster yang sama.


Keywords


shared nearest neighbor; pengklasteran; data teks

Full Text:

PDF

References


Ertoz L., Steinbach M., dan Kumar V.(2002), "Finding topics in document, a Shared nearest neighbor Approach Clustering and Information Retrieval", Kluwer Academic Publisher.

Heidelberg (2005), "High Dimensional Shared Narest Neighbor Clustering Algorithm", Lecture Notes on Compuer Science, Publisher Springer Berlin vol.3614, Hal. 494-50

Jain A.K dan Dubes R.C (1988), "Algirthms for Clustering Data", Prentice Hall

Jarvis R.A. dan Patrick E. (1973), "Clustering Using a Similarity Measure based on Shared Nearest Neighbor", Proceeding IEEE Transaction on Computer, vol C-22, hal. 1025-1034.

Karphys G., Han E.H., dan Kumar V., (1999), "CHAMELEON : A Hierarchical Clustering Algorithm Using Dynamic Modeling", Proceedings IEEE Transaction on Computer, vol. 32, hal. 68-75.

Moosinghe H.D.K., dan Pang-Ning T. (2006), "Outlier Detection Using Random Walks", Department of Computer Science & Engineering Michigan State University.

Qing Zang dkk. (2004), "Cluster Cores-based Clustering for High Dimensional Data", Department of Computer Science, Hongkong university of Science & Technology




DOI: http://dx.doi.org/10.12962/j1829605X.v6i1.1432

Refbacks

  • There are currently no refbacks.


Jumlah Kunjungan:

Creative Commons License
Limits: Journal Mathematics and its Aplications by Pusat Publikasi Ilmiah LPPM Institut Teknologi Sepuluh Nopember is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Based on a work at https://iptek.its.ac.id/index.php/limits.