Tidak ada review pada koleksi ini: 39430
ABSTRAK
Nama : Christian
Program Studi : Ilmu Komputer
Judul : Analisis Masalah Sparse Data dalam Spasial dan Temporal Clustering: Studi Kasus pada Data Permohonan Pengaktivasian Layanan Internet
Clustering merupakan proses pengolahan data yang bertujuan untuk mengelompokkan data-data yang mirip ke dalam sebuah cluster dan data-data yang tidak mirip ke dalam cluster lainnya. Spasial dan temporal clustering merupakan proses clustering terhadap data yang mengandung unsur tempat dan unsur waktu. Data berdasarkan tingkat kepadatannya dapat dibedakan menjadi dua, yaitu sparse data dan dense data. Dalam proses clustering, pemilihan algoritma yang tepat dapat mempengaruhi hasil dan waktu komputasi proses clustering. Dalam penelitian ini, data yang dianalisis adalah data ekonomi, yaitu data permohonan pengaktivasian layanan internet. Data yang dianalisis ini merupakan sparse data, sehingga penelitian ini menekankan pada penentuan algoritma yang paling cocok untuk menangani sparse data. Keakuratan cluster yang merupakan hasil proses clustering dan waktu komputasi yang diperlukan merupakan dua hal yang diperhatikan dalam menentukan algoritma yang paling cocok. Algoritma yang digunakan untuk analisis spasial clustering dalam penelitian ini adalah algoritma DBSCAN. Sedangkan, algoritma yang digunakan untuk analisis temporal clustering adalah algoritma k-Means dan Iterative k-Means. Untuk algoritma k-Means, metode reduksi dimensi data yang digunakan adalah metode Principal Component Analysis (PCA). Sedangkan, untuk algoritma Iterative k-Means, metode reduksi dimensi data yang digunakan adalah metode dekomposisi Haar Wavelet. Validasi cluster dilakukan dengan lima metode, yaitu Silhouette Index, Calinski and Harabasz Index, Krzanowski and Lai Index, Ball and Hall Index, dan Xu Index. Visualisasi cluster dilakukan dengan bantuan metode PCA. Dari hasil eksperimen, disimpulkan bahwa algoritma yang paling cocok untuk menangani sparse data adalah algoritma k-Means yang menggunakan metode PCA sebagai metode untuk reduksi dimensi data. Selain itu, penelitian ini juga menghasilkan informasi kota-kota di Indonesia yang termasuk kota berkembang dan kota-kota yang termasuk kota sedang berkembang (dalam hal penggunaan teknologi VPN).
Kata kunci:
Clustering, spasial, temporal, sparse data, dense data, DBSCAN, k-Means, Iterative k-Means, Principal Component Analysis, Haar Wavelet, Silhouette Index, Calinski and Harabasz Index, Krzanowski and Lai Index, Ball and Hall Index, Xu Index