ABSTRAK
Nama : Dewi Sartika
Program Studi : Magister Ilmu Komputer
Judul Tesis : Perbandingan Algoritma Klasifikasi Naive Bayes,
Nearest Neighbour, dan Decision Tree Pada Studi
Kasus Pengambilan Keputusan Pemilihan Pola
Pakaian
Data mining adalah suatu proses analisis terhadap sekumpulan data yang ada di
dalam basis data sehingga diperoleh informasi yang akan digunakan untuk tahap
selanjutnya. Salah satu teknik data mining yang umum digunakan yaitu teknik
klasifikasi. Klasifikasi adalah suatu teknik pembentukan model dari data yang
belum terklasifikasi, untuk digunakan mengklasifikasi data baru. Klasifikasi
termasuk ke dalam tipe supervised learning, artinya dibutuhkan data pelatihan
untuk membangun suatu model klasifikasinya. terdapat 5 kategori klasifikasi yaitu
berbasis statistik, berbasis jarak, berbasis pohon keputusan, berbasis jaringan
syaraf, dan berbasis aturan. Tiap kategori klasifikasi memiliki banyak pilihan
algoritma, beberapa algoritma yang sering digunakan adalah algoritma naive
bayes, nearest neighbour, dan decision tree. Pada penelitian ini akan dilakukan
perbandingan dari ketiga algoritma tersebut pada studi kasus pengambilan
keputusan pemilihan pola pakaian. Hasil perbandingan menunjukkan bahwa
metode decision tree memiliki tingkat akurasi tertinggi dibandingkan algoritma
naive bayes dan nearest neighbour yaitu mencapai 75.6%. Algoritma decision
tree yang digunakan ialah algoritma J48 dengan pruned yang menghasilkan model
decision tree dengan daun sebanyak 166 dan pohon keputusan yang besarnya 255.
Kata kunci : data mining, klasifikasi, supervised learning, naive bayes, nearest
neighbour, decision tree, J48
|
|