ABSTRAK

Di bidang pendidikan terutama pada tingkat perguruan tinggi, terdapat banyak data atau informasi mengenai mahasiswa dan atributnya yang dapat digali lebih lanjut lagi, salah satunya adalah dari nilai. Dari beberapa fungsionalitas data mining, digunakan clustering untuk mengelompokkan mahasiswa berdasarkan nilai tersebut dan prediksi. Informasi yang bisa digali dari nilai mahasiswa antara lain adalah pengelompokan untuk pemilihan mata kuliah pilihan di semester atas, pemilihan tema skripsi dan dengan spatial clustering yang dilakukan untuk pengelompokan nilai mahasiswa berdasarkan IPK. Dengan pengelompokan ini diharapkan nantinya akan menjadi pertimbangan bagi mahasiswa dan manajemen terkait cluster yang terbentuk, mata kuliah pilihan dan tema skripsi mana yang harus diambil mahasiswa nantinya, dan bagaimana tindakan manajemen setelah mengetahui sekolah mana yang cenderung memiliki alumni dengan nilai terbaik yang kemudian kuliah di STMIK MDP, sementara prediksi dilakukan menggunakan nilai yang sudah ada untuk memprediksi nilai selanjutnya untuk total SKS dan IPK. Cluster dilakukan dengan menggunakan algoritma yang sudah ada yaitu Clustering dengan K-Means dan EM dengan menggunakan aplikasi SQL Server 2008 dan aplikasi WEKA setelah sebelumnya melakukan proses pembersihan data. Setelah dilakukan pembersihan data, kemudian data dalam bentuk tabel diolah dengan aplikasi WEKA untuk mendapatkan hasilnya. Hasil dari penelitian berupa cluster-skripsi serta informasi sekolah mana yang berpotensi menghasilkan lulusan dengan nilai baik bagi lembaga. Pengelompokan terdiri atas 3 cluster dengan kategori nilai tinggi, sedang dan rendah. Kemudian dilakukan analisis hasil setelah mendapatkan data yang sudah terkelompok. Sementara prediksi prosesnya menggunakan aplikasi GMDH Shell. Informasi yang didapat selanjutnya dapat dimanfaatkan untuk pengambilan keputusan di bidang pendidikan bagi mahasiswa dan manajemen STMIK MDP. Bagi pihak manajemen STMIK MDP informasi yang berguna terkait sekolah mana yang memberikan kontribusi mahasiswa dengan nilai tertinggi. Sementara untuk perbandingan kedua algoritma tersebut diatas dengan menggunakan sillhouette diperoleh bahwa algoritma K-Means lebih baik dari EM. Sedangkan untuk hasil prediksi untuk dua atribut mahasiswa, yaitu prediksi untuk jumlah SKS dan IPK yang tergambar dari hasil plot menggunakan aplikasi GMDH Shell.