ABSTRAK
Universitas XYZ merupakan salah satu PTS dalam bentuk universitas yang berlokasi di
Tangerang, yang memiliki kewajiban untuk menjamin dan memberikan pendidikan
bermutu kepada mahasiswa selaku salah satu pemangku kepentingan yang memiliki
dampak secara langsung pada mutu sebuah universitas. LP2MP bertugas untuk
menyelenggarakan pengukuran dan pelaksanaan survei setiap semester dalam bentuk
survei umpan balik. Hasil survei tersebut dapat dijadikan sebagai pedoman untuk
perbaikan yang berkesinambungan untuk penyelenggaraan penjaminan mutu Dikti dan
pengelolaan Universitas XYZ. Namun, pengolahan dan pengukuran data survei secara
konvensional tidak cukup untuk mengeksplorasi informasi tersembunyi dari survei. EDM
digunakan pada penelitian ini untuk mengolah dan menganalisa data dari Universitas
XYZ berupa survei bagian Open Ended Question (OEQ) yang terdiri dari Student
Feedback Questionaire (SFQ), Facility Satisfaction Questionaire (FSQ), dan Graduate
Feedback Questionaire (GFQ). Tujuan dari penelitian ini adalah untuk mendukung
pengambilan keputusan dalam mengambil tindakan proaktif terhadap perbaikan mutu
Universitas XYZ. Penelitian ini melakukan klasifikasi label aspek, sentimen analisis, dan
tren topik survei SFQ, FSQ, dan GFQ pada bagian OEQ. Klasifikasi label aspek Multi
Class survei SFQ memilih model klasifikasi terbaik dengan membandingkan hasil
evaluasi accuration, precision, recall, dan F1-Score terhadap setiap kombinasi fitur dan
perbandingan empat algoritma klasifikasi yaitu Decision Tree (DT), Naïve Bayes (NB),
K-Nearest Neighbor (KNN), dan Support Vector Machine (SVM). Klasfikasi label aspek
multi label survei FSQ dan GFQ memilih model klasifikasi terbaik dengan
membandingkan hasil evaluasi tiga jenis library multilabel dari SciKit-Learn, yaitu
Binary Relevance (BL), Label Power Set (LPS), dan Classifier Chain (CC) terhadap
setiap kombinasi fitur dan empat algoritma klasifikasi tersebut. Hasil dari penelitian ini
adalah teknik klasifikasi menggunakan kombinasi fitur TFIDF, Unigram, dan Bigram
dengan algoritma SVM merupakan model klasifikasi terbaik untuk pelabelan aspek survei
SFQ. Teknik klasifikasi menggunakan kombinasi fitur TFIDF, Unigram, dan Bigram
dengan algoritma SVM dan library Multi Label CC merupakan model klasifikasi terbaik
untuk pelabelan aspek survei FSQ. Teknik klasifikasi menggunakan kombinasi fitur
Count Vectorizer, Unigram, dan Bigram dengan algoritma NB dan library Multi Label
BR merupakan model klasifikasi terbaik untuk pelabelan aspek survei GFQ. Selain itu,
algoritma SentiStrenghtID digunakan untuk mendapatkan sentimen dan algoritma LDA
digunakan untuk mendapatkan tren topik tahunan pada setiap label aspek survei SFQ,
FSQ, dan GFQ.
|