ABSTRAK
ABSTRAK
Nama : Nadya Safitri
Program Studi : Ilmu Komputer
Judul : Perbandingan Machine Learning Dan Deep Learning Pada
Klasifikasi Teks dan Analisis Sentimen Terhadap Dampak Covid-19 Di Indonesia
Pada Twitter Dengan Pendekatan Multi-Label
Pembimbing : Ir. Dana Indra Sensuse, M.LIS., Ph.D.
Pemilihan metode machine learning atau deep learning menjadi suatu
permasalahan dalam klasifikasi. Hal ini didapatkan dari penelitian yang
menunjukkan bahwa deep learning kinerjanya lebih baik daripada machine
learning, namun terdapat penelitian bahwa kedua metode tersebut kinerjanya tidak
menentu tergantung dataset yang digunakan. Oleh karena itu, penelitian ini
membandingkan kinerja dari machine learning dan deep learning untuk
permasalahan klasifikasi teks dan analisis sentimen terhadap dampak Covid-19 di
Indonesia. Hasil penelitian ini menunjukkan bahwa kinerja pada klasifikasi teks dan
analisis sentimen menggunakan metode machine learning lebih baik dibandingkan
dengan deep learning. Hasil penelitian mengenai klasifikasi teks menunjukkan
bahwa kinerja metode machine learning yaitu Label Powerset dan Random Forest
menghasilkan akurasi 77 % sedangkan kinerja metode deep learning yaitu Long
Short-Term Memory (LSTM) dan Gate Reccurent Unit (GRU) menghasilkan
akurasi 48%. Hasil penelitian mengenai analisis sentimen menunjukkan bahwa
kinerja metode machine learning yaitu Label Powerset dan Random Forest
menghasilkan akurasi 63 % sedangkan kinerja metode deep learning yaitu Long
Short-Term Memory (LSTM) dan Gate Reccurent Unit (GRU) menghasilkan
akurasi 55% dan 54%. Keseimbangan jumlah label pada semua label
mempengaruhi hasil dari klasifikasi. Oleh karena itu, disarankan untuk
menggunakan metode untuk menyeimbangkan jumlah label yang digunakan untuk
klasifikasi.
Kata kunci: Covid-19, Klasifikasi, Sentimen, Metode Transformasi, Long ShortTerm Memory, Gated Reccurent Memory
|