Tidak ada review pada koleksi ini: 48964
ABSTRAK
Nama : Harnindyto Wicaksana, Samuel Ludwig Ian, Setyawan Pratama
Program Studi : Sistem Informasi
Judul : Benchmarking Analisis Sentimen Teks Berbahasa Indonesia
Pembimbing : Rahmad Mahendra, S.Kom., M.Sc. & Mei Silviana Saputri, S.Kom.,
M.Kom.
Penelitian analisis sentimen sudah banyak dikaji untuk berbagai bahasa, termasuk
bahasa Indonesia. Namun sayangnya, belum terdapat penelitian benchmarking analisis
sentimen untuk teks berbahasa Indonesia. Hal ini menyebabkan kesulitan bagi para
peneliti untuk mendapatkan informasi mengenai metode klasifikasi dengan performa
terbaik pada saat ini. Dengan adanya permasalahan tersebut, penelitian ini dilakukan
dengan tujuan membantu memberikan arahan untuk penelitian sentimen analisis dalam
bahasa Indonesia. Untuk dapat memberikan arahan, penelitian ini berusaha untuk
membandingkan pendekatan klasifikasi sentimen rule-based, machine learning dan
deep learning serta teknik ekstraksi fitur untuk mendapatkan skenario analisis sentimen
terbaik. Berdasarkan hasil eksperimen penelitian, ditunjukkan bahwa klasifikasi terbaik
dicapai oleh deep learning, disusul dengan metode klasifikasi machine learning dan
rule-based. Pencapaian nilai terbaik pada klasifikasi menggunakan deep learning
diperoleh menggunakan model BERT. Untuk klasifikasi menggunakan machine
learning, didapatkan bahwa nilai F1-Score terbaik diperoleh saat digunakan metode
klasifikasi Logistic Regression dengan teknik ekstraksi fitur kombinasi unigram dengan
leksikon kombinasi. Sedangkan untuk klasifikasi rule-based nilai F1-Score tertinggi
didapatkan menggunakan metode klasifikasi adjektiva.
Kata Kunci : benchmarking, analisis sentimen, bahasa Indonesia, ekstraksi fitur,
leksikon, word embedding, rule-based, machine learning, deep learning, convolutional
neural network, long short term memory, bidirectional encoder representations for
transformers.