ABSTRAK
Nama
: Putri Riziqyah
Program Studi
: Ilmu Komputer
Judul
: Analisis Sentimen Vaksin COVID-19 Di Indonesia
Menggunakan Model Bahasa XLMR Dan Teknik Augmentasi
Data
Pembimbing
: Evi Yulianti. Ph.D.
Meganingrum Arista Jiwanggi M.C.S.
Vaksinasi COVID-19 merupakan salah satu solusi jangka panjang untuk mengatasi
pandemi COVID-19 di Indonesia. Topik vaksinasi COVID-19 menjadi perbincangan
yang hangat, khususnya di media sosial. Berbagai macam pro dan kontra mengenai
program vaksinasi terus bermunculan sehingga penelitian mengenai analisis publik
terhadap program vaksinasi COVID-19 sangat berguna untuk komunikasi publik.
Penelitian ini berfokus kepada lima jenis vaksin yang banyak digunakan di Indonesia
yaitu, AstraZeneca, Moderna, Pfizer, Sinopharm dan Sinovac.
Sebanyak 252,805 data dikumpulkan melalui media sosial twitter menggunakan Twitter
API di tahun 2021. Lalu sebanyak 11,361 dipilih secara acak untuk dianotasi secara
manual. Selanjutnya, proses klasifikasi dilakukan menggunakan model bahasa XLMR
dan beberapa metode baseline berbasis pre-trained language model, deep learning,
machine learning dan lexicon. Augmentasi data seperti Easy Data Augmentation (EDA),
An Easier Data Augmentation (AEDA) dan Seqgan juga dilakukan untuk
menyeimbangkan jumlah kelas data minoritas. Pembagian data latih dan data uji
dilakukan dengan menggunakan dua metode yaitu simple random sampling dan stratified
sampling untuk mengetahui performa model yang dilatih.
Hasil penelitian menunjukkan bahwa metode yang diusulkan yaitu XLMR, memiliki
performa yang tinggi dibandingkan metode baseline lainnya, dengan akurasi sebesar
71.91% sebelum dilakukan augmentasi dan 72.19% setelah dilakukan augmentasi
menggunakan Seqgan menggunakan metode pembagian data simple random sampling.
Lalu, dengan menggunakan metode pembagian data stratified, XLMR juga memiliki
performa terbaik dengan akurasi 59.96% sebelum dilakukan augmentasi dan 74.37%
setelah dilakukan augmentasi menggunakan EDA. Penelitian ini akan sangat bermanfaat
untuk komunikasi publik dengan kasus serupa. Di masa yang akan datang, penelitian ini
bisa dilanjutkan dengan melakukan domain transfer untuk meningkatkan performa
model.
Kata kunci:
Vaksinasi COVID-19, XLMR, AEDA, EDA, Seqgan
|