Call Number | T-1388 (Softcopy T-1097) MAK PI-188 TR-CSUI-061 |
Collection Type | Tesis |
Title | Analisis Sentimen Vaksin Covid-19 di Indonesia Menggunakan Model Bahasa XLMR dan Teknik Augmentasi Data |
Author | Putri Rizqiyah; |
Publisher | Depok, Fasilkom UI, 2024 |
Subject | Sentimen Analisis |
Location | FASILKOM-UI; |
Nomor Panggil | ID Koleksi | Status |
---|---|---|
T-1388 (Softcopy T-1097) MAK PI-188 TR-CSUI-061 | TERSEDIA |
Nama : Putri Riziqyah Program Studi : Ilmu Komputer Judul : Analisis Sentimen Vaksin COVID-19 Di Indonesia Menggunakan Model Bahasa XLMR Dan Teknik Augmentasi Data Pembimbing : Evi Yulianti. Ph.D. Meganingrum Arista Jiwanggi M.C.S. Vaksinasi COVID-19 merupakan salah satu solusi jangka panjang untuk mengatasi pandemi COVID-19 di Indonesia. Topik vaksinasi COVID-19 menjadi perbincangan yang hangat, khususnya di media sosial. Berbagai macam pro dan kontra mengenai program vaksinasi terus bermunculan sehingga penelitian mengenai analisis publik terhadap program vaksinasi COVID-19 sangat berguna untuk komunikasi publik. Penelitian ini berfokus kepada lima jenis vaksin yang banyak digunakan di Indonesia yaitu, AstraZeneca, Moderna, Pfizer, Sinopharm dan Sinovac. Sebanyak 252,805 data dikumpulkan melalui media sosial twitter menggunakan Twitter API di tahun 2021. Lalu sebanyak 11,361 dipilih secara acak untuk dianotasi secara manual. Selanjutnya, proses klasifikasi dilakukan menggunakan model bahasa XLMR dan beberapa metode baseline berbasis pre-trained language model, deep learning, machine learning dan lexicon. Augmentasi data seperti Easy Data Augmentation (EDA), An Easier Data Augmentation (AEDA) dan Seqgan juga dilakukan untuk menyeimbangkan jumlah kelas data minoritas. Pembagian data latih dan data uji dilakukan dengan menggunakan dua metode yaitu simple random sampling dan stratified sampling untuk mengetahui performa model yang dilatih. Hasil penelitian menunjukkan bahwa metode yang diusulkan yaitu XLMR, memiliki performa yang tinggi dibandingkan metode baseline lainnya, dengan akurasi sebesar 71.91% sebelum dilakukan augmentasi dan 72.19% setelah dilakukan augmentasi menggunakan Seqgan menggunakan metode pembagian data simple random sampling. Lalu, dengan menggunakan metode pembagian data stratified, XLMR juga memiliki performa terbaik dengan akurasi 59.96% sebelum dilakukan augmentasi dan 74.37% setelah dilakukan augmentasi menggunakan EDA. Penelitian ini akan sangat bermanfaat untuk komunikasi publik dengan kasus serupa. Di masa yang akan datang, penelitian ini bisa dilanjutkan dengan melakukan domain transfer untuk meningkatkan performa model. Kata kunci: Vaksinasi COVID-19, XLMR, AEDA, EDA, Seqgan