Tidak ada review pada koleksi ini: 49354
HALAMAN PENGESAHAN
Skripsi ini diajukan oleh :
Nama : Douglas Raevan Faisal
NPM : 1706984562
Program Studi : Sistem Informasi
Judul Skripsi : Deteksi Misinformasi COVID-19 pada Tweet Ber-
bahasa Indonesia Menggunakan Model Pemelajaran
Mesin Bertingkat dan Pre-Trained Language Model
Telah berhasil dipertahankan di hadapan Dewan Penguji dan diterima sebagai
bagian persyaratan yang diperlukan untuk memperoleh gelar Sarjana Ilmu Kom-
puter pada Program Studi Sistem Informasi, Fakultas Ilmu Komputer, Universitas
Indonesia.
DEWAN PENGUJI
Pembimbing 1 : Rahmad Mahendra S.Kom., M.Sc. ( )
Penguji 1 : Muhammad Okky Ibrohim, S.Mat., M.Kom. ( )
Penguji 2 : Alfan Farizki Wicaksono, S.T., M.Sc., Ph.D. ( )
Ditetapkan di : Depok
Tanggal : 28 Juli 2021
iv
HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI TUGAS
AKHIR UNTUK KEPENTINGAN AKADEMIS
Sebagai sivitas akademik Universitas Indonesia, saya yang bertanda tangan di bawah ini:
Nama : Douglas Raevan Faisal
NPM : 1706984562
Program Studi : Sistem Informasi
Fakultas : Ilmu Komputer
Jenis Karya : Skripsi
demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Univer-
sitas Indonesia Hak Bebas Royalti Noneksklusif (Non-exclusive Royalty Free Right)
atas karya ilmiah saya yang berjudul:
Deteksi Misinformasi COVID-19 pada Tweet Berbahasa Indonesia Menggunakan Model
Pemelajaran Mesin Bertingkat dan Pre-Trained Language Model
beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Noneksklusif
ini Universitas Indonesia berhak menyimpan, mengalihmedia/formatkan, mengelola
dalam bentuk pangkalan data (database), merawat, dan memublikasikan tugas akhir saya
selama tetap mencantumkan nama saya sebagai penulis/pencipta dan sebagai pemilik
Hak Cipta.
Demikian pernyatan ini saya buat dengan sebenarnya.
Dibuat di : Depok
Pada tanggal : 4 Agustus 2021
Yang menyatakan
(Douglas Raevan Faisal)
v
KATA PENGANTAR
Puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa atas berkah dan karuni-
anya penulis berkesempatan dalam melakukan penelitian sebagai pemenuhan dari tugas
akhir yang berjudul ’Deteksi Misinformasi COVID-19 pada Tweet Berbahasa Indonesia
Menggunakan Model Pemelajaran Mesin Bertingkat dan Pre-Trained Language Model’.
Proses pengerjaan penelitian ini juga tidak terlepas dari bantuan kerabat dan rekan dari
penulis. Oleh karena itu, penulis ingin mengucapkan terima kasih kepada:
1. Kedua orang tua penulis, kakek dan nenek, dan adik penulis yang selalu memberik-
an dukungan sepenuh hati selama proses pengerjaan.
2. Bapak Rahmad Mahendra, S.Kom., M.Sc. selaku dosen pembimbing pada pene-
litian ini yang telah memberikan ide penelitian dan membimbing penulis dalam
pengerjaan penelitian ini serta memastikan penelitian berjalan dengan baik dan be-
nar.
3. Tim Annotator yang terdiri dari Ariq Naufal, Pradipta Gitaya, Norman Wicaksana,
Chelvine, Yudha Pradipta, Hamam Abdurrachman, dan Sandika Prangga yang telah
membantu dalam proses anotasi dataset yang dibutuhkan pada penelitian.
4. Grup Alpha Decade yang terdiri dari Alya Isti, Raihansyah Attallah, I Made Adisur-
ya, Graciela Chika, Rania Tsany, Hendrick Putra, dan Nabila Fathia atas dukungan
moril dan telah menemani pengerjaan penelitian hingga larut malam.
5. Teman-teman seperjuangan skripsi: Darell Hendry, Ramawajdi Kanishka, Alif Si-
regar, Rifqi Prabantoro, serta teman-teman lainnya yang tidak dapat disebutkan satu
per satu.
6. Teman dekat penulis, Nurmalitasari Rahadian yang telah terus-menerus memberik-
an semangat di kala suka dan duka bagi penulis.
7. Tim Cloud Access yang terdiri dari Adam Maulana, Clouddian Fazalmuttaqin, dan
Nathasya Eliora yang telah membujuk penulis untuk ikut lomba Imagine Cup serta
meraih posisi World Finalist.
8. Rekan kerja satu tim yang terdiri dari Zaki Raihan, Andry Sistiawan, Valentinus De-
vin, Oriz Wijoseno, Sulaiman Syahrod, dan Lutfi Maulana yang telah mendukung
penulis untuk menyelesaikan skripsi.
9. Kontributor template LATEXskripsi Universitas Indonesia yang terdiri dari Ichlasul
Affan, Azhar Kurnia, Andreas Febrian, Lia Sadita, Fahrurrozi Rahman, Andre Tam-
pubolon, dan Erik Dominikus yang telah mempermudah penulis dalam menuliskan
penelitian dalam bentuk skripsi.
vi
Penulis berharap kebaikan mereka dapat dibalas oleh Tuhan Yang Maha Esa. Penu-
lis berharap skripsi ini dapat memberikan kontribusi dalam penelitian di bidang deteksi
misinformasi pada data media sosial.
Depok, 4 Agustus 2021
Douglas Raevan Faisal
vii
ABSTRAK
Nama : Douglas Raevan Faisal
Program Studi : Sistem Informasi
Judul : Deteksi Misinformasi COVID-19 pada Tweet Berbahasa In-
donesia Menggunakan Model Pemelajaran Mesin Berting-
kat dan Pre-Trained Language Model
Pandemi COVID-19 memiliki dampak yang signifikan secara global sejak awal tahun
2020. Hal ini juga menimbulkan banyaknya simpang siur terkait penyebaran misinformasi
melalui media sosial. Ada beberapa penelitian terkait deteksi misinformasi pada data
media sosial. Akan tetapi, mayoritas penelitian berfokus pada data berbahasa Inggris.
Di sisi lain, upaya untuk meneliti model deteksi misinformasi COVID-19 di Indonesia
masih terbilang minim. Oleh karena itu, melalui penelitian ini, dilakukan eksperimen
untuk melakukan pengumpulan dan anotasi dataset, menguji model untuk mendeteksi
misinformasi COVID-19, serta diferensiasi tweet yang relevan dengan yang tidak relevan.
Proses penelitian terdiri dari dua langkah utama, yaitu pembangunan dataset dan pem-
bangunan model. Pembangunan dataset dilakukan dengan menggunakan tim annotator
yang melakukan anotasi relevansi dan misinformasi dari kumpulan tweet. Dataset hasil
anotasi menjadi masukan untuk pembangunan model. Dalam penelitian ini, diusulkan
penggunaan model prediksi bertingkat serta pre-trained language model IndoBERT se-
bagai state-of-the-art language model. Model tersebut dibandingkan dengan beberapa
model lainnya yang umum digunakan pada penelitian-penelitian terkait klasifikasi teks.
Hasil yang diperoleh menunjukkan bahwa kombinasi antara BERT sequence classifier
untuk prediksi relevansi dan Bi-LSTM untuk deteksi misinformasi unggul dengan akurasi
87,12% dan F1 misinformasi sebesar 60,61%, lebih unggul dibanding model pemelajar-
an mesin lainnya. Penelitian ini juga menghasilkan korpus misinformasi teks berbahasa
Indonesia dengan tingkat keandalan yang baik (skor Kappa > 0,80).
Kata kunci:
covid-19, misinformasi, tweet, indonesia, klasifikasi teks, BERT