Perpustakaan Fakultas Ilmu Komputer

Call Number	SK-1961 ( Softcopy SK-1443)
Collection Type	Skripsi
Title	Deteksi Misinformasi Covid-19 Pada Tweet Berbahasa Indonesia Menggunakan Model Pemelajaran Mesin Bertingkat Dan Pre-Trained Language Model
Author	Douglas Raevan Faisal;
Publisher	Depok : Fasilkom UI, 2021
Subject
Location	FASILKOM-UI;

Lokasi : Perpustakaan Fakultas Ilmu Komputer

Nomor Panggil	ID Koleksi	Status
SK-1961 ( Softcopy SK-1443)		TERSEDIA

Softcopy SK-1443 Douglas Raevan Faisal 1706984562.pdf

Tidak ada review pada koleksi ini: 49354

HALAMAN PENGESAHAN Skripsi ini diajukan oleh : Nama : Douglas Raevan Faisal NPM : 1706984562 Program Studi : Sistem Informasi Judul Skripsi : Deteksi Misinformasi COVID-19 pada Tweet Ber- bahasa Indonesia Menggunakan Model Pemelajaran Mesin Bertingkat dan Pre-Trained Language Model Telah berhasil dipertahankan di hadapan Dewan Penguji dan diterima sebagai bagian persyaratan yang diperlukan untuk memperoleh gelar Sarjana Ilmu Kom- puter pada Program Studi Sistem Informasi, Fakultas Ilmu Komputer, Universitas Indonesia. DEWAN PENGUJI Pembimbing 1 : Rahmad Mahendra S.Kom., M.Sc. ( ) Penguji 1 : Muhammad Okky Ibrohim, S.Mat., M.Kom. ( ) Penguji 2 : Alfan Farizki Wicaksono, S.T., M.Sc., Ph.D. ( ) Ditetapkan di : Depok Tanggal : 28 Juli 2021 iv HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI TUGAS AKHIR UNTUK KEPENTINGAN AKADEMIS Sebagai sivitas akademik Universitas Indonesia, saya yang bertanda tangan di bawah ini: Nama : Douglas Raevan Faisal NPM : 1706984562 Program Studi : Sistem Informasi Fakultas : Ilmu Komputer Jenis Karya : Skripsi demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Univer- sitas Indonesia Hak Bebas Royalti Noneksklusif (Non-exclusive Royalty Free Right) atas karya ilmiah saya yang berjudul: Deteksi Misinformasi COVID-19 pada Tweet Berbahasa Indonesia Menggunakan Model Pemelajaran Mesin Bertingkat dan Pre-Trained Language Model beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Noneksklusif ini Universitas Indonesia berhak menyimpan, mengalihmedia/formatkan, mengelola dalam bentuk pangkalan data (database), merawat, dan memublikasikan tugas akhir saya selama tetap mencantumkan nama saya sebagai penulis/pencipta dan sebagai pemilik Hak Cipta. Demikian pernyatan ini saya buat dengan sebenarnya. Dibuat di : Depok Pada tanggal : 4 Agustus 2021 Yang menyatakan (Douglas Raevan Faisal) v KATA PENGANTAR Puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa atas berkah dan karuni- anya penulis berkesempatan dalam melakukan penelitian sebagai pemenuhan dari tugas akhir yang berjudul ’Deteksi Misinformasi COVID-19 pada Tweet Berbahasa Indonesia Menggunakan Model Pemelajaran Mesin Bertingkat dan Pre-Trained Language Model’. Proses pengerjaan penelitian ini juga tidak terlepas dari bantuan kerabat dan rekan dari penulis. Oleh karena itu, penulis ingin mengucapkan terima kasih kepada: 1. Kedua orang tua penulis, kakek dan nenek, dan adik penulis yang selalu memberik- an dukungan sepenuh hati selama proses pengerjaan. 2. Bapak Rahmad Mahendra, S.Kom., M.Sc. selaku dosen pembimbing pada pene- litian ini yang telah memberikan ide penelitian dan membimbing penulis dalam pengerjaan penelitian ini serta memastikan penelitian berjalan dengan baik dan be- nar. 3. Tim Annotator yang terdiri dari Ariq Naufal, Pradipta Gitaya, Norman Wicaksana, Chelvine, Yudha Pradipta, Hamam Abdurrachman, dan Sandika Prangga yang telah membantu dalam proses anotasi dataset yang dibutuhkan pada penelitian. 4. Grup Alpha Decade yang terdiri dari Alya Isti, Raihansyah Attallah, I Made Adisur- ya, Graciela Chika, Rania Tsany, Hendrick Putra, dan Nabila Fathia atas dukungan moril dan telah menemani pengerjaan penelitian hingga larut malam. 5. Teman-teman seperjuangan skripsi: Darell Hendry, Ramawajdi Kanishka, Alif Si- regar, Rifqi Prabantoro, serta teman-teman lainnya yang tidak dapat disebutkan satu per satu. 6. Teman dekat penulis, Nurmalitasari Rahadian yang telah terus-menerus memberik- an semangat di kala suka dan duka bagi penulis. 7. Tim Cloud Access yang terdiri dari Adam Maulana, Clouddian Fazalmuttaqin, dan Nathasya Eliora yang telah membujuk penulis untuk ikut lomba Imagine Cup serta meraih posisi World Finalist. 8. Rekan kerja satu tim yang terdiri dari Zaki Raihan, Andry Sistiawan, Valentinus De- vin, Oriz Wijoseno, Sulaiman Syahrod, dan Lutfi Maulana yang telah mendukung penulis untuk menyelesaikan skripsi. 9. Kontributor template LATEXskripsi Universitas Indonesia yang terdiri dari Ichlasul Affan, Azhar Kurnia, Andreas Febrian, Lia Sadita, Fahrurrozi Rahman, Andre Tam- pubolon, dan Erik Dominikus yang telah mempermudah penulis dalam menuliskan penelitian dalam bentuk skripsi. vi Penulis berharap kebaikan mereka dapat dibalas oleh Tuhan Yang Maha Esa. Penu- lis berharap skripsi ini dapat memberikan kontribusi dalam penelitian di bidang deteksi misinformasi pada data media sosial. Depok, 4 Agustus 2021 Douglas Raevan Faisal vii ABSTRAK Nama : Douglas Raevan Faisal Program Studi : Sistem Informasi Judul : Deteksi Misinformasi COVID-19 pada Tweet Berbahasa In- donesia Menggunakan Model Pemelajaran Mesin Berting- kat dan Pre-Trained Language Model Pandemi COVID-19 memiliki dampak yang signifikan secara global sejak awal tahun 2020. Hal ini juga menimbulkan banyaknya simpang siur terkait penyebaran misinformasi melalui media sosial. Ada beberapa penelitian terkait deteksi misinformasi pada data media sosial. Akan tetapi, mayoritas penelitian berfokus pada data berbahasa Inggris. Di sisi lain, upaya untuk meneliti model deteksi misinformasi COVID-19 di Indonesia masih terbilang minim. Oleh karena itu, melalui penelitian ini, dilakukan eksperimen untuk melakukan pengumpulan dan anotasi dataset, menguji model untuk mendeteksi misinformasi COVID-19, serta diferensiasi tweet yang relevan dengan yang tidak relevan. Proses penelitian terdiri dari dua langkah utama, yaitu pembangunan dataset dan pem- bangunan model. Pembangunan dataset dilakukan dengan menggunakan tim annotator yang melakukan anotasi relevansi dan misinformasi dari kumpulan tweet. Dataset hasil anotasi menjadi masukan untuk pembangunan model. Dalam penelitian ini, diusulkan penggunaan model prediksi bertingkat serta pre-trained language model IndoBERT se- bagai state-of-the-art language model. Model tersebut dibandingkan dengan beberapa model lainnya yang umum digunakan pada penelitian-penelitian terkait klasifikasi teks. Hasil yang diperoleh menunjukkan bahwa kombinasi antara BERT sequence classifier untuk prediksi relevansi dan Bi-LSTM untuk deteksi misinformasi unggul dengan akurasi 87,12% dan F1 misinformasi sebesar 60,61%, lebih unggul dibanding model pemelajar- an mesin lainnya. Penelitian ini juga menghasilkan korpus misinformasi teks berbahasa Indonesia dengan tingkat keandalan yang baik (skor Kappa > 0,80). Kata kunci: covid-19, misinformasi, tweet, indonesia, klasifikasi teks, BERT