Call Number | T-1229 (Softcopy T-937) Source code T-309 Mak T-36 |
Collection Type | Tesis |
Title | Deteksi ujaran kebencian teks panjang berbahasa Indonesia menggunakan data facebook |
Author | Nofa Aulia; |
Publisher | Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2019 |
Subject | |
Location | FASILKOM-UI; |
Nomor Panggil | ID Koleksi | Status |
---|---|---|
T-1229 (Softcopy T-937) Source code T-309 Mak T-36 | TERSEDIA |
ABSTRAK Nama : Nofa Aulia Program Studi : Magister Ilmu Komputer Judul : Deteksi Ujaran Kebencian Teks Panjang Berbahasa Indonesia Menggunakan Data Facebook Pesatnya pertumbuhan teknologi dan penggunaan sosial media memberikan dampak positif dan negatif di saat yang bersamaan. Media sosial yang merupakan salah satu wadah untuk menyampaikan informasi dan mengekspresikan diri sering kali disalahgunakan sebagai media menyebarkan ujaran kebencian. Hal ini berpotensi mengancam kerukunan dan keamanan karena dapat memicu konflik di masyarakat. Dengan tingginya jumlah konten ujaran kebencian di sosial media, dibutuhkan suatu sistem yang dapat mendeteksi ujaran kebencian secara otomatis. Penelitian terkait topik ujaran kebencian telah dilakukan sejak beberapa tahun terakhir. Sebagian besar penelitian tersebut fokus mendeteksi ujaran kebencian pada dataset Twitter yang bersifat teks pendek karena memiliki batasan panjang karakter. Padahal, platform lain seperti media sosial lain, situs berita, blog, forum, dan sebagainya juga berpotensi menjadi kanal penyebaran ujaran kebencian. Berbeda dengan Twitter, media-media tersebut tidak membatasi panjang karakter dari konten yang ditulis. Hal ini menyebabkan deteksi ujaran kebencian pada teks panjang ini menjadi lebih menantang karena sering kali konten ditulis memiliki makna tersirat. Oleh sebab itu, fokus penelitian ini adalah mendeteksi ujaran kebencian pada teks panjang berbahasa Indonesia. Konten sosial media Facebook digunakan sebagai dataset dalam penelitian ini. Pendekatan machine learning digunakan untuk menyelesaikan isu ini dengan menerapkan algoritma random forest decision tree, regresi logistik, dan SVM. Hasil eksperimen yang dilakukan memperoleh performa terbaik dengan nilai F1 sebesar 95,47% dengan menggunakan algoritma SVM dan fitur TF-IDF serta jumlah dan proporsi kata bersentimen negatif. Kata Kunci: ujaran kebencian, machine learning, klasifikasi teks, teks panjang