ABSTRAK
Nama : Siti Hadiyan Pratiwi
Program Studi : Ilmu Komputer
Judul : Deteksi Ujaran Kebencian Terkait Agama Pada Tweet Berbahasa
Indonesia Menggunakan Algoritma Naive Bayes Dan Support Vector
Machine
Tugas akhir ini membahas mengenai cara mendeteksi ujaran kebencian terkait agama
pada tweet berbahasa Indonesia di sosial media Twitter. Sejauh pengetahuan penulis,
ini merupakan penelitian pertama mengenai ujaran kebencian terkait agama pada teks
berbahasa Indonesia. Dimulai dari pengumpulan tweet dari Twitter, pemberian
anotasi pada setiap tweet secara manual ke dalam dua kategori, mengandung ujaran
kebecian terkait agama atau tidak, dan akhirnya menggunakan machine learning
untuk membangun klasifier biner untuk mendeteksi ujaran kebencian. Klasifikasi
dilakukan dengan menggunakan Naïve Bayes and SVM. Fitur yang diekstraksi dari
data diantaranya adalah unigram, bigram, jumlah kemunculan kata dan frasa yang
terkait dengan ujaran kebencian terhadap agama, dan jumlah kemunculan kata yang
menandung sentimen negatif. Kinerja dari Naïve Bayes dan SVM dengan
menggunakan data pada penelitian ini kurang lebih sama. Feature ablation study
menunjukkan bahwa unigram adalah fitur yang paling penting. Analisis kesalahan
menunjukan bahwa kelima fitur yang digunakan masih belum cukup untuk
mendeteksi ujaran kebencian terkait agama.
Kata kunci:
Klasifikasi, Naive Bayes, SVM,Twitter, Ujaran Kebencian
|
|