Tidak ada review pada koleksi ini: 50802
ABSTRAK
Nama : Ajeng Dwi Asti
Program Studi : Magister Ilmu Komputer
Judul : Identifikasi Target, Kategori, dan Level Ujaran Kebencian pada Data
Twitter Berbahasa Daerah Menggunakan Classical Machine Learning dan
Deep Learning
Pembimbing : Dr. Indra Budi S.Kom., M.Kom.
Ujaran kebencian dapat menyebabkan terjadinya konflik dan pembantaian di masyarakat
sehingga harus segera ditangani. Indonesia memiliki lebih dari 700 bahasa daerah dengan
karakteristik masing-masing. Ujaran kebencian yang ada di Indonesia juga pernah
dilakukan menggunakan bahasa daerah. Media sosial Twitter paling sering digunakan
dalam menyebarkan ujaran kebencian. Identifikasi target, kategori, serta level ujaran
kebencian dapat membantu Polri dan Kemenkominfo dalam menentukan prioritas
penanganan ujaran kebencian sehingga dapat meminimalisir dampaknya. Penelitian ini
melakukan identifikasi ujaran kasar dan ujaran kebencian beserta target, kategori, dan level
ujaran kebencian pada data Twitter berbahasa daerah menggunakan algoritma classical
machine learning dan deep learning. Penelitian ini menggunakan data lima bahasa daerah
di Indonesia dengan penutur terbanyak yaitu Jawa, Sunda, Madura, Minang, dan Musi.
Pada data Bahasa Jawa performa terbaik diperoleh menggunakan algoritma Support Vector
Machine (SVM) dengan transformasi data Classifier Chains (CC) serta kombinasi fitur
word unigram, bigram, dan trigram dengan F1-score 70,43%. Algoritma SVM dengan
transformasi data CC serta kombinasi fitur word unigram dan bigram memberikan
performa terbaik pada data Bahasa Sunda dan Madura dengan masing-masing F1-score
68,79% dan 78,81%. Sementara itu, pada data Bahasa Minang dan Musi hasil terbaik
diperoleh menggunakan algoritma SVM dengan transformasi data CC serta fitur word
unigram dengan F1-score 83,57% dan 80,72%. Penelitian ini diharapkan dapat digunakan
sebagai masukan bagi Polri dan Kemenkominfo dalam pembangunan sistem identifikasi
ujaran kasar, ujaran kebencian serta target, kategori, dan level ujaran kebencian pada media
sosial.
Kata Kunci:
bahasa daerah, deep learning, machine learning, Twitter, ujaran kebencian