Saat ini media sosial merupakan sarana komunikasi yang tidak terlepas dari penyebaran
ujaran kebencian yang cukup meresahkan penggunanya. Sejak tahun 2018 KOMINFO
telah menangani sebanyak 3.640 ujaran kebencian yang tersebar di berbagai media sosial.
Selain itu SafeNet telah menangani kasus Kekerasan Berbasis Gender Online (KBGO)
pada tahun 2021 sebanyak 677 aduan yang didominasi dengan kasus pelecehan seksual.
Disisi lain Sejak tahun 2020 Komnas Perempuan mencatat kasus kekerasan yang terjadi
dalam komunitas dan ranah publik Indonesia sebesar 21 % (1.731 kasus) dengan kasus
kekerasan seksual yang paling mendominasi. Banyaknya jenis ujaran kebencian yang
berbeda-beda menyebabkan banyak tantangan dalam mendeteksi ujaran kebencian
termasuk dalam domain kekerasan seksual. Tujuan dari penelitian ini adalah
menghasilkan model klasifikasi ujaran kebencian kekerasan seksual dengan performa dan
tingkat akurasi yang baik sehingga dapat dimanfaatkan secara teori bagi akademisi dan
praktikal bagi lembaga seperti KOMINFO, SafeNet, LBH APIK Jakarta, Komnas
Perempuan, POLRI. Data yang digunakan pada penelitian ini adalah hasil crawling media
sosial twitter pada bulan Desember 2021 hingga Januari 2022. Dengan menggunakan
pendekatan Machine Learning, dataset diolah dengangan teknik ekstraksi fitur Term
Frequency-Inverse Document Frequency (TF-IDF), beberapa teknik sampling seperti
Random Over Sampling (ROS), Random Under Sampling (RUS), Synthetic Minority
Over-sampling Technique (SMOTE), dan Adaptive Synthetic (ADASYN) serta beberapa
algoritma klasifikasi seperti Naïve bayes (NB), Support Vector Machine (SVM), Logistic
Regresion (LR), Decition Tree (DT), Random Forest (RF), Gradient Boosting Machine
(GBM) dan Extreme Gradient Boosting (XGBoost). Penelitian ini menghasilkan akurasi
tertinggi sebesar 0.9239 dimana Algoritma terbaik didominasi oleh SVM dan RF.
Implikasi penelitian ini secara teori adalah perbandingn hasil klasifikasi 35 model
klasifikasi dan secara praktik dapat diimplementsikan pada Lembaga yang memiliki
sistem pendeteksi ujaran kebencian. H
|
|