ABSTRAK
Female Daily Network perusahaan yang bergerak di bidang media sosial. Female Daily
memiliki media sosial untuk membagikan pengalaman menggunakan produk kecantikan
bernama Female Daily. Female Daily memiliki peraturan untuk tidak menggunakan
Female Daily Platform untuk mempromosikan, menjual produk, dan layanan di platform
media sosial di Female Daily. Namun, pengguna di Female Daily terkadang melanggar
peraturan tersebut di post mereka dan menyebabkan pengguna lain terganggu akan hal
tersebut. Admin di Female Daily kesulitan untuk mengidentifikasi pengguna yang
melanggar aturan itu dan melarang post mereka yang berisi penjualan produk karena
keterbatasan jumlah admin dengan jumlah post yang masuk tiap hari. Text mining juga
dapat mengatasi permasalahan ini dengan menentukan klasifikasi secara otomatis dengan
membuat sistem yang melakukan proses pembelajaran dengan dari kata-kata post yang
tersedia. Algoritme yang bisa digunakan untuk melakukan proses text mining pada
penelitian ini seperti Support Vector Machine (SVM), Naïve Bayes (NB), Decision Tree
(DT), dan Random Forest (RF). Penelitian ini menggunakan kombinasi cara ekstraksi
fitur, fitur kontekstual, dan melakukan balancing data. Penelitian ini menggunakan
skenario penelitian untuk menganalisis ekstraksi fitur, penggunaan fitur kontekstual, dan
balancing data. Algoritme terbaik dilihat dari nilai recall pada kombinasi algoritme dan
fitur penelitian ini adalah Random Forest TF-IDF Unigram dan menggunakan tambahan
fitur kontekstual deteksi uang dan kata-kata menjual dengan data yang seimbang. Nilai
recall 88.37% didapatkan dari hasil kombinasi algoritme dan fitur tersebut.
|