ABSTRAK

Female Daily Network perusahaan yang bergerak di bidang media sosial. Female Daily memiliki media sosial untuk membagikan pengalaman menggunakan produk kecantikan bernama Female Daily. Female Daily memiliki peraturan untuk tidak menggunakan Female Daily Platform untuk mempromosikan, menjual produk, dan layanan di platform media sosial di Female Daily. Namun, pengguna di Female Daily terkadang melanggar peraturan tersebut di post mereka dan menyebabkan pengguna lain terganggu akan hal tersebut. Admin di Female Daily kesulitan untuk mengidentifikasi pengguna yang melanggar aturan itu dan melarang post mereka yang berisi penjualan produk karena keterbatasan jumlah admin dengan jumlah post yang masuk tiap hari. Text mining juga dapat mengatasi permasalahan ini dengan menentukan klasifikasi secara otomatis dengan membuat sistem yang melakukan proses pembelajaran dengan dari kata-kata post yang tersedia. Algoritme yang bisa digunakan untuk melakukan proses text mining pada penelitian ini seperti Support Vector Machine (SVM), Naïve Bayes (NB), Decision Tree (DT), dan Random Forest (RF). Penelitian ini menggunakan kombinasi cara ekstraksi fitur, fitur kontekstual, dan melakukan balancing data. Penelitian ini menggunakan skenario penelitian untuk menganalisis ekstraksi fitur, penggunaan fitur kontekstual, dan balancing data. Algoritme terbaik dilihat dari nilai recall pada kombinasi algoritme dan fitur penelitian ini adalah Random Forest TF-IDF Unigram dan menggunakan tambahan fitur kontekstual deteksi uang dan kata-kata menjual dengan data yang seimbang. Nilai recall 88.37% didapatkan dari hasil kombinasi algoritme dan fitur tersebut.