Call Number | KA-1553 (Softcopy KA-1538) MAK KA-1190 |
Collection Type | Karya Akhir (KA) |
Title | Deteksi produk obat aborsi secara otomatis: studi kasus Perusahaan PT XYZ |
Author | Muhammad Faisal M; |
Publisher | Jakarta : Program Studi Magister Teknologi Informasi Fasilkom UI, 2022 |
Subject | Classification Model |
Location | FASILKOM-UI-MTI; |
Nomor Panggil | ID Koleksi | Status |
---|---|---|
KA-1553 (Softcopy KA-1538) MAK KA-1190 | Ind | TERSEDIA |
Terdapat beberapa media online yang ditutup oleh Kementrian Komunikasi dan Informatika (Kemkominfo) dikarenakan menjual obat aborsi. Hal tersebut karena aborsi merupakan tindakan yang dilarang yang tertulis pada Kitab Undang-Undang Hukum Pidana (KUHP) pada pasal 346. Oleh karena itu, agar situs dari PT XYZ tidak ditutup oleh Kemkominfo, PT XYZ melakukan penanganan terkait peredaran obat aborsi ini yaitu dengan pending system. Namun, pending system hanya mendeteksi judul dari produk dengan menggunakan kata kunci spesifik yang berhubungan dengan obat aborsi yang diinput oleh tim sehingga masih terdapat produk obat aborsi yang lolos beredar karena terdapat produk yang menggunakan kata kunci yang umum dan gaming keyword. Oleh karena itu, penelitian ini membahas terkait penerapan text mining untuk membangun sebuah classification model yang berasal dari korpus obat aborsi yang ada di PT XYZ yang akan digunakan untuk pendeteksian obat aborsi kedepannya yang ada di PT XYZ. Penelitian ini menggunakan model CRISP-DM untuk siklus hidup data mining. Selain itu, untuk membangun suatu classification model, Penelitian ini melakukan percobaan terhadap dua algoritme diantaranya adalah Naive Bayes dan Support Vector Machine dengan metode k-fold cross validation. Selain itu, penelitian ini menggunakan data harga sebagai fitur tambahan dari model yang dibangun. Untuk penentuan classification yang terbaik dilakukan evaluasi performa dari setiap classification model dengan menggunakan confussion matrix dengan parameter accuracy, recall, precision, f1- measure, dan AUC. Penelitian ini menggunakan beberapa kriteria dalam penghapusan duplikasi data untuk menghindari data bias. Model terbaik yang didapatkan yaitu model SVM dengan fitur harga yang memiliki nilai accuracy 99.82%, f1-score 99.79%, dan AUC 99.98%. Hasil dari model yang telah dianalisis pada penelitian ini dapat digunakan oleh PT XYZ untuk mendeteksi produk obat aborsi agar mengurangi kesempatan penjual menjual produk obat aborsi yang di PT XYZ. Selain itu, penelitian ini dapat memberikan gambaran untuk penelitian akademis berikutnya terkait keseluruhan proses dari text mining