ABSTRAK

Jenis usaha perasuransian PT XYZ dibagi menjadi dua yaitu asuransi kesehatan dan asuransi jiwa. Salah satu risiko yang terjadi dan berdampak pada kerugian perasuransian adalah kecurangan atau fraud yang dilakukan pihak tertentu untuk memperoleh keuntungan sepihak. Penelitian ini dilakukan untuk membuat pemodelan data mining yang digunakan untuk mendeteksi fraud pada asuransi kesehatan. Tujuan dari penelitian ini adalah memperoleh algoritma model berbasis data mining yang dapat mendeteksi fraud pada transaksi klaim peserta di PT XYZ. Karakteristik data yang digunakan bersifat imbalanced, karena jumlah data fraud yang digunakan tidak sebesar jika dibandingkan dengan data yang bersifat normal. Pembentukan model pada penelitian ini dilakukan dengan 32 skenario, dengan hasil terbaik skenario dengan penerapan feature engineering, feature selection, oversampling dan uji validasi menggunakan 20-fold cross validation. Adapun hasil dari skenario tersebut menghasilkan algoritma random forest yang memiliki nilai akurasi paling baik yaitu 99,3% dengan didukung oleh nilai presisi, recall, dan f1 scores masing-masing, 99,3%, 99,3%, dan 99,3%. Hasil akhir dari penelitian ini memperlihatkan bahwa teknik feature engineering dengan penambahan atribut is_dr_speciality, memiliki kontribusi terhadap nilai akurasi model.