ABSTRAK
Jenis usaha perasuransian PT XYZ dibagi menjadi dua yaitu asuransi kesehatan dan
asuransi jiwa. Salah satu risiko yang terjadi dan berdampak pada kerugian perasuransian
adalah kecurangan atau fraud yang dilakukan pihak tertentu untuk memperoleh
keuntungan sepihak. Penelitian ini dilakukan untuk membuat pemodelan data mining
yang digunakan untuk mendeteksi fraud pada asuransi kesehatan. Tujuan dari penelitian
ini adalah memperoleh algoritma model berbasis data mining yang dapat mendeteksi
fraud pada transaksi klaim peserta di PT XYZ. Karakteristik data yang digunakan bersifat
imbalanced, karena jumlah data fraud yang digunakan tidak sebesar jika dibandingkan
dengan data yang bersifat normal. Pembentukan model pada penelitian ini dilakukan
dengan 32 skenario, dengan hasil terbaik skenario dengan penerapan feature engineering,
feature selection, oversampling dan uji validasi menggunakan 20-fold cross validation.
Adapun hasil dari skenario tersebut menghasilkan algoritma random forest yang memiliki
nilai akurasi paling baik yaitu 99,3% dengan didukung oleh nilai presisi, recall, dan f1
scores masing-masing, 99,3%, 99,3%, dan 99,3%. Hasil akhir dari penelitian ini
memperlihatkan bahwa teknik feature engineering dengan penambahan atribut
is_dr_speciality, memiliki kontribusi terhadap nilai akurasi model.
|