ABSTRAK
Nama : Rendya Yuschak
Program Studi : Ilmu Komputer
Judul
:
Pembimbing
:
Studi Komparatif Model Unsupervised Outlier Detection
dengan Pembuatan Data Sintetis Realistis: Studi Kasus
Data Finansial Tidak Berlabel
Dr.rer.nat. Fariz Darari, S.Kom., M.Sc.
Denny, S.Kom., M.I.T., Ph.D.
Dalam era digital saat ini, banyaknya data finansial yang melimpah dan tidak berlabel
menimbulkan tantangan dalam pemilihan teknik pendeteksian outlier (outlier detection)
yang optimal. Penelitian ini bertujuan untuk menangani tantangan tersebut dengan
membandingkan model unsupervised outlier detection pada data sintetis yang dirancang
untuk meniru karakteristik data finansial nyata. Sebagai studi kasus, penelitian ini
menggunakan data Laporan Harta Keuangan Penyelenggara Negara (LHKPN) tahun
2022. Proses penelitian mencakup pengumpulan data, pemrosesan, pembuatan data
sintetis, pengujian sepuluh algoritma outlier detection, dan penerapan model terbaik pada
data LHKPN tahun 2022. Dari proses ini, model Median Absolute Deviation (MAD)
dengan threshold 7.8 teridentifikasi sebagai yang paling efektif pada data sintetis yang
meniru data LHKPN. Penelitian ini juga menemukan hyperparameter terbaik untuk
model lain dan melakukan analisis skor outlier pada data nyata. Hasilnya memberikan
wawasan baru dan menunjukkan potensi investigasi lanjutan dalam outlier detection pada
data finansial tidak berlabel, dengan pendekatan yang menyeluruh mulai dari analisis
distribusi data hingga pengujian model pada data sintetis dan asli.
Kata kunci:
data finansial, data sintetis, data tidak berlabel, MAD, pendeteksian outlier unsupervised
|