Tidak ada review pada koleksi ini: 51375
ABSTRAK
Nama : Hendrico Kristiawan
Program Studi : Ilmu Komputer
Judul : Klasifikasi Domain Spesialisasi Dokter pada Data Teks
Forum Tanya Jawab Kesehatan
Pembimbing : Alfan Farizki Wicaksono, S.T., M.Sc., Ph.D.
Rahmad Mahendra, S.Kom., M.Sc.
Pertanyaan konsultasi pada sebuah forum daring perlu dijawab oleh dokter spesialis yang
tepat agar jawaban yang diberikan akurat dan bermanfaat bagi pengguna yang bertanya.
Terkait hal tersebut, penelitian ini membahas tentang pengembangan model yang dapat
secara otomatis mengarahkan sebuah pertanyaan konsultasi kesehatan ke dokter dengan
spesialisasi yang sesuai. Lebih jauh lagi, model yang dibangun merupakan model
klasifikasi multi-label karena sebuah pertanyaan dapat terasosiasi dengan lebih dari satu
spesialisasi. Penelitian ini dimulai dengan mengevaluasi keefektifan metode pemetaan
berbasis aturan dalam memprediksi data yang dianotasi oleh pakar, dan diperoleh hasil
yang menunjukkan tingkat keberhasilan yang cukup. Selanjutnya, dikembangkan sebuah
model machine learning yang melakukan klasifikasi domain spesialis dokter. Pelatihan
model dilakukan dengan berbagai metode, termasuk supervised, unsupervised, serta
semi-supervised learning. Model terbaik ditemukan melalui metode domain adaptive
pre-training dengan IndoBERT-large sebagai model acuan dan melibatkan unsupervised
learning. Selain itu, model supervised learning juga digunakan dengan menggunakan
model konvensional, dan hasilnya digunakan untuk analisis kontribusi dari fitur-fitur
yang digunakan dalam klasifikasi. Terakhir, penelitian ini mengevaluasi kembali anotasi
yang dilakukan oleh manusia dengan menggunakan kata kunci sebagai pendekatan untuk
mengurangi kesalahan dalam dataset. Dengan pendekatan ini, berhasil ditemukan
beberapa kesalahan anotasi pada dataset yang dianotasi oleh manusia.
Kata kunci:
Klasifikasi Domain Spesialis Dokter, Supervised-Learning, Unsupervised Learning,
Domain Adaptive Pre-Training, Semi-supervised Learning, GAN-BERT, Analisis
Kontribusi Fitur, Data Tidak Berlabel.