Tidak ada review pada koleksi ini: 51003
ABSTRAK
Nama : Tsaqif Naufal
Program Studi : Ilmu Komputer
Judul : Pengenalan Pertanyaan, Entitas, dan Frase Kunci pada Data
Forum Tanya Jawab Kesehatan Menggunakan BERT
Seiring dengan semakin banyaknya masyarakat yang menggunakan forum
tanya-jawab kesehatan online, kebutuhan akan adanya sistem tanya-jawab
kesehatan yang dapat berjalan secara otomatis semakin besar. Salah satu bagian
penting dari sistem tanya-jawab kesehatan otomatis adalah question processing
untuk mendapatkan informasi relevan dari pertanyaan pengguna. Terdapat
beberapa task yang merupakan bagian dari question processing, di antaranya
pengenalan pertanyaan, pengenalan entitas kesehatan, dan ekstraksi frase kunci.
Pada penelitian ini, penulis mencoba tiga model untuk menyelesaikan ketiga task
tersebut, yaitu IndoDistilBERT, IndoDistilBERT-BiLSTMs, dan
IndoDistilBERT-BiLSTMs-CRF. Hasil eksperimen menunjukkan bahwa
IndoDistilBERT-BiLSTMs-CRF memberikan hasil terbaik untuk task pengenalan
pertanyaan dengan skor F1 sebesar 94,45%, lebih baik 3,15% dibandingkan
baseline. Untuk task pengenalan entitas kesehatan, IndoDistilBERT-BiLSTMs
memberikan hasil terbaik dengan skor F1 sebesar 73,78%, lebih baik 3,53%
dibandingkan baseline. Untuk task ekstraksi frase kunci, model
IndoDistilBERT-BiLSTMs memberikan hasil terbaik dengan skor F1 sebesar
77,42%, lebih baik 4,25% dibandingkan baseline. Selain itu, percobaan dengan
pendekatan multi-task learning untuk menyelesaikan task pengenalan entitas
kesehatan dan ekstraksi frase kunci belum mampu mengungguli hasil dari
pendekatan single-task learning untuk masing-masing task.
Kata kunci:
pengenalan pertanyaan, pengenalan entitas kesehatan, ekstraksi frase kunci,
sequence labeling, BERT, multi-task learning