ABSTRAK
Nama : Adrianus Saga Ekakristi
Program Studi : Ilmu Komputer
Judul : Dekomposisi Teks Pertanyaan Bidang Kesehatan Dengan
Pendekatan Sequence Labeling dan Chunking
Sistem tanya jawab kompleks bidang kesehatan menerima masukan pertanyaan
berupa teks panjang yang perlu didekomposisi sebelum diproses. Penelitian ini
mengusulkan pendekatan sequence labeling dan chunking untuk mendekomposisi
pertanyaan kompleks tersebut. Empat pekerjaan utama dalam mendekomposisi
pertanyaan kompleks adalah mendeteksi batas kalimat dan menentukan tipe kalimat,
mengenali kata yang dapat diabaikan dalam kalimat, dan mendekomposisi
pertanyaan yang memiliki beberapa sub pertanyaan yang independen. Metode sequence
labeling yang diusulkan mencapai skor F1 sebesar 0.83 dalam mendeteksi
batas awal kalimat dan 0.93 dalam menentukan tipe kalimat. Dalam mengenali
kata yang diabaikan pada kalimat, metode sequence labeling yang diusulkan mencapai
skor F1 0.90. Untuk mendekomposisi pertanyaan yang memiliki beberapa
kata tanya dan sekumpulan frasa terkoordinasi, skor F1 yang dicapai adalah 0.81
dan 0.59.
Kata Kunci:
Dekomposisi Pertanyaan Kompleks, Sistem Tanya Jawab Medis, Pengolahan
Bahasa Manusia, Sequence Labeling, Chunking
|
|