ABSTRAK
Nama : Heidi Renata Halim
Program Studi : Ilmu Komputer
Judul : Deteksi Pertanyaan Duplikat Pada Forum Kesehatan
Berbahasa Indonesia Dengan Ekspansi Kata
Pembimbing : Alfan Wicaksono
Syifa Nurhayati
Seiring dengan majunya teknologi di Indonesia, banyak layanan kesehatan online yang
bermunculan. Pengguna bisa bertanya langsung pada tenaga medis profesional tiap
mereka memiliki masalah kesehatan ringan yang tidak membutuhkan janji temu langsung
dengan dokter. Sebagai pengguna, tentunya mereka mengharapkan respon yang cepat
dari situs yang mereka gunakan, hal ini kedengarannya mustahil dilakukan karena
tidak semua tenaga medis profesional yang bekerja pada layanan medis tersebut ada
setiap saat memantau semua pertanyaan yang masuk. Namun, hal ini bisa dilakukan
dengan cara mencocokan pertanyaan yang baru dimasukkan dan mencari pertanyaan
yang sudah pernah ditanyakan di masa lalu yang memiliki persamaan dengan pertanyaan
yang baru dimasukkan. Secara singkat, kita bisa mencari duplikat dari pertanyaan yang
ditanyakan oleh pengguna dan mengembalikan jawaban dari pertanyaan duplikat tersebut
daripada menunggu jawaban langsung dari dokter. Penelitian ini akan menggunakan
pendekatan temu balik informasi dalam mendeteksi pertanyaan duplikat yang pernah
ditanyakan di masa lalu. Selain itu, penelitian ini juga akan mengkombinasikan
ekspansi kata yang dilakukan kepada kueri, dokumen, serta filter kata-kata stopword
untuk meningkatkan skor reciprocal-rank dan recall dari model yang digunakan.
Hasil penelitian ini menyimpulkan bahwa ekspansi kata yang dilakukan pada kueri
serta dokumen tidak menghasilkan skor reciprocal rank dan recall yang lebih baik.
Penggunaan word embedding untuk memperbanyak kata stopword yang dihapus dari
data mampu menghasilkan skor reciprocal rank yang lebih tinggi meskipun nilainya
belum signifikan.
Kata kunci:
word embedding, query expansion, ekspansi kata, ekspansi dokumen, stopwords removal
|