ABSTRACT
Nama : Abdul Rahman
Program Studi : Ilmu Komputer
Judul : Sistem Temu-balik Pengetahuan untuk Helpdesk PDDikti
dengan Reranking dan Ekspansi Dokumen
Pembimbing : Alfan Farizki Wicaksono, Ph.D.
Annisa Nur Fadhilah, S.Kom.
Website Helpdesk PDDikti memiliki sekumpulan knowledge yang belum didukung
oleh sistem pencarian yang efektif. Penelitian ini bertujuan untuk membangun sistem
temu-balik informasi yang efektif dengan skor metrik yang tinggi terhadap knowledge
Helpdesk PDDikti. Metode yang digunakan dalam penelitian ini adalah penerapan
model temu-balik informasi berbasis text matching pada berbagai model, yang kemudian
disempurnakan dengan dua metode perbaikan ranking dokumen: (1) metode eskpansi
istilah pada dokumen menggunakan prediksi kueri dari model doc2query, dan (2) metode
reranking dokumen menggunakan model LambdaMART. Hasil penelitian menunjukkan
bahwa di antara beberapa model temu-balik informasi berbasis text matching, model
BM25 memberikan kinerja terbaik dengan skor MRR 0,781. Selanjutnya, hasil ranking
dokumen dari model BM25 dapat ditingkatkan akurasinya melalui metode ekspansi
istilah dengan lima kueri menggunakan pemilihan kandidat random sampling, yang
meningkatkan skor MRR menjadi 0,799. Namun, penggunaan metode reranking dengan
model LambdaMART untuk meningkatkan akurasi hasil ranking dokumen belum
memberikan hasil yang lebih baik dibandingkan metode ekspansi istilah. Meskipun
demikian, terdapat varian model reranking LambdaMART yang menggunakan fitur
semantic similarity dan fitur skor agregat, yang mampu mengalahkan model BM25 tanpa
ekspansi istilah, dengan skor MRR terbaik masing-masing 0,782 dan 0,787. Meskipun
begitu, peningkatan ini masih belum cukup signifikan.
Kata kunci:
Helpdesk PDDtikti, text retrieval, text matching, BM25, ekspansi dokumen, LambdaMART,
temu-balik informasi , semantic similarity, reranking
|