ABSTRAK
Nama : Ilhan Firka Najia
Program Studi : Ilmu Komputer
Judul : Temu-Balik Pertanyaan Duplikat pada Forum Kesehatan
Berbahasa Indonesia dengan Rank Fusion
Pembimbing : Alfan Farizki Wicaksono, S.T., M.Sc., Ph.D.
Syifa Nurhayati, M.Kom.
Penelitian ini mengeksplorasi efektivitas penggunaan neural rerankers yang telah dilatih
sebelumnya dalam meningkatkan kinerja model berbasis text matching seperti BM25
untuk digunakan dalam deteksi pertanyaan duplikat pada consumer health forum.
Studi ini juga meneliti metode agregasi hasil reranking dari berbagai neural rerankers
untuk menghasilkan performa yang lebih baik dibandingkan penggunaan reranker
individual. Metode reranking pertama menggunakan BM25, diikuti oleh reranking kedua
menggunakan model neural seperti cross-encoder/ms-marco-MiniLM-L-12-v2,
paraphrase-MiniLM-L6-v2, dan lainnya. Tahap ketiga melibatkan teknik rank fusion
seperti Borda Fuse, Condorcet, dan Weighted Combsum. Hasil menunjukkan bahwa
kombinasi reranking dengan neural reranker secara signifikan meningkatkan efektivitas
model BM25, terutama saat menggunakan teknik rank fusion yang lebih canggih
seperti Weighted Combsum. Studi ini menyarankan bahwa agregasi hasil reranking dapat
mengatasi kelemahan individual reranker dan memberikan hasil yang lebih konsisten
dan efektif. Penelitian ini membuka jalan untuk eksplorasi lebih lanjut dalam optimisasi
kombinasi model untuk pencarian informasi yang lebih akurat dan efisien.
Kata kunci:
neural reranker, Okapi BM25, text matching, rank fusion, Weighted Combsum, Borda
Fuse, Condorcet, temu-balik informasi, deteksi pertanyaan duplikat, konsultasi medis.
|