ABSTRAK
Nama : Arya Bintang Pratama Kumaladjati
Program Studi : Ilmu Komputer
Judul : Sistem Temu-kembali Dokumen Hukum dengan
Menggunakan Ekspansi Istilah
Pembimbing : Alfan Farizki Wicaksono, S.T., M.Sc., Ph.D
Penelitian ini bertujuan untuk meningkatkan efektivitas model Temu-kembali Informasi
di bidang hukum dengan memanfaatkan metode Term Expansion. Latar belakang
penelitian ini didasarkan pada kebutuhan praktisi hukum akan sistem yang dapat
melakukan pencarian informasi secara otomatis dan efisien dalam database dokumen
hukum yang besar dan kompleks. Pendekatan yang diusulkan dalam penelitian
ini menggunakan arsitektur Cascade-Ranking Model, yang terdiri dari dua tahapan
utama: Sparse Retrieval Model untuk pencarian awal dan algoritma Re-ranking untuk
penyusunan ulang hasil pencarian. Penelitian ini berfokus pada eksplorasi kinerja Sparse
Retrieval Model melalui penerapan teknik Term Expansion, yang mencakup Query
Expansion dan Document Expansion. Query Expansion dilakukan dengan berbagai
pendekatan, termasuk non-contextual word embedding, contextual word embedding
dengan BERT, dan Local Analysis. Document Expansion melibatkan penambahan
prediksi query yang relevan ke dalam dokumen untuk meningkatkan kecocokan dengan
query pengguna. Hasil dari eksperimen menunjukkan bahwa tidak ada skenario yang
secara mutlak unggul dalam semua metrik evaluasi yang digunakan. Beberapa skenario
menunjukkan keunggulan dalam satu metrik tertentu namun mengalami penurunan
pada metrik lainnya. Pada salah satu skenario berhasil meningkatkan R@20 dari 0,896
menjadi 0,906, selain itu pada skenario lainnya berhasil meningkatkan metrik P@5 dari
0,186 menjadi 0,192. Selain itu, pada skenario yang menggunakan stopword dengan
konteks hukum untuk melakukan filter terhadap kata yang ingin diekspansi dengan word
embedding, berhasil meningkatkan R@20 dari 0,896 menjadi 0,916 dan mendapatkan
p-value sebesar 0,045. P-value yang dibawah 0,05 ini berarti terjadi peningkatan yang
signifikan pada skenario tersebut. Meskipun dapat meningkatkan beberapa metrik,
Query Expansion tidak selalu meningkatkan efektivitas Sparse Retrieval Model secara
signifikan, terutama karena kurang presisinya kata yang diekspansi dan keterbatasan
vocabulary model embedding yang digunakan. Penggunaan BERT untuk kontekstual
checking juga belum memberikan hasil yang optimal.
Kata kunci:
ekspansi istilah, ekspansi kueri, ekspansi dokumen, temu-kembali, Temu-kembali
Informasi, Sparse Retrieval Model, Word Embedding
|