ABSTRAK
Nama : Rahmat Hidayah SB
Program Studi : Ilmu Komputer
Judul : Pengembangan Sistem Tanya-Jawab Indonesia-Inggris dengan Pengenalan Pola Kalimat Tanya Bahasa Indonesia Secara Umum Menggunakan OpenEphyra
Ketersediaan informasi dalam jumlah besar dan persebarannya di berbagai sumber menimbulkan permasalahan dalam mendapatkan informasi yang relevan. Sistem tanya-jawab, yang merupakan salah satu topik di bidang perolehan informasi, bertujuan untuk menemukan informasi spesifik sebagai jawaban suatu pertanyaan yang direpresentasikan oleh kueri dalam bahasa alami manusia. Penelitian ini bertujuan untuk membangun sebuah sistem tanya-jawab yang menerima pertanyaan dalam bahasa Indonesia dan melakukan pencarian pada kumpulan dokumen dalam bahasa Inggris. Penelitian ini berfokus pada pengenalan pola pertanyaan bahasa Indonesia secara umum yang bersifat fakta dan memanfaatkannya pada sistem tanya-jawab OpenEphyra.
Pertanyaan yang digunakan untuk pengujian adalah 70 pertanyaan dari topik tanya-jawab Cross Language Evaluation Forum (CLEF) 2003-2008 dengan koleksi korpus surat kabar Glasgow Herald Scotland 1995 dan Los Angeles Times 1994. Hasil pengujian menunjukkan sistem yang dikembangkan dapat mengidentifikasi tipe jawaban dengan benar untuk 69 dari 70 kueri pengujian, meskipun sistem secara keseluruhan hanya bisa menjawab 6 dari kueri tersebut. Selain itu, disimpulkan juga faktor-faktor yang memengaruhi akurasi sistem antara lain: kelengkapan aturan pola kalimat pertanyaan, gazetteer, dan akurasi hasil alih bahasa kata kunci.
Kata Kunci:
Perolehan informasi, sistem tanya-jawab, OpenEphyra
|
|