Fokus dari penelitian ini adalah untuk mengembangkan data dan sistem Question Answering (QA) Bahasa indonesia untuk pertanyaan non-factoid. Pertayaan non-factoid ini meliputi pertanyaan "definisi", "alasan" dan "metode", dimana jenis pertanyaan ini merupakan pertanyaan yang sering digunakan dalam rangka melakukan pemahaman terhadap sesuatu. Penelitian ini merupakan penelitian QA non-factoid pertama untuk bahasa indonesia. Adapun sistem QA terdiri atas 3 komponen yaitu penganalisis pertanyaan, pengambil paragraf dan pencari jawaban. Dalam komponen penganalisis pertanyaan, dengan asumsi bahwa pertanyaan yang diajukan merupakan pertanyaan sederhana, digunakan sistem yang berbasis aturan sederhana dengan mengandalkan kata pertanyaan yang digunakan ("apa, "mengapa" dan bagaimana"), Pada komponen pengambil paragraf, paragraf diperoleh dengan menggunakan pencarian kata kunci baik dengan menggunakan stemming ataupun tidak. Untuk pencari jawaban, jawaban diperoleh dengan menggunakan pola kata-kata khusus yang ditetapkan sebelumnya untuk setiap jenis pertanyaan. Dalam komponen pencari jawaban ini, diperoleh kesimpulan bahwa penggunaan kata kunci non-stemmed bersamaan dengan kata kunci hasil stemming memberikan nilai akurasi jawaban yang lebih baik jika dibandingkan dengan penggunaan kata kunci non stemmed saja atau kata kunci stem saja. Dengan menggunakan 90 pertanyaan yang dikumpulkan dari 10 orang Indonesia dan 61 dokumen sumber, diperoleh nilai MRR 0,7689, 0,5925 dan 0,5704 untuk tipe pertanyaan definisi, alasan dan metode secara berurutan. |