ABSTRAK

Penelitian ini bertujuan mengembangkan sistem temu kembali informasi pada sekumpulan dokumen dengan kedekatan istilah berbagai dasar dari pengukuran kemiripan dokumen (document similarity). Tujuan lainnya, mengevaluasi dokumen relevan, relevan marginal, dan tidak relevan yang ditemukan oleh sistem temu kembali informasi yang berbasis kedekatan istilah dengan menggunakan kalimat dan frase terhadap dokumen relevan-relevan marginal, dan tidak relevan yang ditemukan oleh sistem temu kembali informasi berbasis model boolean. Modul utama yang dikembangkan dalam penelitian ini adalah (1) Modul pembalikan dokumen yang lebih lengkap yaitu berisi informasi dokumen beberapa, kalimat keberapa data kata keberapa dalam kalimat. (2) Modul kedekatan istilah yaitu modul yang menguji apakah suatu pasangan istilah terdapat dalam kalimat yang sama atau pasangan istilah ini merupakan suatu frase dalam dokumen. Penelitian ini mengkaji: bagimana pola hubungan diantara dokumen relevan-relevan marginal, dan tidak relevan yang ditemukan oleh sistem temu kembali informasi terbasis model Boolean terhadap dokumen relevan, relevan marginal, dan tidak relevan yang ditemukan oleh sistem temu kembali informasi berbasis model kedekatan istilah menggunakan kalimat dan model kedekatan istilah menggunakan frase. Uji coba dilakukan pada kumpulan dokumen hasil penelitian dalam bidang sains dan teknologi nuklir lembaga BATAN. Keterlibatan real user dalam menentukan dokumen yang relevan yang dilakukan oleh Mustangimah (1998). Penelitian ini memanfaatkan pertanyaan yang diujikan pada model Boolean yang ada pada penelitian Mustangimah. Hasil penelitian menunjukkan ditemukannya inkosistensi pola antara dokumen relevan, relevan marginal dan tidak relevan yang ditemukan oleh sistem temu kembali informasi berbasis model boolean terhadap dokumen relevan, relevan marginal dan tidak relevan yang ditemukan oleh sistem temu kembali informasi berbasis model kedekatan istilah menggunakan kalimat dan model kedekatan istilah menggunakan frase.