ABSTRAK
Kebutuhan akan sistem temu-kembali infoamsi dalam Bahasa Indonesia mendorong dilaksanakannya peneliti ini. Salah satu tujuan penelitian ini adalah membuat Sistem Temu-kembali Informasi dengan Mengimplementasikan Operasi Boolean, Sistem Peringkat, Perbaikan Query, dan Pemanfaatan Tesaurus Penelitian ini memanfaatkan beberapa hasil penelitian sebelumnya yang mendukung temu-kembali informasi. Sistem Temu-kembali informasi yang terbentuk terdiri dari beberapa bagian yaitu:(1)proses parsing dokumen yaitu pengambilan kata-kata dari dokumen, (2) proses buang kata buangan (stoplist) yaitu kata yang tidak mewakili isi dokumen sehingga tidak dapat dijadikan sebagai indeks, (3)proses stemming kata yaitu proses penghinglangan imbuhan yang tidak perlu dari sautu kata turunan (berimbuhan), (4) proses indexing yaitu pemilihan istilah (indeks),(5) struktur berkas pembalikan dokumen(inverted file) yaitu struktur berkas yang digunakan untuk menyimpan pasangan istilah-dokumen dan bobot istilah (6) proses penghitungan kemiripan antar istilah yang menggunakan koefisien Cosine atau Jaccard, (7) proses pengelompokan isttilah secara hirarki dengan menggunakan teknik Klaster Hubungan Lengkap (Complete Link Cluster), (8) proses penyusunan tesaurus secara otomatis yang akan menggunakan struktur berkas pembalikan dokumen, psose parsing, stoplist, stemming, indexing, proses penghitungan kemiripan antar dua istilah, dan proses pengelompokan istilah, (9) proses mencari hugungan antar dua istilah(similarity of terms), (10) proses mencari hubungan antar dua istilah (similarity of documents), (11) proses query yaitu proes pengambilan informasi yang dinginkan dari query yang diberikan (12) proses ranking (peringkat) yang mengurutkan dan menyampaikan dokumen yang terambil, (13) Opersi Boolean terhadap istilah-istilah dalam query untuk temu-kembali dokumen yang diinginkan, dan (14) perbaikan query (query expansion) yaitu proses memperbaiki bentuk query agar dokumen yang terambil leibh sesuai dengan yang diinginkan. Kesimpulan dari hasil penelitian ini adalah : (1) ada kecenderungan semakin tinggi derajat keterhubungan antar dua dokumen dari hasil proses otomatis hubungan antar dua dokumen, maka semakin "dekat" hubungan topik kedua dokumen tersebu, (2) ada kecenderungan semakin tinggi derajat keterhubungan antar dua istilah dari hsil proses otomatis hubungan antar dua istilah, maka semakin mendukung bahwa kedua istilah tersebut mempunyai hubungan. Keterhubungan yang terbentuk kebanyakan membentuk "kata majemuk . Hal ini menunjukkan bahwa cakupan banyak istilah dalam bahasa Indonesia yang terbentuk dari dua kata, (3) operasi Boolean dapat membantu dalam mendapatkan dokumen-dokumen yang relevan, (4) peringkat dokumen dapat membantu pemakai dalam memilih dokumen-dokumen yang relevan sesuai dengan bobotnya, (5) perbaikan query dapat membantu dalam memperoleh dokumen-dokumen yang lebih relevan.
|