Library Automation and Digital Archive
LONTAR
Fakultas Ilmu Komputer
Universitas Indonesia

Pencarian Sederhana

Find Similar Add to Favorite

Call Number T-0531 (Softcopy T-0175) Source Code T-0033
Collection Type Tesis
Title Pengindeksan berdasarkan Maximal Frequent sequences dalam Sistem temu-kembali informasi teks berbahasa Indonesia
Author Dwi Astuti Aprijani;
Publisher Depok: Fakultas Ilmu Komputer UI, 2006
Subject Information retrieval
Location FASILKOM-UI;
Lokasi : Perpustakaan Fakultas Ilmu Komputer
Nomor Panggil ID Koleksi Status
T-0531 (Softcopy T-0175) Source Code T-0033 TERSEDIA
Tidak ada review pada koleksi ini: 10777
ABSTRAK

Penelitian ini mengkaji penggunaan Maximal Frequent Sequences (MFS) sebagai indeks dalam koleksi dokumen untuk Sistem Temu-kembali Informasi teks berbahasa Indonesia. Indeks, sebagai representasi dokumen, harus menggambarkan informasi keseluruhan yang terkandung dalam dokumen. MFS sebagai salah satu cara untuk mengekspresikan multi kata (frase) dapat digunakan sebagai indeks dalam koleksi dokumen untuk merepresentasikan isi dokumen. Kekuatan utama MFS dapat membentuk indeks yang sangat solid karena menoleransi adanya kata-kata pemisah di antara suatu pasangan kata dan jumlah istilah yang digunakan sebagai indeks sedikit. Hasil uji coba terhadap 1162 dokumen ilmiah dan 2999 dokumen berita menunjukkan bahwa jumlah istilah pada pengindeksan berdasarkan MFS jauh lebih sedikit dibandingkan jumlah istilah pada pengindeksan berdasarkan frekuensi kata (term frequency), yaitu 31% untuk koleksi dokumen ilmiah non-stemming, 48% untuk koleksi dokumen ilmiah stemming, 30% untuk koleksi dokumen berita non-stemming, dan 59% untuk koleksi dokumen berita stemming. Pada koleksi dokumen ilmiah, MFS dengan nilai threshold yang lebih kecil relatif mampu memperbaiki nilai presisi, baik presisi rata-rata sesudah memproses 20 dokumen maupun presisi rata-rata sesudah memproses dokumen dengan jumlah yang sesuai dengan jumlah dokumen relevan. Pada koleksi dokumen berita, MFS dengan nilai threshold yang kecil relatif memperbaiki nilai presisi rata-rata sesudah memproses dokumen dengan jumlah yang sesuai dengan jumlah dokumen relevan, namun threshold yang lebih besar justru memperbaiki presisi rata-rata sesudah memproses 10 dokumen. Efek stemming meningkatkan presisi rata-rata sesudah memproses 10 dokumen dan presisi rata-rata sesudah memproses dokumen dengan jumlah yang sesuai dengan jumlah dokumen relevan pada sistem temu-kembali informasi ini. Kata Kunci : sistem temu-kembali informasi, pengindeksan, Maximal Frequent Sequences.