Library Automation and Digital Archive
LONTAR
Fakultas Ilmu Komputer
Universitas Indonesia

Pencarian Sederhana

Find Similar Add to Favorite

Call Number T-0633 (Softcopy T-0278) Source Code T-0050
Collection Type Tesis
Title Variable latent semantic indexing sebagai teknik text retrieval yang menggunakan singular value decomposition
Author Suharto Anggono;
Publisher Depok: Fakultas Ilmu Komputer UI, 2007
Subject Latent semantic indexing ; Information retrieval--Computer programs
Location FASILKOM-UI;
Lokasi : Perpustakaan Fakultas Ilmu Komputer
Nomor Panggil ID Koleksi Status
T-0633 (Softcopy T-0278) Source Code T-0050 TERSEDIA
Tidak ada review pada koleksi ini: 25180
ABSTRAK

Sistem text retrieval (perolehan kembali teks) menanggapi query terhadap koleksi dokumen teks. Dua teknik yang telah diperkenalkan yang dapat digunakan pada text retrieval dan melibatkan penggunaan singular value decomposition (SVD, dekomposisi nilai singular) adalah variable Latent Semantic Indexing (VLSI) serta Latent Semantic Indexing (LSI), pendahulunya. Dokumen dapat dideskripsikan oleh kumpulan term, misalnya brupa kata. Dari dokumen-dokumen yang ada, dapat dibentuk matriks term-dokumen, A, yang berisi bobot term berdaarkan kemunculannya dalam dokumen. Pada VLSI, sebagaimana LSI, digunakan aproksimasi rank-rendah terhadap A untuk dicocokkan dengan vektor query. Namun, berbeda dengan LSI, aproksimasi pada VLSI tergantung pada distribusi probabilitas vektor query. Distribusi itu dicirikan oleh matriks co-occurrence, Cq. Aproksimasi untuk A itu bisa didapatkan melalui ASVD terhadap Cq^1/2 A. Telah dilakukan penelitian terhadap VLSI dengan mempelajari literatur, mengerjakan secara manual prosedur VLSI, dan melakukan percobaan penggunaan VLSI. Percobaan dilakukan dengan koleksi 100 dokumen yang pernah di gunakan pada mata kuliah Pemrosesan Teks, koleksi 9 dokumen berupa judul technical memo, koleksi MED, dan koleksi CACM. Dari analisis ditemukan bahwa yang dikalikan dengan A untuk kemudian di SVD tidak harus Cq^1/2. Dari percobaan dengan koleksi MED dan koleksi CACM, ditemukan bhwa perolehen dokumen dengan VLSI bisa bagus dalam hal precision pada sedikit dokumen berperingkat teratas. Bibliografi: 19 (1989-2007)