Library Automation and Digital Archive
LONTAR
Fakultas Ilmu Komputer
Universitas Indonesia

Pencarian Sederhana

Find Similar Add to Favorite

Call Number T-1020 (Softcopy T-729) Source Code T-163
Collection Type Tesis
Title Ringkasan multi-dokumen berbahasa Indonesia secara otomatis menggunakan metode latent semantic analysis dan centroid-based summarization
Author Tinaliah;
Publisher Depok: Fakultas Ilmu Komputer, 2013
Subject Latent Semantic Analysis, Centroid – Based Summarization, Multidocuments summarization, Summary Made by Human, Corpus, Evaluation
Location FASILKOM-UI;
Lokasi : Perpustakaan Fakultas Ilmu Komputer
Nomor Panggil ID Koleksi Status
T-1020 (Softcopy T-729) Source Code T-163 TERSEDIA
Tidak ada review pada koleksi ini: 40894
ABSTRAK

ABSTRAK Nama : Tinaliah Program Studi : Magister Ilmu Komputer Judul : Ringkasan Multi – Dokumen Berbahasa Indonesia Secara Otomatis Menggunakan Metode Latent Semantic Analysis dan Centroid – Based Summarization Tesis ini menjelaskan mengenai penggabungan antara metode Latent Semantic Analysis dan Centroid-based Summarization dalam proses peringkasan multidokumen berbahasa Indonesia. Evaluasi peringkasan multi-dokumen berbahasa Indonesia akan dibandingkan dengan ringkasan yang dihasilkan oleh sistem terhadap hasil ringkasan referensi yang dibuat oleh ahli Bahasa Indonesia dengan mengukur akurasi kalimat yang sama muncul pada ringkasan yang dihasilkan oleh sistem terhadap ringkasan referensi. Besarnya korpus data training yang kita punya dapat meningkatkan nilai cosine similarity tiap kalimat yang dihasilkan pada metode LSA. Secara keseluruhan akurasi pada pengabungan antara metode latent semantic analysis dan metode centroid-based summarization menghasilkan akurasi yang lebih baik sebesar 26.62% dibandingkan dengan metode centroidbased summarization sebesar 23.81%, dengan selisih rata-rata akurasi pengabungan antara metode latent semantic analysis dan metode centroid-based summarization dengan rata-rata akurasi metode centroid-based summarization adalah sebesar 2,82%. Kata Kunci : Latent Semantic Analysis, Centroid – Based Summarization, Peringkasan multi-dokumen, Ringkasan referensi, Korpus, Evaluasi, Akurasi