Call Number | T-1020 (Softcopy T-729) Source Code T-163 |
Collection Type | Tesis |
Title | Ringkasan multi-dokumen berbahasa Indonesia secara otomatis menggunakan metode latent semantic analysis dan centroid-based summarization |
Author | Tinaliah; |
Publisher | Depok: Fakultas Ilmu Komputer, 2013 |
Subject | Latent Semantic Analysis, Centroid – Based Summarization, Multidocuments summarization, Summary Made by Human, Corpus, Evaluation |
Location | FASILKOM-UI; |
Nomor Panggil | ID Koleksi | Status |
---|---|---|
T-1020 (Softcopy T-729) Source Code T-163 | TERSEDIA |
ABSTRAK Nama : Tinaliah Program Studi : Magister Ilmu Komputer Judul : Ringkasan Multi – Dokumen Berbahasa Indonesia Secara Otomatis Menggunakan Metode Latent Semantic Analysis dan Centroid – Based Summarization Tesis ini menjelaskan mengenai penggabungan antara metode Latent Semantic Analysis dan Centroid-based Summarization dalam proses peringkasan multidokumen berbahasa Indonesia. Evaluasi peringkasan multi-dokumen berbahasa Indonesia akan dibandingkan dengan ringkasan yang dihasilkan oleh sistem terhadap hasil ringkasan referensi yang dibuat oleh ahli Bahasa Indonesia dengan mengukur akurasi kalimat yang sama muncul pada ringkasan yang dihasilkan oleh sistem terhadap ringkasan referensi. Besarnya korpus data training yang kita punya dapat meningkatkan nilai cosine similarity tiap kalimat yang dihasilkan pada metode LSA. Secara keseluruhan akurasi pada pengabungan antara metode latent semantic analysis dan metode centroid-based summarization menghasilkan akurasi yang lebih baik sebesar 26.62% dibandingkan dengan metode centroidbased summarization sebesar 23.81%, dengan selisih rata-rata akurasi pengabungan antara metode latent semantic analysis dan metode centroid-based summarization dengan rata-rata akurasi metode centroid-based summarization adalah sebesar 2,82%. Kata Kunci : Latent Semantic Analysis, Centroid – Based Summarization, Peringkasan multi-dokumen, Ringkasan referensi, Korpus, Evaluasi, Akurasi