ABSTRAK
ABSTRAK
Nama : Tinaliah
Program Studi : Magister Ilmu Komputer
Judul : Ringkasan Multi – Dokumen Berbahasa Indonesia Secara
Otomatis Menggunakan Metode Latent Semantic Analysis dan
Centroid – Based Summarization
Tesis ini menjelaskan mengenai penggabungan antara metode Latent Semantic
Analysis dan Centroid-based Summarization dalam proses peringkasan multidokumen
berbahasa Indonesia. Evaluasi peringkasan multi-dokumen berbahasa
Indonesia akan dibandingkan dengan ringkasan yang dihasilkan oleh sistem
terhadap hasil ringkasan referensi yang dibuat oleh ahli Bahasa Indonesia dengan
mengukur akurasi kalimat yang sama muncul pada ringkasan yang dihasilkan oleh
sistem terhadap ringkasan referensi. Besarnya korpus data training yang kita
punya dapat meningkatkan nilai cosine similarity tiap kalimat yang dihasilkan
pada metode LSA. Secara keseluruhan akurasi pada pengabungan antara metode
latent semantic analysis dan metode centroid-based summarization menghasilkan
akurasi yang lebih baik sebesar 26.62% dibandingkan dengan metode centroidbased
summarization sebesar 23.81%, dengan selisih rata-rata akurasi
pengabungan antara metode latent semantic analysis dan metode centroid-based
summarization dengan rata-rata akurasi metode centroid-based summarization
adalah sebesar 2,82%.
Kata Kunci : Latent Semantic Analysis, Centroid – Based Summarization,
Peringkasan multi-dokumen, Ringkasan referensi, Korpus, Evaluasi, Akurasi
|