Call Number | SK-2308 (Softcopy SK-1790) |
Collection Type | Skripsi |
Title | Perbandingan Performa Algoritma Textrank dengan Unweighted dan Weighted Word Embedding pada Peringkasan Dataset Indosum |
Author | Piawai Said Umbara; |
Publisher | Depok: Fasilkom UI, 2024 |
Subject | Textrank |
Location | FASILKOM-UI; |
Nomor Panggil | ID Koleksi | Status |
---|---|---|
SK-2308 (Softcopy SK-1790) | TERSEDIA |
Nama : Piawai Said Umbara Program Studi : Ilmu Komputer Judul : Perbandingan Performa Algoritma TextRank dengan Unweighted dan Weighted Word Embedding pada Peringkasan Dataset IndoSum Pembimbing : Evi Yulianti, S.Kom, M.Kom, M.Comp.Sc., Ph.D. Penelitian ini bertujuan untuk mengevaluasi efektivitas kombinasi metode TextRank dengan word embedding pada dataset IndoSum. Dua skenario eksperimen diterapkan: unweighted dan weighted. Hasil eksperimen menunjukkan bahwa penggunaan model word embedding pada algoritma TextRank terbukti meningkatkan performa sistem peringkasan. Skenario unweighted menguji perbandingan performa antara sistem baseline (kombinasi dari TextRank dengan Word2Vec dan pembobotan TF-IDF yang dilatih menggunakan dataset Liputan6) dengan beberapa sistem lainnya yang memadukan algoritma TextRank dengan model word embedding tanpa pembobotan TF-IDF. Skenario weighted menguji perbandingan sistem yang memadukan algoritma TextRank dengan model word embedding tanpa pembobotan TF-IDF dengan counterpart-nya yang memadukan algoritma TextRank dengan model word embedding ditambah pembobotan TF-IDF. Pada skenario unweighted, kombinasi TextRank dan fastText yang dilatih dengan dataset IndoSum menunjukkan peningkatan performa tertinggi untuk skor ROUGE-1 dan ROUGE-2 masing-masing sebesar 7,51% dan 4,24%. Sedangkan pada skenario weighted, pembobotan TF-IDF pada word embedding menunjukkan peningkatan performa sebagian besar sistem peringkasan dibandingkan penggunaan word embedding tanpa pembobotan TF-IDF, dengan rata-rata peningkatan performa sistem sebesar 5,55% pada ROUGE-1 dan 9,95% pada ROUGE-2. Kata Kunci: indosum, peringkasan dokumen, textrank, tf-idf, word embedding