Library Automation and Digital Archive
LONTAR
Fakultas Ilmu Komputer
Universitas Indonesia

Pencarian Sederhana

Find Similar Add to Favorite

Call Number SK-0827 (Softcopy SK-309) Source code SK-271
Collection Type Skripsi
Title Pengembangan sistem agregator berita bahasa indonesia dengan klasifikasi berbasis naive bayes dan clustering berbasis non-negative matrix factorization
Author Natasha;
Publisher Depok: Fasilkom UI, 2010
Subject
Location FASILKOM-UI;
Lokasi : Perpustakaan Fakultas Ilmu Komputer
Nomor Panggil ID Koleksi Status
SK-0827 (Softcopy SK-309) Source code SK-271 Tgl Kembali:2011-03-03
Tidak ada review pada koleksi ini: 31554
Agregator berita adalah aplikasi yang memanfaatkan RSS untuk mengumpulkan berita dari berbagai situs dan menyimpannya ke suatu media. Berita yang dikumpulkan dalam jumlah besar perlu ditampilkan dalam bentuk penyajian tertentu sehingga mempermudah pembaca berita. Penyajian yang dimaksud antara lain adalah dengan mengelompokkan berita berdasarkan kategori dan mengelompokkan berita berdasarkan topik yang sama. Untuk agregator berita yang dikembangkan pada tugas akhir ini, pengelompokan berita berdasarkan kategori dilakukan dengan klasifikasi berdasarkan teknik Naïve Bayes. Pengelompokan berita berdasarkan topik yang sama dilakukan dengan clustering berdasarkan teknik Non-Negative Matrix Factorization. Untuk menguji akurasi dari kedua teknik ini, dilakukan serangkaian eksperimen dengan menggunakan data berupa deskripsi berita yang diperoleh dari RSS feed. Parameter yang divariasikan untuk klasifikasi berita adalah jenis fitur, jumlah fitur, jumlah hari untuk data training, sumber berita, dan jenis representasi berita. Sementara parameter yang divariasikan untuk clustering berita berdasarkan topik yang sama adalah jumlah kluster dan batasan jarak data terhadap centroid kluster. Dari hasil eksperimen klasifikasi berita berdasarkan kategori, dapat dilihat bahwa dengan menggunakan jenis fitur presence, jumlah fitur sebesar 40%, dan data training berupa berita dengan tanggal publikasi 1 sampai 7 hari sebelum tanggal publikasi data testing, dicapai akurasi sebesar 79.45%. Dari hasil eksperimen clustering berita berdasarkan topik yang sama, dapat dilihat bahwa pemberian batasan jarak data terhadap centroid kluster secara umum dapat meningkatkan kualitas kluster. Untuk sistem agregator berita yang dikembangkan, batasan yang ditentukan adalah 0.45. Prototipe dari sistem agregator berita dapat diakses di http://bahasa.cs.ui.ac.id/agregator_berita.