Agregator berita adalah aplikasi yang memanfaatkan RSS untuk mengumpulkan berita dari berbagai situs dan menyimpannya ke suatu media. Berita yang dikumpulkan dalam jumlah besar perlu ditampilkan dalam bentuk penyajian tertentu sehingga mempermudah pembaca berita. Penyajian yang dimaksud antara lain adalah dengan mengelompokkan berita berdasarkan kategori dan mengelompokkan berita berdasarkan topik yang sama. Untuk agregator berita yang dikembangkan pada tugas akhir ini, pengelompokan berita berdasarkan kategori dilakukan dengan klasifikasi berdasarkan teknik Naïve Bayes. Pengelompokan berita berdasarkan topik yang sama dilakukan dengan clustering berdasarkan teknik Non-Negative Matrix Factorization. Untuk menguji akurasi dari kedua teknik ini, dilakukan serangkaian eksperimen dengan menggunakan data berupa deskripsi berita yang diperoleh dari RSS feed. Parameter yang divariasikan untuk klasifikasi berita adalah jenis fitur, jumlah fitur, jumlah hari untuk data training, sumber berita, dan jenis representasi berita. Sementara parameter yang divariasikan untuk clustering berita berdasarkan topik yang sama adalah jumlah kluster dan batasan jarak data terhadap centroid kluster. Dari hasil eksperimen klasifikasi berita berdasarkan kategori, dapat dilihat bahwa dengan menggunakan jenis fitur presence, jumlah fitur sebesar 40%, dan data training berupa berita dengan tanggal publikasi 1 sampai 7 hari sebelum tanggal publikasi data testing, dicapai akurasi sebesar 79.45%. Dari hasil eksperimen clustering berita berdasarkan topik yang sama, dapat dilihat bahwa pemberian batasan jarak data terhadap centroid kluster secara umum dapat meningkatkan kualitas kluster. Untuk sistem agregator berita yang dikembangkan, batasan yang ditentukan adalah 0.45. Prototipe dari sistem agregator berita dapat diakses di http://bahasa.cs.ui.ac.id/agregator_berita.
|
|