Library Automation and Digital Archive
LONTAR
Fakultas Ilmu Komputer
Universitas Indonesia

Pencarian Sederhana

Find Similar Add to Favorite

Call Number SK-1175 (Softcopy SK-657) Source code SK-451
Collection Type Skripsi
Title Klasifikasi dokumen teks berdasarkan subject headings dengan algoritma naive bayes dan support vector machine serta pengaruh dokumen unlabeled pada klasifikasi
Author Panji Yudha Satriawan;
Publisher Depok: Fakultas Ilmu Komputer, 2013
Subject
Location FASILKOM-UI;
Lokasi : Perpustakaan Fakultas Ilmu Komputer
Nomor Panggil ID Koleksi Status
SK-1175 (Softcopy SK-657) Source code SK-451 TERSEDIA
Tidak ada review pada koleksi ini: 41077
Semakin berkembangnya dokumen penelitian membuat perpustakaan melengkapi fasilitasnya dengan seperangkat alat bantu information retrieval, salah satunya adalah subject headings. Pemberian subject headings pada banyak dokumen secara manual akan memakan banyak waktu dan tenaga, sehingga digunakan klasifikasi secara otomatis untuk memberikan subject headings secara cepat dan tepat. Klasifikasi dokumen secara otomatis akan sangat membantu proses pemberian subject headings untuk mengakomodasi pencarian dokumen yang efektif. Salah satu contoh perpustakaan digital adalah Garuda (Garba Rujukan Digital) yang dikembangkan sebagai portal untuk mengintegrasikan data karya ilmiah perpustakaan-perpustakaan di Indonesia. Klasifikasi dokumen secara otomatis dapat menentukan subject headings pada karya-karya ilmiah yang terdapat pada Garuda yang belum memiliki subject headings sesuai aturan Library of Congress Classification, sehingga proses pencarian karya ilmiah pada Garuda menjadi lebih efektif. Pendekatan klasifikasi dapat dilakukan dengan pendekatan supervised learning dan semi-supervised learning. Pada tugas akhir ini metode klasifikasi yang digunakan untuk pendekatan supervised learning adalah metode Naive Bayes dan Support Vector Machine sedangkan pendekatan semi-supervised learning menggunakan metode Expectation Maximization. Selain melihat keefektifian metode Naive Bayes dan Support Vector Machine dalam mengklasifikasikan dokumen berdasarkan subject headings, penelitian ini juga melihat sejauh mana peran dokumen unlabeled pada proses klasifikasi tersebut. Percobaan pada tugas akhir ini juga menganalisis penggunaan jenis fitur, proporsi fitur yang digunakan, dan k-fold cross validation pada hasil klasifikasi. Secara umum, metode Support Vector Machine memberikan akurasi yang lebih baik daripada Naive Bayes dengan akurasi 84,59%, sedangkan penggunaan dokumen unlabeled dapat meningkatkan dan menurunkan hasil akurasi klasifikasi. Naik turunnya akurasi klasifikasi dengan dokumen unlabeled dipengaruhi oleh jumlah fitur, jenis fitur dan proporsi dokumen labeled dan unlabeled yang digunakan pada tahap training.