Library Automation and Digital Archive
LONTAR
Fakultas Ilmu Komputer
Universitas Indonesia

Pencarian Sederhana

Find Similar Add to Favorite

Call Number SK-0622 (Softcopy SK-103) Source Code SK-90
Collection Type Skripsi
Title Pengklasifikasian secara otomatis berbasiskan centroid pada abstrak berbahasa Indonesia/ Natalia Komalasari
Author Natalia Komalasari;
Publisher Depok: Fasilkom, 2006
Subject Text processing(Computer Science)-congress
Location FASILKOM-UI;
Lokasi : Perpustakaan Fakultas Ilmu Komputer
Nomor Panggil ID Koleksi Status
SK-0622 (Softcopy SK-103) Source Code SK-90 TERSEDIA
Tidak ada review pada koleksi ini: 10886
ABSTRAK

Klasifikasi adalah pemberian kategori pada dokumen. Dengan klasifikasi maka dokumen yang tidak relevan atau tidak menarik minat dapat segera dilewatkan. Awalnya klasifikasi dilakukan secara manual. Namun waktu serta biaya yang tidak sedikit yang dibutuhkan klasifikasi manual ditambah lagi dengan peningkatan jumlah dokumen telah mendorong perkembangan metode pengklasifikasian secara otomatis. Salah satu metode dalam pengklasifikasian secara otomatis yang dibahas dalam tugas akhir ini adalah metode pengklasifikasian dengan centroid. Untuk setiap kategori akan dihitung sebuah centroid dari dokumen training. Setiap dokumen testing akan dihitung similarity-nya dengan setiap centroid kategori dan dokumen akan diklasifikasikan ke kategori yang memiliki nilai similarity terbesar. Ada dua jenis data set yang digunakan dalam tugas akhir ini. Data set yang pertama terdiri dari tujuh kategori dimana setiap kategori saling berlainan. Kedua data set diperoleh dari koleksi perpustakaan pusat Universitas Indonesia, koleksi perpustakaan universitas Atma Jaya, koleksi perpustakaan Fakultas Ilmu Budaya Universitas Indonesia dan internet. Hasil klasifikasi dengan centroid mencapai kesamaan hingga 94,9% dengan klasifikasi manual dan efektivitasnya mencapai 0,949 pada data set pertama. Sedangkan untuk data set kedua kesamaan dengan hasil klasifikasi manual mencapai 81,25% dengan efektivitas 0.813. Beberapa saran berkenaan dengan tugas akhir ini adalah memperbesar jumlah dokumen training dan testing, menguji classifier pada jenis dokumen yang lain, melakukan perbandingan dengan classifier yang menggunakan metode lain pada jenis dokumen yang sama dan menggunakan nilai threshold untuk mengatasi dokumen yang tidak berada dalam kategori yang tersedia.