Perpustakaan Fakultas Ilmu Komputer

Call Number	SK-0622 (Softcopy SK-103) Source Code SK-90
Collection Type	Skripsi
Title	Pengklasifikasian secara otomatis berbasiskan centroid pada abstrak berbahasa Indonesia/ Natalia Komalasari
Author	Natalia Komalasari;
Publisher	Depok: Fasilkom, 2006
Subject	Text processing(Computer Science)-congress
Location	FASILKOM-UI;

Lokasi : Perpustakaan Fakultas Ilmu Komputer

Nomor Panggil	ID Koleksi	Status
SK-0622 (Softcopy SK-103) Source Code SK-90		TERSEDIA

Source Code SK-622 Natalia Komalasari.zip

SK-622 Natalia Komalasari - 1202000745.pdf

Tidak ada review pada koleksi ini: 10886

ABSTRAK

Klasifikasi adalah pemberian kategori pada dokumen. Dengan klasifikasi maka dokumen yang tidak relevan atau tidak menarik minat dapat segera dilewatkan. Awalnya klasifikasi dilakukan secara manual. Namun waktu serta biaya yang tidak sedikit yang dibutuhkan klasifikasi manual ditambah lagi dengan peningkatan jumlah dokumen telah mendorong perkembangan metode pengklasifikasian secara otomatis. Salah satu metode dalam pengklasifikasian secara otomatis yang dibahas dalam tugas akhir ini adalah metode pengklasifikasian dengan centroid. Untuk setiap kategori akan dihitung sebuah centroid dari dokumen training. Setiap dokumen testing akan dihitung similarity-nya dengan setiap centroid kategori dan dokumen akan diklasifikasikan ke kategori yang memiliki nilai similarity terbesar. Ada dua jenis data set yang digunakan dalam tugas akhir ini. Data set yang pertama terdiri dari tujuh kategori dimana setiap kategori saling berlainan. Kedua data set diperoleh dari koleksi perpustakaan pusat Universitas Indonesia, koleksi perpustakaan universitas Atma Jaya, koleksi perpustakaan Fakultas Ilmu Budaya Universitas Indonesia dan internet. Hasil klasifikasi dengan centroid mencapai kesamaan hingga 94,9% dengan klasifikasi manual dan efektivitasnya mencapai 0,949 pada data set pertama. Sedangkan untuk data set kedua kesamaan dengan hasil klasifikasi manual mencapai 81,25% dengan efektivitas 0.813. Beberapa saran berkenaan dengan tugas akhir ini adalah memperbesar jumlah dokumen training dan testing, menguji classifier pada jenis dokumen yang lain, melakukan perbandingan dengan classifier yang menggunakan metode lain pada jenis dokumen yang sama dan menggunakan nilai threshold untuk mengatasi dokumen yang tidak berada dalam kategori yang tersedia.