ABSTRAK

Banyak informasi yang berguna terdapat dalam bentuk teks berbahasa alami. Berbagai informasi tersebut harus diubah ke dalam bentuk yang lebih terstruktur agar dapat dimanipulasi dan dianalisa secara otomatis. Sistem ekstraksi informasi menangani masalah menemukan informasi yang berguna dari sekumpulan teks berbahasa alami, dan mengubah informasi tersebut ke dalam suatu bentuk yang lebih terstruktur. Pengembangan sistem ekstraksi informasi berbahasa Indonesia belum bekembang. Sistem ekstraksi berbahasa Indonesia dapat membantu proses analisis dokumen teks berbahasa Indonesia. Untuk itu, penelitian ini bertujuan mengembangkan sistem ekstraksi informasi yang menerima masukan teks berbahasa alami bahasa Indonesia. Sistem ekstraksi informasi tersebut dinamakan SEIBI (Sistem Ekstraksi Informasi Berbahasa Indonesia). SEIBI dikembangkan berdasarkan sistem ekstraksi informasi CIRCU [LEHN93]. Dalam penelitian ini, teks mausukan dibatasi pada abstrak skripsi mahasiswa Fakultas Ilmu Komputer Universitas Indonesia. Informasi yand diekstraksi dari abstrak tersebut dibatasi pada tujuan, ruang lingkup dan kesimpulan. Hasil uji coba menunjukkan SEIBI berhasil mengekstraksi dengan benar tujuan dari 56 dokumen masukan (59%), kesimpulan dari 20 dokumen masukan (20$), dan ruang lingkup dari 4 dokumen masukan (4%). SEIBI malakukan kesalahan ekstraksi lebih sedikit dibandingkan ekstraksi informasi dengan menggunakan metode pencocokan pola.