ABSTRAK
Penelitian ini bertujuan untuk membangun aturan-aturan untuk struktur kalimat bahasa Indonesia dengan menggunakan constraint-based formalism. Contraint-based formalism adalah sebuah metode untuk merepresentasikan suatu computational linguistic. Struktur sintaks kalimat ini sangat diperlukan bagi pengembangan suatu sistem pemrosesan bahasa alami khususnya untuk pemrosesan bahasa Indonesia. Tujuan selanjutnya dari penelitian ini adalah menganalisa hasil keluaran, yang berupa pohon urai, dari penganalisis struktur sintaks yang sudah dibangun pada penelitian ini. Struktur sintaks yang dibangun pada penelitian ini mengacu pada aturan-aturan sintaks yang terdapat di dalam tata bahasa baku bahasa Indonesia edisi ketiga ([ALWI98]). Pembuatan aturan-aturan penganalisis sintaks kalimat bahasa Indonesia ini menggunakan alat bantu PC-PATR. PC-PATR adalah implementasi dari constraint-based formalism untuk personal Computer (PC). Pembuatan aturan-aturan untuk penguraian struktur kalimat dalam penelitian ini dilakukan dalam 3 tahap. Tahap pertama adalah mendefinisikan kategori-kategori kata yang ada dalam bahasa Indonesia, yaitu verba, adjektiva, adverba, nomina, konjungtor, dan partikel penegas. Sejalan dengan kategori kata itu, terdapat kategori frasa yang dibedakan berdasarkan unsur utamanya, yaitu frasa nominal, frasa numeral, frasa pronominal, frasa verbal, dan frasa adjektival. Tahap kedua adalah membangun aturan produksi untuk kategori frasa tersebut. Suatu bentuk kata yang tergolong dalam kategori frasa tersebut memiliki fungsi sintaktisnya masing-masing, yaitu subjek, predikat, objek, pelengkap, dan keterangan. Tahap terakhir adalah membangun aturan produksi untuk fungsi sintaksis tersebut. Jenis-jenis kalimat masukan yang dapat diuraikan oleh penganalisis berdasarkan aturan-aturan yang dibangun adalah kalimat deklaratif berupa kalimat tunggal sederhana, kalimat tunggal yang fungsi sintaksisnya (subjek, predikat, objek, pelengkap, keterangan) telah mengalami perluasan, kalimat majemuk setara dan kalimat majemuk bertingkat. Domain kalimat-kalimat yang diujikan pada penelitian ini adalah kalimat-kalimat yang terdapat pada dokumen-dokumen resmi di Indonesia yang undang-undang Dasar 1945, Udang-undang peraturan Pemerintah pengganti Undang-undang, Peraturan Pemerintah, keputusan Presiden, Intruksi Presiden, dan Ketetapan MPR. Hasil uji coba yang dilakukan terhadap kumpulan kumpulan kalimat-kalimat pada dokumen resmi adalah sebagai berikut 79, 9% dari kalimat masukan dapat diuraikan sedangkan 21, 1% dari kalimat masukan tidak dapat diuraikan oleh penganalis sintaks yang dibangun dalam penelitian ini. Ketidakberhasilan pengurai tersebut diakibatkan oleh kesalahan struktur kalimat atau diakibatkan karena jenis kalimat tersebut berada diluar batas penelitian sehingga aturan sintaksnya belum dibangun
|