ABSTRAK
Nama : Made Nindyatama Nityasya
Program Studi : Ilmu Komputer
Judul : Pembangunan Korpus Pasangan Kata Relasi Hipernim-
Hiponim Bahasa Indonesia Menggunakan Pendekatan Pattern
Analysis
Word relation extraction adalah salah satu penelitian di bidang NLP yang bertujuan
untuk mengekstrak kata berdasarkan relasi yang didefinisikan. Korpus pasangan
kata relasi dibutuhkan untuk menunjang berbagai penelitian selanjutnya. Korpus
tersebut umumnya disimpan dalam kamus digital seperti WordNet Bahasa Inggris.
Sayangnya untuk Bahasa Indonesia masih banyak kekurangannya. Penelitian ini
dilakukan dengan tujuan membangun korpus pasangan kata relasi secara otomatis.
Penelitian lain yang sama telah dilakukan dengan berbagai cara. Pendekatan
yang dipilih untuk digunakan dalam penelitian ini adalah menggunakan pattern
extraction dan pattern matching. Pembangunan korpus sendiri dilakukan secara
bertahap dengan metode semi-supervised learning. Relasi yang diteliti adalah relasi
semantik hipernim-hiponim dengan menggunakan Wikipedia sebagai data sumber.
Pada akhir penelitian, terbentuk korpus dengan total paling banyak 3493 pasangan
kata. Akurasi untuk setiap eksperimen yang diujikan selalu lebih besar dari 0.8.
Hal tersebut menunjukkan bahwa penggunaan metode pattern analysis dengan data
Wikipedia memiliki potensi untuk menghasilkan data berukuran besar dan berkualitas
baik.
Kata Kunci:
relasi kata, pattern extraction, pattern matching, semi-supervised, hipernimhiponum,
korpus
|
|