ABSTRAK
Nama
:
Jessica Naraiswari Arwidarasti
Program Studi
:
Ilmu Komputer
Judul
:
Pengembangan Alat Konversi Constituency Treebank ke Dependency Treebank untuk Bahasa Indonesia: Implementasi Komponen PTB Converter dan Sebagian Rule Komponen AKSARA
Pembimbing
:
Ika Alfina, S.Kom., M.Kom.
Penelitian ini bertujuan untuk mengembangkan alat konversi constituency treebank menjadi dependency treebank untuk Bahasa Indonesia dengan menggunakan skema Universal Dependencies versi 2 (UDv2). Alat konversi ini terdiri dari tiga komponen. Komponen pertama disebut PTB Converter yang bertugas mengubah treebank agar sesuai dengan format Penn Treebank (PTB). Komponen kedua adalah Stanford UD Converter yang digunakan sebagai alat untuk membuat dependency treebank awal. Komponen ketiga bernama AKSARA yaitu sebuah alat konversi berbasis aturan yang dibuat untuk memperbaiki kualitas dari dependency treebank agar sesuai dengan ketentuan Bahasa Indonesia dan UDv2. Ruang lingkup dari penelitian ini adalah mengimplementasi komponen PTB Converter dan 11 dari 20 rule dari komponen AKSARA. Untuk melakukan evaluasi terhadap alat konverter, sebuah gold standard yang terdiri dari 2840 token dianotasi secara manual. Sebagai baseline, hasil akurasi luaran Stanford UD Converter dievaluasi terhadap gold standard. Didapatkan UAS (Unlabeled Attachment Score) sebesar 54,3% dan LAS (Labeled Attachment Score) sebesar 41%. Setelah menggunakan komponen AKSARA, kualitas treebank meningkat dengan kenaikan UAS sebesar 39% menjadi 93,3% dan kenaikan LAS sebesar 46,2% menjadi 87,2%.
Kata kunci:
Bahasa Indonesia, Constituency Treebank, Dependency Treebank, NLP, Stanford UD Converter
|
|