Library Automation and Digital Archive
LONTAR
Fakultas Ilmu Komputer
Universitas Indonesia

Pencarian Sederhana

Find Similar Add to Favorite

Call Number SK-1709 (Softcopy SK-1191) Source SK-1191
Collection Type Skripsi
Title Pengembangan Alat Konversi Constituency Treebank ke Dependency Treebank untuk Bahasa Indonesia: Implementasi Komponen PTB Converter dan Sebagian Rule Komponen AKSARA
Author Jessica Naraiswari Arwidarasti;
Publisher Depok: Fakultas Ilmu Komputer Universias Indonesia, 2019
Subject
Location FASILKOM-UI;
Lokasi : Perpustakaan Fakultas Ilmu Komputer
Nomor Panggil ID Koleksi Status
SK-1709 (Softcopy SK-1191) Source SK-1191 TERSEDIA
Tidak ada review pada koleksi ini: 46702
ABSTRAK Nama : Jessica Naraiswari Arwidarasti Program Studi : Ilmu Komputer Judul : Pengembangan Alat Konversi Constituency Treebank ke Dependency Treebank untuk Bahasa Indonesia: Implementasi Komponen PTB Converter dan Sebagian Rule Komponen AKSARA Pembimbing : Ika Alfina, S.Kom., M.Kom. Penelitian ini bertujuan untuk mengembangkan alat konversi constituency treebank menjadi dependency treebank untuk Bahasa Indonesia dengan menggunakan skema Universal Dependencies versi 2 (UDv2). Alat konversi ini terdiri dari tiga komponen. Komponen pertama disebut PTB Converter yang bertugas mengubah treebank agar sesuai dengan format Penn Treebank (PTB). Komponen kedua adalah Stanford UD Converter yang digunakan sebagai alat untuk membuat dependency treebank awal. Komponen ketiga bernama AKSARA yaitu sebuah alat konversi berbasis aturan yang dibuat untuk memperbaiki kualitas dari dependency treebank agar sesuai dengan ketentuan Bahasa Indonesia dan UDv2. Ruang lingkup dari penelitian ini adalah mengimplementasi komponen PTB Converter dan 11 dari 20 rule dari komponen AKSARA. Untuk melakukan evaluasi terhadap alat konverter, sebuah gold standard yang terdiri dari 2840 token dianotasi secara manual. Sebagai baseline, hasil akurasi luaran Stanford UD Converter dievaluasi terhadap gold standard. Didapatkan UAS (Unlabeled Attachment Score) sebesar 54,3% dan LAS (Labeled Attachment Score) sebesar 41%. Setelah menggunakan komponen AKSARA, kualitas treebank meningkat dengan kenaikan UAS sebesar 39% menjadi 93,3% dan kenaikan LAS sebesar 46,2% menjadi 87,2%. Kata kunci: Bahasa Indonesia, Constituency Treebank, Dependency Treebank, NLP, Stanford UD Converter