ABSTRAK
ABSTRAK
Nama : Fadli Aulawi Al Ghiffari
Program Studi : Ilmu Komputer
Judul : Cross-lingual Transfer Learning untuk Dependency
Parsing Bahasa Jawa
Pembimbing : Dr. Ika Alfina, S.Kom., M.Kom.
Dr. Kurniawati Azizah, S.T., M.Phil.
Penelitian ini bertujuan untuk membangun model dependency parser untuk bahasa
Jawa menggunakan pendekatan cross-lingual transfer learning. Metode transfer
learning dipilih untuk mengatasi kurangnya dataset yang tersedia untuk proses training
model pada bahasa Jawa yang merupakan low-resource language. Model dibangun
menggunakan arsitektur encoder-decoder, tepatnya menggunakan gabungan dari
self-attention encoder dan deep biaffine decoder. Terdapat tiga skenario yang diuji
yaitu model tanpa transfer learning, model dengan transfer learning, dan model dengan
hierarchical transfer learning. Metode transfer learning menggunakan bahasa Indonesia,
bahasa Korea, bahasa Kroasia, dan bahasa Inggris sebagai source language. Sementara
metode hierarchical transfer learning menggunakan bahasa Prancis, bahasa Italia, dan
bahasa Inggris sebagai source language tahap satu, serta bahasa Indonesia sebagai source
language tahap dua (intermediary language). Penelitian ini juga mengujikan empat
word embedding yaitu fastText, BERT Jawa, RoBERTa Jawa, dan multilingual BERT.
Hasilnya metode transfer learning secara efektif mampu menaikkan performa model
sebesar 10%, di mana model tanpa transfer learning yang memiliki performa awal
unlabeled attachment score (UAS) sebesar 75.87% dan labeled attachment score (LAS)
sebesar 69.04% mampu ditingkatkan performanya hingga mencapai 85.84% pada UAS
dan 79.22% pada LAS. Skenario hierarchical transfer learning mendapatkan hasil yang
lebih baik daripada transfer learning biasa, namun perbedaannya tidak cukup signifikan.
Kata kunci:
bahasa Jawa, cross-lingual transfer learning, dependency parser, low-resource language
|