ABSTRAK
Nama : Yogi Lesmana Sulestio
Program Studi : Ilmu Komputer
Judul : Pengembangan Universal Part-of-Speech Tagger untuk Bahasa Indonesia Menggunakan Bidirectional Long ShortTerm Memory
Penelitian Part-of-Speech tagger (POS tagger) untuk bahasa Indonesia telah banyak
dikembangkan. Sayangnya, sejauh ini baru Polyglot yang menggunakan POS tag menurut
pedoman anotasi Universal Dependencies (UD). Namun, Polyglot sendiri masih mempunyai kekurangan karena belum dapat mengatasi klitik dan kata ulang yang terdapat
dalam bahasa Indonesia. Tujuan penelitian ini adalah mengembangkan POS tagger untuk
bahasa Indonesia yang tidak hanya sesuai dengan ketentuan anotasi UD, tapi juga sudah
mengatasi kekurangan Polyglot. POS tagger ini akan dikembangkan dengan metode deep
learning menggunakan arsitektur yang merupakan versi modifikasi dari Recurrent Neural Network (RNN), yaitu Bidirectional Long Short-Term Memory (Bi-LSTM). Dataset
yang digunakan untuk mengembangkan POS tagger adalah sebuah dependency treebank
bahasa Indonesia yang terdiri dari 1.000 kalimat dan 19.401 token. Hasil eksperimen dengan menggunakan Polyglot sebagai pembanding menunjukkan bahwa POS tagger yang
dikembangkan lebih baik dengan tingkat akurasi POS tagging yang meningkat sebesar
6,69% dari 84,82% menjadi 91,51%.
Kata kunci:
bahasa Indonesia, Bi-LSTM, deep learning, POS tagger, Universal Dependencies
|
|