ABSTRAK
Nama : Irwanto
Program Studi : Ilmu Komputer
Judul : End-to-end Coreference Resolution pada Teks Bahasa Indonesia
Coreference resolution adalah salah satu tugas pada natural language processing (NLP)
untuk memecahkan hubungan koreferensi antara kumpulan ekspresi pada teks. Penelitian
coreference resolution bahasa Indonesia telah diteliti dengan pendekatan rule based dan
machine learning yang mempunyai dependensi dengan tugas NLP lainnya untuk identifikasi ekspresi, pembangunan rule, dan ekstraksi fitur. Penelitian ini mencoba mengaplikasikan model end-to-end dengan pendekatan deep learning pada coreference resolution
bahasa Indonesia. Model end-to-end adalah model yang dapat mengidentifikasi kumpulan ekspresi pada teks dan sekaligus menyelesaikan hubungan koreferensinya. Penelitian
ini terdiri dari dua tahap, yaitu pembangunan data dan pemodelan. Tahap pembangunan data menghasilkan 500 teks Wikipedia dan berita yang dianotasi dengan aturan yang
dibuat berdasarkan studi terhadap data sebelumnya dan tata bahasa Indonesia. Tahap
pemodelan dilakukan dengan adaptasi arsitektur model end-to-end bahasa Inggris menggunakan word embedding. Model yang dihasilkan mencapai CoNLL score 64,85% dan
nilai LEA 59,70% yang merupakan metrik standar dalam evaluasi coreference resolution
dan mengalahkan performa model coreference resolution bahasa Indonesia sebelumnya.
Kata kunci:
coreference resolution, end-to-end, bahasa Indonesia, deep learning, word embedding
|
|