ABSTRAk
ABSTRAk
Nama : Ageng Anugrah Wardoyo Putra
Program Studi : Ilmu Komputer
Judul : Peninjauan Kembali Modul-Modul Pemrosesan Bahasa Indonesia dan Pemanfaatannya dalam Membangun Sistem
Tanya Jawab
Pembimbing : Rahmad Mahendra, S.Kom., M.Sc.
Walaupun belum semaju dan sekomprehensif bahasa-bahasa lainnya, penelitian NLP
bahasa Indonesia telah mengalami perkembangan yang cukup signifikan. Penelitian
NLP tersebut mencakup POS-Tagging, Named Entity Recognition, dependency parsing,
coreference resolution, dan lain sebagainya. Dari penelitian-penelitian NLP bahasa
Indonesia yang telah ada, perlu dilakukan validasi dan verifikasi apakah modul NLP pada
penelitian tersebut masih relevan atau tidak. Hal tersebut perlu dilakukan karena mungkin
saja terjadi kesalahan pada penelitian sebelumnya atau terdapat model yang lebih baik
dari penelitian tersebut. Proses tersebut dapat dilakukan melalui evaluasi intrinsik
maupun ekstrinsik. Evaluasi intrinsik dapat dilakukan dari reproduksi atau replikasi
penelitian yang telah ada, sementara itu evaluasi ekstrinsik dilakukan dengan membangun
sistem tanya jawab dari modul-modul NLP tersebut. Hasilnya, didapatkan beberapa
modul seperti POS-Tagging dan NER masih cukup relevan dan memiliki dataset yang
berkualitas. Namun, beberapa modul lain seperti coreference resolution, constituency
parsing, dan dependency parsing masih perlu perkembangan lebih lanjut. Berdasarkan
hasil evaluasi, sistem yang dibangun memiliki performa terbaik untuk metrik exact match
dan F1 berturut-turut di angka 0,108 dan 0,151 untuk dataset SQuAD, 0,063 dan 0,191
untuk dataset TyDiQA, serta 0,127 dan 0,173 untuk dataset IDK-MRC. Dari evaluasi
tersebut diketahui juga bahwa sistem tanya jawab yang dibangun menggunakan pipeline
modul-modul NLP tidak sebaik model tanya jawab end-to-end menggunakan BERT
yang telah di-finetuning. Meskipun begitu, dari hasil penelitian ini ditunjukkan bahwa
kita dapat membangun suatu sistem tanya jawab berdasarkan modul-modul NLP bahasa
Indonesia yang tersedia.
Kata kunci:
Pengolahan bahasa alami, NLP, question answering, POS-Tagging, NER, bahasa
Indonesia
|