ABSTRAK
ABSTRAK
Nama : Lucky Susanto
Program Studi : Ilmu Komputer
Judul : Pengembangan Tolok Ukur Translasi Standar untuk Bahasa
Daerah dengan Sumber Data Terbatas di Indonesia
Pembimbing : Adila Alfa Krisnadhi, S.Kom., M.Sc., Ph.D
Neural machine translation (NMT) untuk bahasa daerah yang low resource di
Indonesia menghadapi tantangan yang signifikan, meliputi kurangnya tolok ukur
dasar yang representatif dan ketersediaan data yang terbatas. Penelitian ini mengatasi masalah tersebut dengan cara mengembangkan sebuah tolok ukur dasar yang
bersifat replicable untuk empat bahasa daerah di Indonesia yang sering digunakan
menggunakan sumber daya komputasi terbatas pada dataset FLORES-200. Penelitian ini mengadakan penyelidikan sistematis dan pemeriksaan menyeluruh terhadap
berbagai pendekatan dan paradigma untuk melatih model NMT pada konteks sumber daya komputasi terbatas yang pertama. Tolok ukur ini, dilatih menggunakan
sumber daya komputasi dan data pelatihan terbatas, mencapai performa yang kompetitif serta mampu melewati performa GPT-3.5-turbo yang telah di zero-shot untuk
berbagai arah translasi dari bahasa Indonesia ke bahasa daerah yang low resource.
Penelitian ini berkontribusi kepada kemajuan bidang NMT untuk bahasa-bahasa
low resource di Indonesia dan membuka jalan untuk penelitian kedepannya sekaligus mengeksplorasi limitasi GPT-3.5-turbo dalam melakukan translasi bahasa daerah yang low resource. Akhirnya, penelitian ini menunjukkan bahwa melatih model
XLM menggunakan data sintetis hasil code-switch memiliki performa translasi diatas pendekatan pelatihan penuh dan pelatihan model XLM dengan data monolingual saja.
Kata kunci:
low resource, bahasa daerah, neural machine translation (NMT), tolok ukur yang
replicable, sumber daya komputasi terbatas
|