ABSTRAK
Nama : Irania
Program Studi : Ilmu Komputer
Judul : Mesin Penerjemah Statistik Sunda-Indonesia Menggunakan
Pendekatan Phrase-Based, Hierarchical, dan Factored Model
Mesin penerjemah adalah suatu alat yang berfungsi untuk menerjemahkan teks dari
satu bahasa ke bahasa yang lain. Statistical Machine Translation (SMT) atau Mesin
Penerjemah Statistik merupakan salah satu metode mesin penerjemahan di mana
terjemahan dihasilkan berdasarkan model statistik yang parameter-parameternya
diambil dari hasil analisis korpus dua bahasa (paralel). Pada tugas akhir ini,
penerjemahan teks Sunda-Indonesia dilakukan dengan menggunakan SMT
berdasarkan pendekatan tiga buah model yaitu phrase-based model, hierarchical
model, dan factored model. Strategi tambahan untuk melakukan penyusunan ulang
kata/frase (hierarchical reordering) diterapkan pada model phrase-based dan
model factored. Selain itu, pada model factored diterapkan 4 buah pendekatan
untuk melakukan eksperimen. Jumlah korpus paralel yang digunakan adalah 7133
kalimat, 5000 kalimat dari sundanews.com dan 2133 kalimat dari Wikipedia.
Sistem penerjemah dengan kualitas terbaik terjadi pada pendekatan 3 dari model
factored yang menggunakan strategi hierarchical reordering, dengan nilai rata-rata
BLEU sebesar 0,67214 dan rata-rata NIST sebesar 11.63938.
Kata Kunci:
Mesin Penerjemah, Statistical Machine Translation, Phrase-Based Model,
Hierarchical Model, Factored Model
|
|