ABSTRAK
Nama : Darryl Yunus Sulistyan
Program Studi : Ilmu Komputer
Judul : Mesin Penerjemah Statistik Berfaktor Menggunakan Informasi
Part-of-Speech , Morfologi dan Lemma pada Corpus Parallel Inggris-Jerman dan Inggris-Indonesia Penelitian ini bertujuan untuk melakukan pengujian dari efektifitas sistem penerjemah statistik berfaktor, yaitu sistem penerjemahan berbasis statistik yang berusaha menggunakan informasi-informasi linguistik disamping menggunakan informasi (faktor) surface form. Beberapa faktor linguistik yang diujikan di dalam
eksperimen adalah faktor part-of-speech, morfologi bahasa dan lemma selain faktor utama yaitu surface form dan melihat perbandingannya terhadap sistem tak berfaktor sebagai baseline. Penelitian ini membahas sistem penerjemahan dari bahasa Inggris ke bahasa Jerman satu arah, kemudian membahas bahasa Indonesia ke Inggris berikut sebaliknya. Dalam pelaksanaannya, penelitian ini menggunakan
beberapa corpus berbeda untuk melihat performa sistem berfaktor dibandingkan dengan baseline di dalam beberapa kondisi berbeda. Sistem penerjemah dengan kualitas terbaik untuk penerjemahan dari Inggris ke Jerman dicapai oleh model berfaktor dengan menggunakan faktor part of speech dan morfologi dilengkapi dengan backoff table dengan peningkatan sebesar 11.285% dibandingkan dengan baseline sementara untuk pasangan Inggris-Indonesia, untuk penerjemahan dari
bahasa Inggris ke Indonesia, model berfaktor dengan backoff table memberikan peningkatan sebesar 0.975% dan untuk bahasa Indonesia ke Inggris, model terbaik adalah model unfactored yang mencapai nilai BLEU sebesar 20.606.
Kata Kunci:
Mesin penerjemah statistik, part-of-speech, morfologi, kata dasar, model berfaktor, model tak berfaktor, Inggris, Jerman, Indonesia
|
|