ABSTRAK
Nama : Andhira Henrisen Sikoko, Evan Aurelrius
Program Studi : Ilmu Komputer
Judul : Pengembangan Model Machine Translation untuk Aplikasi Pembuatan
Subtitle Animasi Isyarat SIBI (Sistem Isyarat Bahasa Indonesia) pada
Video Edukasi
Pembimbing : Dr. Ir. Erdefi Rakun, M.Sc., Dr. Kurniawati Azizah, S.T., M.Phil.
Di era kemajuan teknologi yang pesat, pembelajaran daring semakin populer terutama
setelah COVID-19. Namun, tunarungu sering menghadapi kesenjangan dalam
memahami video pembelajaran. Salah satu solusi yang dapat membantu adalah dengan
menyediakan subtitle dalam bahasa isyarat, khususnya Sistem Isyarat Bahasa Indonesia
(SIBI). Untuk mengembangkan subtitle ini, diperlukan teks input dari video pembelajaran.
Namun, teks input seringkali terlalu panjang dan mengandung banyak kata yang tidak
ada dalam kamus bahasa isyarat SIBI. Metode yang ada sekarang pun menghasilkan
animasi SIBI secara kata demi kata, yang mengakibatkan animasi bergerak cepat dan sulit
diikuti oleh pengguna tunarungu. Penelitian ini membahas integrasi translasi teks dalam
pengembangan subtitle animasi isyarat SIBI untuk aplikasi Moodle, menggunakan
machine learning. Penelitian ini bertujuan untuk mengembangkan solusi yang lebih
efektif dengan menerapkan terjemahan teks. Penelitian ini mengusulkan penggunaan dua
model pretrained, yaitu mBART50 dan NLLB200 sebagai baseline model dan model
yang akan di-finetuning. Eksperimen ini menggunakan dataset yang dikumpulkan dari 12
video pembelajaran. Kemudian data ini diproses, dianotasi oleh guru Sekolah Luar Biasa
(SLB), dan digunakan untuk training, validation, serta testing dan dataset ini dinamakan
SIBIVID-MP12. Eksperimen dilakukan dengan membandingkan model baseline dengan
model yang sudah di-finetuning. Finetuning dilakukan dengan dan tanpa custom loss
function yang merupakan inovasi pada penelitian ini. Custom loss function menambahkan
SIBIDictLoss pada total loss model, sehingga akan memaksa model untuk hanya
menggunakan kata yang ada pada kamus SIBI. Hasil eksperimen menunjukkan bahwa
dengan adanya finetuning, model mBART50 dan NLLB200 mengalami peningkatan
performa dibandingkan model baseline-nya tanpa finetuning dalam melakukan
terjemahan teks Bahasa Indonesia ke dalam SIBI. Model NLLB200 FT+CL dengan
varian batch size 4, penggunaan weighting varian kedua, ukuran weight 0,2, dan besaran
penalti 0,1 menjadi varian dengan nilai evaluasi tertinggi dengan peningkatan nilai
sacreBLEU sebesar 71% , nilai chrF++ sebesar 9,79% , nilai METEOR 22,92% , dan
nilai ROUGE-L 14,55% dibandingkan dengan model baseline. Ini menunjukkan bahwa
mengintegrasikan model terjemahan teks dapat meningkatkan inklusivitas dan
aksesibilitas platform pembelajaran daring bagi komunitas tunarungu di Indonesia.
Kata kunci:
Machine translation, pembangkitan subtitle, SIBI, NLLB200, mBART50
|