ABSTRAK
Nama : Ivan Putera Masli
Program Studi : Ilmu Komputer
Judul : Pembuatan sistem pelengkap kalimat dengan pemodelan
bahasa n-gram
Penelitian ini mengembangkan sistem pelengkap kalimat untuk menjawab Billion
Word Imputation Problem menggunakan n-gram. Billion Word Imputation Problem
adalah suatu permasalahan dimana, diberikan sebuah kalimat dalam bahasa Inggris
yang kehilangan tepat satu kata, lengkapilah kalimat tersebut. Pencarian posisi kata
yang hilang dilakukan dengan mencari gram dengan probabilitas minimal. Pemilihan
kata dilakukan dengan mencari kata yang memaksimalkan probabilitas gram
tersebut. Terdapat dua buah pendekatan, pendekatan pertama hanya memanfaatkan
teks korpus dan pendekatan kedua dimanfaatkan juga part-of-speech tag teks
korpus. Kinerja sistem yang dibuat dinilai dengan mencari rata-rata Levenshtein
distance antara kalimat yang dilengkapi dan kalimat yang benar. Hasil pendekatan
pertama memiliki rata-rata Levenshtein distance lebih rendah dibandingkan dengan
pendekatan kedua.
|
|