ABSTRAK
Nama : Tatag Aziz Prawiro
Program Studi : Ilmu Komputer
Judul : Pembangunan Model Normalisasi Teks Bahasa Indonesia
Menggunakan Metode Statistical Machine Translation dengan
Pendekatan Semi-Supervised
Normalisasi teks merupakan task pada NLP yang dapat digunakan untuk meningkatkan
performa dari aplikasi-aplikasi NLP lain. Penelitian tentang normalisasi teks pada bahasa
Indonesia masih jarang dan kebanyakan masih hanya menormalisasi pada tingkat token.
Penelitian ini bertujuan untuk mengevaluasi pembangunan model normalisasi dengan
menggunakan algoritma statistical machine translation (SMT). Isu dari pendekatan
machine translation dalam penyelesaian task normalisasi teks adalah butuhnya data
yang relative banyak. Penelitian ini juga melihat bagaimana pengaruh dari pemelajaran
semi-supervised dengan cara menggunakan pseudo-data dalam pembangunan model
normalisasi teks dengan algoritma statistical machine translation. Model SMT memiliki
performa yang cukup baik pada data tanpa tanda baca, namun memiliki performa yang
buruk pada data bertanda baca karena banyaknya noise. Pendekatan semi-supervised
menurunkan performa SMT secara keseluruhan, namun, pada jenis data tidak bertanda
baca penurunan relatif tidak signifikan.
Kata kunci:
Normalisasi teks, machine translation, SMT, semi-supervised
vii
|
|