Library Automation and Digital Archive
LONTAR
Fakultas Ilmu Komputer
Universitas Indonesia

Pencarian Sederhana

Find Similar Add to Favorite

Call Number SK-1778 (Softcopy SK-1260) Source code SK-710
Collection Type Skripsi
Title Pembangunan model normalisasi teks bahasa indonesia menggunakan metode statistical machine translation dengan pendekatan semi-supervised
Author Tatag Aziz Prawiro;
Publisher Depok: Fasilkom UI, 2020
Subject
Location FASILKOM-UI;
Lokasi : Perpustakaan Fakultas Ilmu Komputer
Nomor Panggil ID Koleksi Status
SK-1778 (Softcopy SK-1260) Source code SK-710 TERSEDIA
Tidak ada review pada koleksi ini: 48223
ABSTRAK Nama : Tatag Aziz Prawiro Program Studi : Ilmu Komputer Judul : Pembangunan Model Normalisasi Teks Bahasa Indonesia Menggunakan Metode Statistical Machine Translation dengan Pendekatan Semi-Supervised Normalisasi teks merupakan task pada NLP yang dapat digunakan untuk meningkatkan performa dari aplikasi-aplikasi NLP lain. Penelitian tentang normalisasi teks pada bahasa Indonesia masih jarang dan kebanyakan masih hanya menormalisasi pada tingkat token. Penelitian ini bertujuan untuk mengevaluasi pembangunan model normalisasi dengan menggunakan algoritma statistical machine translation (SMT). Isu dari pendekatan machine translation dalam penyelesaian task normalisasi teks adalah butuhnya data yang relative banyak. Penelitian ini juga melihat bagaimana pengaruh dari pemelajaran semi-supervised dengan cara menggunakan pseudo-data dalam pembangunan model normalisasi teks dengan algoritma statistical machine translation. Model SMT memiliki performa yang cukup baik pada data tanpa tanda baca, namun memiliki performa yang buruk pada data bertanda baca karena banyaknya noise. Pendekatan semi-supervised menurunkan performa SMT secara keseluruhan, namun, pada jenis data tidak bertanda baca penurunan relatif tidak signifikan. Kata kunci: Normalisasi teks, machine translation, SMT, semi-supervised vii