ABSTRAK
Nama : Dyah Inastra Damapuspita
Program Studi : Ilmu Komputer
Judul : Implementasi Metode Pemasangan Kalimat untuk Pembuatan
Parallel Corpora antara Bahasa Indonesia dan Bahasa
Daerahnya: Studi Kasus Wikipedia
Parallel corpora sangat penting untuk penelitian multilingual terutama pada bidang
information retrieval (IR) dan natural language processing (NLP). Namun, parallel
corpora sulit ditemukan untuk bahasa dengan sumber literatur yang minim.
Oleh karena itu, pembuatan parallel corpora biasanya dilakukan dengan cara
mengumpulkan pasangan kalimat terjemahan secara manual. Akan tetapi, cara
tersebut menghabiskan banyak waktu dan tenaga sehingga pada penelitian ini dilakukan
implementasi metode pemasangan kalimat untuk mempermudah proses
pembuatan parallel corpora. Metode pemasangan kalimat yang diimplementasikan
ada lima, tiga metode pertama menggunakan pendekatan pemasangan kalimat dengan
menganggap pasangan artikel sebagai parallel corpora sedangkan dua metode
lainnya menganggap sebagai comparable corpora. Hasil pengujian memperlihatkan
bahwa hasil metode ketiga paling tinggi dari metode lainnya dan berhasil diterapkan
pada pasangan artikel bahasa Indonesia dan bahasa daerahnya diWikipedia
sehingga bisa digunakan untuk membangun parallel corpora.
Kata Kunci:
Wikipedia, Bahasa daerah, Parallel corpora, Comparable corpora, Pemasangan
kalimat, Pemasangan dokumen, Similarity Coefficient
vii
|
|