ABSTRAK
Nama : Metti Zakaria W.
Program Studi : Magister Ilmu Komputer
Judul : Pendeteksian Kata Out-Of-Vocabulary pada Sistem Pengenal
Suara Bahasa Indonesia Menggunakan Teknik Lattice, 1-best
Hypothesis, dan Confidence Score
Pada topik penelitian pengenalan suara, kata Out-Of-Vocabulary (OOV) adalah
kata-kata yang tidak ada pada kamus pengenalan kata dan muncul pada dokumen
suara yang akan dikenali. Kata-kata ini merupakan salah satu penyebab terjadinya
kesalahan pengenalan kata dimana kata-kata tersebut biasanya akan dikenali
secara paksa mendekati kata-kata yang ada pada kamus pengenalan. Sistem
Pengenal Suara Otomatis Bahasa Indonesia yang dikembangkan pun tidak luput
dari permasalahan mengenai kata OOV. Salah satu solusi tepat yang bisa
digunakan untuk mengatasi permasalahan kata OOV adalah dengan mendeteksi
kata OOV yang muncul pada data suara dan kemudian mengenali kata OOV
tersebut dengan tepat sehingga dapat mengurangi kesalahan yang terjadi. Pada
tugas akhir ini, pendeteksian kata OOV dilakukan dengan menggunakan teknik
lattice, 1-best hypothesis serta pendeteksian berdasarkan confidence score. Data
suara pelatihan yang digunakan terdiri dari dokumen suara dalam Bahasa
Indonesia, Bahasa Inggris dan campuran keduanya. Sementara data suara
pengujian terdiri dari dokumen suara dalam Bahasa Indonesia yang mengandung
kata OOV. Kamus fonetik yang digunakan adalah kamus fonetik gabungan
Bahasa Indonesia dan Inggris yang terdiri dari 45 fonem. Model bahasa yang
digunakan terdiri dari dua jenis yaitu model bahasa biasa (level kata) dan model
bahasa hybrid (gabungan antara kata dan fonem atau silabel). Hasil eksperimen
menunjukkan bahwa data suara OOV yang berhasil dideteksi adalah sebesar 31%.
Selain itu, pendeteksian kata OOV dengan teknik lattice memberikan peningkatan
akurasi deteksi sekitar 16-31% dibandingkan teknik 1-best hypothesis. Sementara
hasil eksperimen penggunaan model bahasa hybrid pada suatu kelompok data
suara pengujian meningkatkan akurasi pengenalan sebesar 1% dibanding
penggunaan model bahasa biasa.
Kata kunci:
Out-Of-Vocabulary, Pengenalan Suara, Sistem Pengenal Suara Otomatis, Lattice,
1-best Hypothesis, Confidence Score, Model Bahasa Hybrid
|
|