Library Automation and Digital Archive
LONTAR
Fakultas Ilmu Komputer
Universitas Indonesia

Pencarian Sederhana

Find Similar Add to Favorite

Call Number T-0933 (Softcopy T-0586) Source Code T-0109
Collection Type Tesis
Title Pendeteksian kata out-0f-Vocabulary pada sistem pengenal suara bahasa Indonesia menggunakan Lattice, 1-best yypothesis dan confidence score
Author Metti Zakaria Wanagiri;
Publisher Depok: Fakultas Ilmu Komputer UI, 2011
Subject Vocabulary--Databases; Hybrid languages
Location FASILKOM-UI;
Lokasi : Perpustakaan Fakultas Ilmu Komputer
Nomor Panggil ID Koleksi Status
T-0933 (Softcopy T-0586) Source Code T-0109 TERSEDIA
Tidak ada review pada koleksi ini: 32715
ABSTRAK Nama : Metti Zakaria W. Program Studi : Magister Ilmu Komputer Judul : Pendeteksian Kata Out-Of-Vocabulary pada Sistem Pengenal Suara Bahasa Indonesia Menggunakan Teknik Lattice, 1-best Hypothesis, dan Confidence Score Pada topik penelitian pengenalan suara, kata Out-Of-Vocabulary (OOV) adalah kata-kata yang tidak ada pada kamus pengenalan kata dan muncul pada dokumen suara yang akan dikenali. Kata-kata ini merupakan salah satu penyebab terjadinya kesalahan pengenalan kata dimana kata-kata tersebut biasanya akan dikenali secara paksa mendekati kata-kata yang ada pada kamus pengenalan. Sistem Pengenal Suara Otomatis Bahasa Indonesia yang dikembangkan pun tidak luput dari permasalahan mengenai kata OOV. Salah satu solusi tepat yang bisa digunakan untuk mengatasi permasalahan kata OOV adalah dengan mendeteksi kata OOV yang muncul pada data suara dan kemudian mengenali kata OOV tersebut dengan tepat sehingga dapat mengurangi kesalahan yang terjadi. Pada tugas akhir ini, pendeteksian kata OOV dilakukan dengan menggunakan teknik lattice, 1-best hypothesis serta pendeteksian berdasarkan confidence score. Data suara pelatihan yang digunakan terdiri dari dokumen suara dalam Bahasa Indonesia, Bahasa Inggris dan campuran keduanya. Sementara data suara pengujian terdiri dari dokumen suara dalam Bahasa Indonesia yang mengandung kata OOV. Kamus fonetik yang digunakan adalah kamus fonetik gabungan Bahasa Indonesia dan Inggris yang terdiri dari 45 fonem. Model bahasa yang digunakan terdiri dari dua jenis yaitu model bahasa biasa (level kata) dan model bahasa hybrid (gabungan antara kata dan fonem atau silabel). Hasil eksperimen menunjukkan bahwa data suara OOV yang berhasil dideteksi adalah sebesar 31%. Selain itu, pendeteksian kata OOV dengan teknik lattice memberikan peningkatan akurasi deteksi sekitar 16-31% dibandingkan teknik 1-best hypothesis. Sementara hasil eksperimen penggunaan model bahasa hybrid pada suatu kelompok data suara pengujian meningkatkan akurasi pengenalan sebesar 1% dibanding penggunaan model bahasa biasa. Kata kunci: Out-Of-Vocabulary, Pengenalan Suara, Sistem Pengenal Suara Otomatis, Lattice, 1-best Hypothesis, Confidence Score, Model Bahasa Hybrid