Call Number | T-0205 |
Collection Type | Tesis |
Title | Ekstraksi ciri pada data suara menggunakan spektra orde tinggi dan kuantisasi vektor untuk identifikasi pembicara menggunakan jaringan neural buatan |
Author | Adi Triyanto,; |
Publisher | Depok: Pascasarjana Fak. Ilmu Komputer UI, 2000 |
Subject | Artifical neural networks |
Location | FASILKOM-UI; |
Nomor Panggil | ID Koleksi | Status |
---|---|---|
T-0205 | 01/9142 | TERSEDIA |
Penelitian ini membandingkan antara pengaruh penggunaan pengolahan bispektrum dengan trispektrum dalam mengidentifikasi suara pembicara yang mengandung derau Gaussian tambahan menggunakan Jaringan Neural Buatan (JNB). Analisa dan estimasi bispektrum/trispektrum dilakukan menggunakan teknik kelas langusng dari metode konvensional ("Fourier Type"). SEtelah dilakukan analisa dan estimasi menggunakan bispektrum/trispektrum pada data suara, maka dilakukan teknik kuantisasi vektor menggunakan metode yang merupakan gabungan antara JNB Self Organizing Feature Map (SOFM) dan Learning Vector Quantization (LVQ). Teknik tersebut melakukan pembangkitan codebook secara adaptif karena tidak ada pengetahuan awal mengenai distribusi data bispektrum/trispektrum untuk menentukan informasi kelas. SSOFM berfungsi untuk membangkitkan vektor pewakil secara internal, dan LVQ untuk memperbaiki distribusi pengelompokan data terhadap vektor pewakilnya. Pengujian kinerja pengenalan dilakukan menggunakan dua buah JNB lapis banyak, yaitu jaringan dengan pembelajaran back propagation (BP) dan probabilistic neural network (PNN). Perbandingan sistem bispektrum dengan sistem trispektrum dilakukan dengan mengambil jumlah vektor pewakil yang relatif sama, yaitu antara 50 hingga 686 vektor pewakil, dimana dengan jumlah tersebut , sistem bispektrum terwakili oleh maksimum 24,9% vektor pewakil, sementara trispektrum terwakili oleh maksimum 0,358 % vektor pewakil. Dari eksperimen didapatkan bahwa sistem identifikasi pembicara, baik yang menggunakan bispektrum maupun trispektrum, mempunyai tingkat pengenalan yang relatif sama, dimana pada suara dengan derau SNR 20dB, SNR 10dB, dan SNR 0dB sistem bispektrum mempunyai pengenalan rata-rata 99,2%; 96,8%; dan 8,4% berturut-turut (menggunakan PNN), sementara pada trispektrum 97,7%; 91,7% dan 79,6%. Eksperimen juga mendapatkan bahwa penggunaan PNN menunjukkan hasil yang lebih baik dibandingkan BP, baik pada sistem bispektrum maupun trispektrum.