Perpustakaan Fakultas Ilmu Komputer

Call Number	DIS-020 (Softcopy DIS-011) Source Code DIS-004
Collection Type	Disertasi
Title	Representasi nilai HOS dan Model MFCC sebagai ekstraksi ciri pada Sistem identifikasi pembicara di lingkungan ber-NOISE menggunakan HMM
Author	Agus Buono;
Publisher	Depok: Fakultas Ilmu Komputer UI, 2009
Subject	Hidden Markov models ; Gaussian noise
Location

Lokasi : Perpustakaan Fakultas Ilmu Komputer

Nomor Panggil	ID Koleksi	Status
DIS-020 (Softcopy DIS-011) Source Code DIS-004		TERSEDIA

DIS-20 Agus Buono-9205000026.pdf

Source Code T-DIS 20 Agus Buono.zip

Tidak ada review pada koleksi ini: 27801

Suara merupakan suatu besaran yang memenuhi syarat sebagai ciri biometrik yang efektif dan efisien. Namun demikian, suara adalah fenomena yang merupakan perpaduan multidimensi serta dipengaruhi berbagai aspek, seperti karakteristik pembicara (dimensi titik artikulasi, emosi, kesehatan, umur, jenis kelamin, dialek), bahasa, dan lingkungan (background dan media transmisi sistem yang telah dikembangkan hingga sekarang belum bisa bekerja dengan baik pada situasi real. Hal inilah yang melatarbelakangi penelitian ini dilakukan. Penelitian ini di tujukan untuk melakukan kajian terhadap teknik higher order statistic (HOS) dan model Me-Frequency Cesptrum Coefficients (MFCC) sebagai ekstraksi ciri yang diintegrasikan dengan hidden Markov Model (HMM) sebagai pengenal pola untuk menghasilkan sistem identifikasi pembicara yang lebih robust terhadap noise, khususnya Gaussian Noise. Penelitian yang dilakukan lebih difokuskan pada bagian ekstraksi ciri dari sistem identifikasi pembicara. Sementara bagian pengenal pola menggunakan teknik yang umum, yaitu HMM. Strategi yang dilakukan adalah melalui pendekatan empiris untuk menunjukkan kegagalan teknik ekstraksi ciri konvensioanal yang ada, yaitu ID-MFCC yang berbasis power spektrum, pada lingkungan ber-noise, dilajutkan dengan mengkaji permasalahannya, dan diusulkan teknik ekstraksi berbasis HOS untuk mengatasi permasalahan tersebut. Berikutnya adalah melakukan serangkaian percobaan untuk menunjukkan efektifitas teknik yang diusulkan. Setelah melakukan percobaan, baik dengan teknik ekstraksi ciri konvensional maupun yang diusulkan, dilakukan studi komparasi untuk melihat karakteristiknya, dan dilanjutkan dengan mengajukan usulan rancangan sistem. Berdasarkan bukti empiris, terlihat bahwa permasalahan ID-MFCC adalah pada inputnya, yaitu power spektrum yang bersifat tidak stabil terhadap noise. Pada penelitian ini diusulkan untuk mengganti power spektrum dengan bispetrum yang secara teori lebih robust terhadap noise. Teknik yang diusulkan adalah suatu metodologi untuk mengekstrak nilai bispektrum sinyal suara dengan MFCC dan diintegrasikan dengan HMM untuk membentuk sistem identifikasi pembicara. Oleh karena itu, pada penelitian ini dilakukan perluasan teknik ID-MFCC menjadi 2D-MFCC. Untuk meningkatkan efektifitas sistem, diusulkan teknik kuantisasi sebagai cara merepresentasikan nilai bispektrum sehingga distribusi spasialnya terakomodasi, dan dilanjutkan dengan transformasi wrapping dan kosinus seperti pada MFCC. Hasil percobaan menunjukkan bahwa teknik konvensional yang berbasis pada power spetrum dapat menangkap ciri suara tanpa penambahan noise dengan baik dan jika dipadukan dengan Mel-Frequency Cepstrum Coefficients (MFCC) sebagai ekstraksi ciri dan HMM sebagai pengenal pola, maka akan menghasilkan sistem dengan akurasi di atas 98.8%. Namun demikian, dengan penambahan noise 20 dB, nilai power spektrum mengalami perubahan secara nyata, sehingga akurasi sistem jatuh hingga level di bawah 50%. Teknik penghapusan noise secara adaptive mampu meningkatkan akurasi menjadi 77.7%, namun dengan noise yang lebih besar, teknik ini gagal dan akurasi kembali jatuh di bawah 50%. Sistem yang dikembangkan dengan menggunakan bispektrum sebagai penentu ciri dipadukan dengan MFCC yang diperluas ke dua dimensi berhasil memberikan akurasi 99.9% sinyal suara asli. Namun untuk sinyal dengan noise 20db, akurasi sistem menjadi sekitar 70%. Optimasi pada bentuk filter pada proses MFCC dengan algoritma genetika mampu meningkatkan akurasi menjadi bb.8%. Akan tetapi dengan noise yang lebih tinggi, sistem gagal bekerja dengan baik. Teknik kualitas skalar terhadap nilai bispetrum yang dilanjutkan dengan proses wrapping dan transformasi kosinus seperti yang dilakukan pada MFCC mampu meningkatkan robusttress sistem terhadap noise dengan akurasi 99.5% dan 83% masing-masing untuk sinyal asli dan sinyal dengan penambahan noise 20 dB. namun untuk noise 10 dB, teknik ini gagal bekerja dengan baik. Dari percobaan dengan teknik kuantisasi vektor, terlihat bahwa rata-rata nilai bispetrum di atas kuartil tiga adalah penduga terbaik bagi nilai bispetrum setiap channel dengan jumlah 400 channel. Selain itu nilai parameter yang optimum pada proses ekstraksi ciri dengan kuantisasi vektor dilanjutkan dengan proses wrapping dan transformasi kosinus pada sinyal dengan penambahan noise adalah jarak filter linear 75, jarak filter logaritma 1.06 dan proporsi filter linear dan logaritma 30:20. Kinerja sistem menunjukkan peningkatan yang berarti dengan akurasi 88% dan 75.5% masing masing untuk sinyal dengan penambahan noise 20 dB dan 10 dB. Namun demikian untuk sinyal asli justru lebih rendah, yaitu dengan akurasi maksimum hanya 94.5%. Hal ini berarti bahwa teknik ekstraksi cir yang efektif tergantung dari kualitas sinyal masukan. Oleh karena itu sistem yang dikembangkan sebaiknya dilengkapi dibagian awalnya dengan kemampuan untuk menduga kualitas sinyal masukan. Dari studi eksploratif terhadap nilai autokorelasi dan ragam sinyal suara, diperoleh bahwa kualitas sinyal dapat diidentifikasi dengan besaran yang dirumuskan sebagai negatif dari logaritma perkalian nilai absolut autokorelasi dari lag 1 hingga lag 21. Nilai ambang untuk membedakan sinyal sesuai kualitasnya dengan besaran tersebut adalah diantara 7 hingga 15. Jika nilai besaran tersebut kecil, maka teknik ID-MFCC lebih sesuai untuk diterapkan. Seangkan untuk hal lainnya disarankan menggunakan teknik vektor kuantisasi vektor terhadap nilai bispektrum sebagai pengektraksi ciri. Berdasarkan nilai ambang inilah disusun prototipe sistem identifikasi pembicara menggunakan software matlab.