ABSTRAK
Nama : Clara Vania
Program Studi : Magister Ilmu Komputer
Judul : Pengembangan Sistem Text-To-Speech (TTS) Berbasiskan
Hidden Markov Models (HMM) untuk Bahasa Indonesia
Dalam beberapa tahun terakhir, seiring dengan berkembangnya teknologi,
kebutuhan akan sistem yang dapat menghasilkan suara semakin meningkat. Suara
merupakan suatu representasi bahasa yang utama, yang dapat ditemui pada semua
kebudayaan. Kenyataan tersebut mendorong adanya penelitian untuk membangun
suatu sistem yang dapat mengubah teks menjadi suara. Sistem tersebut dinamakan
sistem text-to-speech (TTS). Dari berbagai teknik yang digunakan pada penelitian
sistem TTS, teknik yang saat ini sedang populer adalah teknik sintesis suara
berbasiskan Hidden Markov Models (HMM) dimana suara dihasilkan melalui
parameter yang dihasilkan oleh HMM.
Pada tugas akhir ini, dilakukan penelitian untuk membangun suatu sistem TTS
berbasiskan HMM untuk Bahasa Indonesia. Penelitian ini dilakukan untuk
menganalisis pengaruh koleksi data pelatihan yang digunakan terhadap kualitas
hasil sintesis suara. Selain itu, dilakukan pula penelitian dengan menambahkan
informasi pemenggalan suku kata dan pemberian penekanan suku kata pada
kamus pelafalan Bahasa Indonesia. Selanjutnya, penelitian ini juga akan
membandingkan hasil pengaturan konfigurasi parameter sistem, yakni mengenai
panjang frame serta fungsi windowing yang dipergunakan.
Evaluasi hasil penelitian dilakukan dengan menggunakan nilai Mean Opinion
Score (MOS) dengan skala (1-5) dan metode evaluasi Semantically Unpredictable
Sentences (SUS). Hasil evaluasi menunjukkan bahwa koleksi data penelitian
dengan jumlah segment unit yang semakin besar menghasilkan kualitas suara
yang semakin baik. Penggunaan informasi pemenggalan suku kata serta
penekanan suku kata juga turut meningkatkan hasil kualitas sintesis suara, yaitu
masing-masing sebesar 32.21% dan 22.18%. Pada proses segmentasi suara,
panjang frame yang digunakan memberikan hasil sintesis terbaik ketika memiliki
panjang yang menengah, yaitu 25 ms. Untuk penelitian menggunakan fungsi
windowing, fungsi Hamming memberikan nilai yang paling baik bila
dibandingkan dengan kedua fungsi lainnya, Hanning dan Blackman, yaitu sebesar
2.775.
Kata kunci:
sistem TTS, HMM, speech synthesis, text-to-speech, MOS, SUS
|
|