Call Number | T-1247 (Softcopy T-955) Source T-319 Mak T-52 |
Collection Type | Tesis |
Title | Identifikasi bahasa daerah pada data suara dengan fitur akustik, ponotaktik dan prosodik |
Author | Mei Silviana Saputri; |
Publisher | Depok: Ilmu Komputer UI |
Subject | |
Location | FASILKOM-UI; |
Nomor Panggil | ID Koleksi | Status |
---|---|---|
T-1247 (Softcopy T-955) Source T-319 Mak T-52 | TERSEDIA |
ABSTRAK Nama : Mei Silviana Saputri Program Studi : Ilmu Komputer Judul : Identifikasi Bahasa Daerah pada Data Suara dengan Fitur Akustik, Fonotaktik dan Prosodik Pembimbing : Dra. Mirna Adriani, Ph.D. Bahasa daerah menjadi media komunikasi yang paling banyak digunakan pada percakapan sehari-hari masyarakat Indonesia. Beragamnya bahasa daerah menimbulkan masalah komunikasi apabila antar penduduk tidak memahami arti bahasa yang digunakan masing-masing. Oleh karena itu, perlu dikembangkan suatu sistem identifikasi bahasa lisan. Penelitian ini mengembangkan sistem identifikasi bahasa lisan untuk bahasa daerah di Indonesia meliputi Bahasa Jawa, Bahasa Sunda, Bahasa Madura, Bahasa Minangkabau, dan Bahasa Musi. Dataset yang digunakan dalam penelitian ini merupakan data rekaman siaran radio lokal untuk tiap-tiap bahasa yang bersifat spontan dan rentan akan noise. Oleh karena itu, dibutuhkan metode ekstraksi fitur dan klasifikasi yang tepat untuk karakteristik data tersebut. Pada penelitian ini akan dilakukan penggabungan tiga fitur untuk identifikasi bahasa lisan yaitu fitur akustik berbasis i-vector, fitur fonotaktik berbasis paralel fonem dan fitur dynamic prosody. Penggabungan ketiga metode tersebut dilakukan dengan menggunakan hidden layer pada Deep Neural Network (DNN). Hasil eksperimen menunjukkan bahwa penggabungan ketiga fitur dengan Deep Neural Network memperoleh f1-score yang lebih baik dibandingkan penggabungan fitur dengan Support Vector Machine (SVM). Nilai f1-score yang didapatkan pada penggabungan fitur dengan DNN pada data suara berdurasi 3 detik, 10 detik dan 30 detik berturut-turut adalah 87.85%, 93.46% dan 96.73%. Kata Kunci: identifikasi bahasa daerah, data suara, fitur akustik, fitur fonotaktik, fitur prosodik, deep neural network, support vector machine