ABSTRAK
ABSTRAK
Nama : Arifan Rahman
Program Studi : Magister Ilmu Komputer
Judul : Identifikasi Suara sebagai Biometric dalam Berbagai
Sampling Frekuensi
Pembimbing : Ir. Wahyu Catur Wibowo, M.Sc., Ph.D.
Suara merupakan suatu hal yang penting pada diri manusia, dengan suara
manusia bisa berkomunikasi dengan mudah. Selain itu, melalui suara kita bisa
mengenali orang tersebut tanpa perlu melihat wajahnya. Hal itu disebabkan karena
setiap suara manusia memiliki karakteristiknya masing-masing. Akan tetapi jika
melalui perantara, misalnya melalui rekaman atau melalui pesawat telepon, suara
yang dihasilkan kadang berbeda dengan suara aslinya tanpa melalui perantara. Hal
ini dikarenakan tiap-tiap alat tersebut memiliki sample rate frekuensi yang berbeda.
Oleh karena itu, perlu dikembangkan suatu sistem untuk identifikasi suara manusia
dalam berbagai variasi sampling frekuensi. Dataset yang digunakan pada penelitian
ini merupakan data rekaman dari empat orang dengan sample rate 8000Hz,
16000Hz, 32000Hz dan 48000Hz. Untuk melakukan identifikasi data tersebut,
dibutuhkan metode ekstraksi fitur dan klasifikasi yang tepat untuk berbagai jenis
data tersebut. Pada penelitian ini dilakukan penggabungan tiga fitur untuk
identifikasi suara manusia dalam berbagai jenis sampling frekuensi yaitu fitur
akustik MFCC, frekuensi formant, dan fitur prosodik dinamis. Proses klasifikasi
dari fitur-fitur terebut dan penggabungan fitur menggunakan Deep Neural Network
(DNN). Hasil eksperimen menunjukkan bahwa penggabungan ketiga fitur dengan
Deep Neural Network memperoleh f1-score yang lebih baik dibandingkan
penggabungan fitur dengan menggunakan klasifikasi Support Vector Machine
(SVM). Nilai f1-score yang didapatkan pada penggabungan fitur dengan
menggunakan DNN pada data suara berdurasi 3 detik, 5 detik, dan 10 detik berturutturut adalah 97.89%, 98.51%, 99.83%.
Kata Kunci: suara, signal processing, fitur akustik, fitur prosodik, frekuensi
formant, deep neural network, support vector machine
ABSTRAK
Nama : Arifan Rahman
Program Studi : Magister Ilmu Komputer
Judul : Identifikasi Suara sebagai Biometric dalam Berbagai
Sampling Frekuensi
Pembimbing : Ir. Wahyu Catur Wibowo, M.Sc., Ph.D.
Suara merupakan suatu hal yang penting pada diri manusia, dengan suara
manusia bisa berkomunikasi dengan mudah. Selain itu, melalui suara kita bisa
mengenali orang tersebut tanpa perlu melihat wajahnya. Hal itu disebabkan karena
setiap suara manusia memiliki karakteristiknya masing-masing. Akan tetapi jika
melalui perantara, misalnya melalui rekaman atau melalui pesawat telepon, suara
yang dihasilkan kadang berbeda dengan suara aslinya tanpa melalui perantara. Hal
ini dikarenakan tiap-tiap alat tersebut memiliki sample rate frekuensi yang berbeda.
Oleh karena itu, perlu dikembangkan suatu sistem untuk identifikasi suara manusia
dalam berbagai variasi sampling frekuensi. Dataset yang digunakan pada penelitian
ini merupakan data rekaman dari empat orang dengan sample rate 8000Hz,
16000Hz, 32000Hz dan 48000Hz. Untuk melakukan identifikasi data tersebut,
dibutuhkan metode ekstraksi fitur dan klasifikasi yang tepat untuk berbagai jenis
data tersebut. Pada penelitian ini dilakukan penggabungan tiga fitur untuk
identifikasi suara manusia dalam berbagai jenis sampling frekuensi yaitu fitur
akustik MFCC, frekuensi formant, dan fitur prosodik dinamis. Proses klasifikasi
dari fitur-fitur terebut dan penggabungan fitur menggunakan Deep Neural Network
(DNN). Hasil eksperimen menunjukkan bahwa penggabungan ketiga fitur dengan
Deep Neural Network memperoleh f1-score yang lebih baik dibandingkan
penggabungan fitur dengan menggunakan klasifikasi Support Vector Machine
(SVM). Nilai f1-score yang didapatkan pada penggabungan fitur dengan
menggunakan DNN pada data suara berdurasi 3 detik, 5 detik, dan 10 detik berturutturut adalah 97.89%, 98.51%, 99.83%.
Kata Kunci: suara, signal processing, fitur akustik, fitur prosodik, frekuensi
formant, deep neural network, support vector machine
|