ABSTRAK
Nama : Yumna Pratista Tastaftian
Program Studi : Ilmu Komputer
Judul : Deteksi Emosi Wicara Bahasa Indonesia pada Podcast dan
Talkshow dengan Menggunakan Metode Recurrent Neural
Network dan Convolutional Neural Network
Speech Emotion Recognition adalah teknologi yang mampu bisa mendeteksi
emosi lewat data suara yang diproses oleh sebuah mesin. Media yang sering
digunakan untuk menjadi media interaksi antara 2 orang atau lebih yang saat ini
sedang digunakan oleh banyak orang adalah Podcast, dan Talkshow. Seiring
berkembangya SER, penelitian terakhir menunjukkan bahwa penggunaan metode
Deep Learning dapat memberikan hasil yang memuaskan terhadap sistem SER.
Pada penelitian ini akan diimplementasikan model Deep Learning yaitu dengan
Recurrent Neural Network (RNN) variasi Long Short Term Memory (LSTM)
untuk mengenali 4 kelas emosi (marah, netral, sedih, senang). Penelitian ini
menguji model yang digunakan untuk mengenali emosi dari fitur akustik pada
data secara sekuensial. Skenario training dan testing dilakukan dengan metode
one-against-all dan mendapatkan hasil (1) Dataset talkshow mengungguli dataset
podcast untuk tipe 1 dan 2 dan untuk semua emosi yang dibandingkan; (2) Untuk
dataset podcast pada emosi marah, senang, dan sedih didapatkan akurasi optimal
pada dataset tipe 1 yaitu 67.67%, 71.43%, dan 68,29%, sedangkan untuk emosi
netral didapatkan akurasi terbaik pada dataset tipe 2 dengan 77.91%; (3) Untuk
dataset talkshow pada emosi marah, netral, dan sedih didapatkan akurasi terbaik
pada dataset tipe 2 yaitu 78.13%, 92.0%, dan 100%. Dapat disimpulkan bahwa
dataset talkshow secara garis besar memberikan hasil yang lebih optimal namun
memiliki variasi data yang lebih sedikit dari dataset podcast. Dari sisi panjang
data, pada penelitian ini didapatkan akurasi yang lebih optimum pada dataset
dengan tipe 2.
Kata Kunci : Speech Emotion Recognition, Recurrent Neural Network, Podcast,
Talkshow
|
|