Speech Recognition (SR) adalah sebuah mekanisme translasi suara menjadi teks
yang di-encode dalam mesin. Namun untuk membangun suatu sistem SR yang
robust dibutuhkan data training yang besar dan teranotasi baik. Untuk mencapai
hal tersebut akan dibutuhkan biaya pengerjaan yang sangat besar. Permasalahan
data training yang besar dan teranotasi baik dapat diatasi dengan pendekatan
CAPTCHA yang dimodifikasi menjadi reCAPTCHA. Adanya kebutuhan
keamanan pada web portal dapat dimanfaatkan pada pendekatan Completely
Automated Public Turing Test to Tell Computers and Humans Apart (CAPTCHA)
untuk membantu anotasi teks. Pendekatan tersebut dikenal sebagai reCAPTCHA.
Pada penelitian ini, pendekatan yang serupa diimplementasikan untuk data berbasis
audio. Web service reCAPTCHA berbasis audio dikembangkan untuk kebutuhan
otentikasi serta anotasi data suara. Fedora Repository dimanfaatkan sebagai audio
dataset management untuk semua hasil reCAPTCHA. Sistem telah berhasil
dikembangkan dan dapat digunakan sebagai layanan otentikasi dan anotasi data
suara layaknya sistem reCAPTCHA dengan basis teks. Sistem dapat diakses
melalui http://budaya.cs.ui.ac.id/audiotag/.
|
|