Speech Recognition (SR) adalah sebuah mekanisme translasi suara menjadi teks yang di-encode dalam mesin. Namun untuk membangun suatu sistem SR yang robust dibutuhkan data training yang besar dan teranotasi baik. Untuk mencapai hal tersebut akan dibutuhkan biaya pengerjaan yang sangat besar. Permasalahan data training yang besar dan teranotasi baik dapat diatasi dengan pendekatan CAPTCHA yang dimodifikasi menjadi reCAPTCHA. Adanya kebutuhan keamanan pada web portal dapat dimanfaatkan pada pendekatan Completely Automated Public Turing Test to Tell Computers and Humans Apart (CAPTCHA) untuk membantu anotasi teks. Pendekatan tersebut dikenal sebagai reCAPTCHA. Pada penelitian ini, pendekatan yang serupa diimplementasikan untuk data berbasis audio. Web service reCAPTCHA berbasis audio dikembangkan untuk kebutuhan otentikasi serta anotasi data suara. Fedora Repository dimanfaatkan sebagai audio dataset management untuk semua hasil reCAPTCHA. Sistem telah berhasil dikembangkan dan dapat digunakan sebagai layanan otentikasi dan anotasi data suara layaknya sistem reCAPTCHA dengan basis teks. Sistem dapat diakses melalui http://budaya.cs.ui.ac.id/audiotag/.