Tidak ada review pada koleksi ini: 46715
ABSTRAK
Nama : Fadzil Rizki
Program Studi : Sistem Informasi
Judul : Prediksi Jenis Kelamin dan Asal Daerah Pengguna Twitter di Indonesia Menggunakan Data Profil Akun dan Tweet
Pembimbing : Rahmad Mahendra, S.Kom., M.Sc. & Satrio Baskoro Yudhoatmojo, S.Kom., M.T.I.
Twitter sebagai salah satu media sosial yang paling banyak digunakan menghasilkan data teks yang berlimpah. Namun, informasi pengguna yang ditampilkan Twitter sangatlah terbatas. Sehingga, menarik untuk dilakukan penelitian yang dapat memprediksi atribut demografis pengguna. Penelitian ini melakukan identifikasi atau prediksi atribut jenis kelamin dan asal daerah pengguna Twitter di Indonesia. Prediksi jenis kelamin dan asal daerah dimodelkan sebagai permasalahan klasifikasi dan eksperimen dilakukan pada tiga classifier berbeda, yaitu Naive Bayes, Logistic Regression, dan Random Forest. Fitur yang digunakan dalam membangun model adalah nama, warna, bio, tweet content, ortografi, emoticon, behavior dan location. Pada uji fitur mandiri, fitur tweet content memberikan hasil yang terbaik dengan akurasi 77,7% untuk atribut jenis kelamin dengan menggunakan classifier Logistic Regression dan 78,6 % untuk atribut asal daerah dengan menggunakan classifier Naïve Bayes. Uji keseluruhan fitur mendapatkan hasil terbaik dengan menggunakan classifier Logistic Regression yaitu dengan akurasi 76,2% untuk atribut jenis kelamin. Sedangkan untuk atribut asal daerah, classifier Logistic Regression dan Naïve Bayes memberikan hasil terbaik dengan akurasi masing – masing 77, 1% dan 77%.
Kata kunci: Prediksi, jenis kelamin, asal daerah, Twitter.