Library Automation and Digital Archive
LONTAR
Fakultas Ilmu Komputer
Universitas Indonesia

Pencarian Sederhana

Find Similar Add to Favorite

Call Number SK-1724 (Softcopy SK-1206) Source SK-695
Collection Type Skripsi
Title Prediksi jenis kelamin dan asal daerah pengguna twitter di Indonesia menggunakan data profil akun dan tweet
Author Fadzil Rizki;
Publisher Depok: Fakultas Ilmu Komputer Universias Indonesia, 2019
Subject
Location FASILKOM-UI;
Lokasi : Perpustakaan Fakultas Ilmu Komputer
Nomor Panggil ID Koleksi Status
SK-1724 (Softcopy SK-1206) Source SK-695 TERSEDIA
Tidak ada review pada koleksi ini: 46715
ABSTRAK Nama : Fadzil Rizki Program Studi : Sistem Informasi Judul : Prediksi Jenis Kelamin dan Asal Daerah Pengguna Twitter di Indonesia Menggunakan Data Profil Akun dan Tweet Pembimbing : Rahmad Mahendra, S.Kom., M.Sc. & Satrio Baskoro Yudhoatmojo, S.Kom., M.T.I. Twitter sebagai salah satu media sosial yang paling banyak digunakan menghasilkan data teks yang berlimpah. Namun, informasi pengguna yang ditampilkan Twitter sangatlah terbatas. Sehingga, menarik untuk dilakukan penelitian yang dapat memprediksi atribut demografis pengguna. Penelitian ini melakukan identifikasi atau prediksi atribut jenis kelamin dan asal daerah pengguna Twitter di Indonesia. Prediksi jenis kelamin dan asal daerah dimodelkan sebagai permasalahan klasifikasi dan eksperimen dilakukan pada tiga classifier berbeda, yaitu Naive Bayes, Logistic Regression, dan Random Forest. Fitur yang digunakan dalam membangun model adalah nama, warna, bio, tweet content, ortografi, emoticon, behavior dan location. Pada uji fitur mandiri, fitur tweet content memberikan hasil yang terbaik dengan akurasi 77,7% untuk atribut jenis kelamin dengan menggunakan classifier Logistic Regression dan 78,6 % untuk atribut asal daerah dengan menggunakan classifier Naïve Bayes. Uji keseluruhan fitur mendapatkan hasil terbaik dengan menggunakan classifier Logistic Regression yaitu dengan akurasi 76,2% untuk atribut jenis kelamin. Sedangkan untuk atribut asal daerah, classifier Logistic Regression dan Naïve Bayes memberikan hasil terbaik dengan akurasi masing – masing 77, 1% dan 77%. Kata kunci: Prediksi, jenis kelamin, asal daerah, Twitter.