ABSTRAK
Nama : Michael Susanto
Program Studi : Ilmu Komputer
Judul : Tweetream: Real-Time Tweet Streaming Platform berbasis Cloud untuk
Pemrosesan Microblogging Data Berskala Besar
Pembimbing : Muhammad Hafizhuddin Hilman, S.Kom., M.Kom., Ph.D.
Seiring berjalannya waktu, semakin banyak pula data-data yang dihasilkan dari aktivitas
yang dilakukan di dalam internet. Untuk melakukan pemrosesan data skala besar,
diperlukan suatu cara agar data tersebut dapat diperoleh dan diolah secara efektif dan
efisien. Salah satu metode untuk mengambil data skala besar secara real-time adalah
dengan melakukan streaming. Penelitian yang dilakukan oleh Kurniawan et al.
menghasilkan sebuah model klasifikasi terbaik yang dapat digunakan untuk melakukan
klasifikasi trafik lalu lintas. Aplikasi yang dibangun sudah dapat melakukan streaming
namun masih sederhana dan bersifat monolitik, yang apabila digunakan untuk melakukan
pemrosesan data skala besar tidak bersifat scalable. Scalable di sini merujuk kepada
kemampuan aplikasi tersebut untuk di-scale sesuai kebutuhan dan dapat dilakukan pada
komponen tertentu dari aplikasi. Dalam penelitian ini akan dibentuk platform Tweetream
yang mampu mengakomodasi kebutuhan pemrosesan data skala besar dan bersifat
scalable. Rancangan arsitektur yang dibuat untuk Tweetream bersifat fleksibel sehingga
dapat ditambah dan dikurangi komponennya sesuai kebutuhan. Tidak hanya itu, platform
Tweetream juga diuji dengan menggunakan model klasifikasi yang dikembangkan oleh
Kurniawan et al. dan melalui serangkaian skenario yang beragam. Hasil penelitian
didapatkan bahwa kemampuan mesin yang melakukan pengambilan data dari Twitter
memiliki throughput 698400 tweets / 1 USD. Selain itu, aplikasi Web Client dengan fitur
autoscaling dalam melakukan tugas yang berat terlihat unggul pada 3 dari 3 metrik yang
diuji dalam penelitian ini namun kurang unggul dalam hal response time pada tugas yang
ringan dibandingkan dengan aplikasi Web Client tanpa scaling. Berdasarkan hasil analisis,
terlihat bahwa Tweetream sudah cukup efektif dan efisien untuk pemrosesan data
berskala besar sebab telah memenuhi aspek performa, ketersediaan, dan kemudahan
kustomisasi.
Kata kunci:
Tweetream, stream processing, cloud computing, autoscaling, real-time.
|
|