Call Number | KP-3816 |
Collection Type | Kerja Praktek (KP) |
Title | Eksperimen end-to-end Kafka Topic Partitioning dengan Algoritma Bromax dan Bromin |
Author | Bryan Raihan Ilman; |
Publisher | Depok: Fasilkom UI, 2024 |
Subject | Data Streaming |
Location | FASILKOM-UI; |
Nomor Panggil | ID Koleksi | Status |
---|---|---|
KP-3816 | TERSEDIA |
Nama : Bryan Raihan ’Ilman Program Studi : Ilmu Komputer Judul : Eksperimen End-to-End Kafka Topic Partitioning dengan Algoritma BroMax dan BroMin Pembimbing : Ichlasul Affan, M.Kom. Streaming data secara real-time adalah pengiriman data kontinu dari sumber ke penerima, sering digunakan dalam aplikasi yang memerlukan respons cepat dan aliran data besar. Apache Kafka mengelola proses ini dengan mempartisi data menjadi topik untuk pemrosesan paralel. Kerja praktik ini berfokus pada penelitian optimisasi partisi topik Apache Kafka, sebagaimana dijelaskan dalam paper berjudul “Efficient Topic Partitioning of Apache Kafka for High-Reliability Real-Time Data Streaming Applications”. Pelaksana kerja praktik berperan sebagai Research Assistant di Computer Systems Laboratory (CSL) Fakultas Ilmu Komputer Universitas Indonesia, sebuah laboratorium yang fokus pada penelitian komputasi kinerja tinggi dan manajemen big data. Tugas utamanya adalah menjalankan eksperimen end-to-end, yang dalam konteks ini berarti mengamati aliran data dari produser hingga konsumen untuk mengukur latensi dari di seluruh proses. Metodologi yang digunakan dalam kerja praktik ini mencakup beberapa langkah penting. Di awal, pelaksana menyiapkan VM di Google Cloud Platform dan menginstal semua dependensi yang dibutuhkan untuk eksperimen Kafka. Setelah itu, eksperimen dijalankan dengan satu VM yang bertindak sebagai klien Kafka dan satu lagi sebagai klaster Kafka. Eksperimen difokuskan pada pengujian algoritma BroMax dan BroMin untuk memantau perilaku partisi topik. Algoritma tersebut digunakan untuk secara matematis menentukan jumlah partisi yang optimal demi mencapai throughput maksimal. Selain itu, resource monitoring dilakukan secara rutin untuk melacak penggunaan CPU, RAM, dan disk space pada VM. Eksperimen lalu diulang pada infrastruktur UI. Metodologi eksperimental kuantitatif diterapkan dalam proyek ini, menggunakan berbagai teknologi termasuk Apache Kafka untuk streaming data, Docker dan Linux untuk containerization, serta Google Cloud Platform untuk infrastruktur. Selain itu, Python dan Bash digunakan dalam automasi proses eksperimen. Hasil penelitian ini mencakup pengembangan framework berbasis containerization yang mengotomatisasi proses experiment setup sehingga mempermudah pengujian tanpa perlu konfigurasi manual, dan pemahaman mendalam tentang perilaku latency dan throughput di bawah berbagai application constraints.