Tidak ada review pada koleksi ini: 51371
ABSTRAK
Nama Penulis 1 : Kevin Dharmawan
Program Studi Penulis 1 : Ilmu Komputer
Nama Penulis 2 : Zaki Indra Yudhistira
Program Studi Penulis 2 : Ilmu Komputer
Judul : Evaluasi Kecepatan Operasi dan Kepraktisan Penyimpanan
Graf untuk Ver: View Discovery in the Wild
Pembimbing : Adila Alfa Krisnadhi, S.Kom., M.Sc., Ph.D.
Ver adalah discovery system yang dibuat untuk mengidentifikasi join path pada data besar
yang tidak mengandung join information. Ver menyimpan setiap kolom dari sumber
data sebagai node dan potensi join path sebagai edge dalam bentuk graf menggunakan
NetworkX. Namun, NetworkX memiliki limitasi pada besarnya graf yang dapat disimpan
karena NetworkX menyimpan graf pada memory. Oleh karena itu, dibutuhkan alternatif
penyimpanan graf yang menyimpan graf dalam persistent disk sebagai pengganti
NetworkX pada Ver. Pencarian penyimpanan graf alternatif dilakukan dengan membandingkan beberapa penyimpanan graf yang meliputi: ArangoDB, CubicWeb, DGraph,
DuckDB, IndraDB, JanusGraph, Kuzu, NebulaGraph, Neo4j, OrientDB, SurrealDB,
dan TypeDB. Perbandingan dilakukan menggunakan graf acak dan graf dari dataset.
Graf acak yang digunakan memiliki node dengan jumlah 100, 200, 400, 800, dan 1600
dengan kepadatan edge 0.1 sampai 1.0 dengan kenaikan 0.1. Dataset yang digunakan
untuk perbandingan adalah TPC-H, ChEMBL, dan AdventureWorks. Perbandingan
dilakukan dengan metode kuantitatif berdasarkan kecepatan operasi pemuatan data,
2-hop neighborhood, dan path finding serta metode kualitatif untuk kepraktisan dengan
menilai kemudahan instalasi server, kemudahan implementasi client, dan kelengkapan
dokumentasi. Didapatkan bahwa Kuzu adalah penyimpanan graf yang paling sesuai
untuk menjadi pengganti NetworkX pada Ver.
Kata kunci:
Discovery system, data besar, join path, penyimpanan graf, NetworkX, Kuzu, memory,
persistent disk