ABSTRAK
Nama : Muhammad Jilham Luthfi
Program Studi : Ilmu Komputer
Judul : Validasi Kelengkapan Knowledge Graph (KG) Menggunakan SHACL
Pembimbing : Fariz Darari, S.Kom., M.Sc., Ph.D.
Perkembangan knowledge graph serta penggunaannya meningkat secara masif akhir-
akhir ini. Namun, pertumbuhan knowledge graph nyatanya tidak sebanding dengan
kualitas data yang dimiliki. Sementara itu, aspek kelengkapan dalam kualitas data
knowledge graph memiliki peranan penting dalam pemakaian data yang sesuai dengan
kebutuhan. Sayang sekali, hingga saat ini belum ada penelitian tentang penggunaan
SHACL dalam melakukan validasi kelengkapan data. Penelitian ini hadir dengan tujuan
untuk membuat pola-pola kelengkapan berdasarkan kondisi knowledge graph beserta
instance-nya. Penelitian ini mengidentifikasi enam pola kelengkapan yang sering muncul
pada knowledge graph. Dari keenam pola kelengkapan tersebut, penelitian ini berhasil
membuat 360.162 instance pola kelengkapan dalam bentuk SHACL shape. Pembuatan
instance pola kelengkapan menggunakan lima pendekatan, yakni pendekatan manual,
otomatis, spreadsheet, ontologi, dan statistik. Semua shape tersebut kemudian digunakan
untuk melakukan validasi terhadap 928.310 entitas pada knowledge graph dunia nyata,
yakni Wikidata dan DBpedia. Hasil validasi population, no-value, dan label and
description completeness pada Wikidata dan DBpedia mencapai skor lebih dari 90%.
Sementara itu, hasil validasi property dan interlinking completeness pada Wikidata dan
DBpedia berada di rentang skor 60-70%. Terakhir, validasi schema completeness pada
Wikidata dan DBpedia mencapai hasil 70-90%. Selain itu, penelitian ini menyediakan
aplikasi web bernama SHACL on Completeness Knowledge (SoCK) untuk mengelola
dan menyediakan pola kelengkapan beserta instance-nya.
Kata kunci:
SHACL, kelengkapan, pola, validasi, knowledge graph
|
|