ABSTRAK
Nama : Muhammad Ilham Al Ghifari
Program Studi : Ilmu Komputer
Judul : Analisis dan Peningkatan Kualitas Framework Lex2KG
dalam Pembuatan Knowledge Graph Peraturan Perundang-
Undangan
Framework Lex2KG telah dibuat untuk dapat mengekstraksi dokumen PDF peraturan
perundang-undangan menjadi dokumen KG yang berbentuk RDF triple. Setelah pe-
meriksaan, framework ini masih memiliki beberapa permasalahan yang muncul pada
tahapan ekstraksinya. Permasalahan yang muncul mengakibatkan kurangnya kualitas
KG hasil ekstraksinya terutama pada aspek kualitas accuracy dan completeness. Oleh
karena itu diperlukan sebuah perbaikan dari framework Lex2KG ini untuk menghindari
permasalahan yang muncul. Selain perbaikan framework, dibutuhkan sistem lain yang
dapat menjaga dan meningkatkan kualitas dari framework Lex2KG ini. Dengan alasan
tersebut, pada penelitian ini penulis telah melakukan analisis serta perbaikan dari
framework Lex2KG. Hasil dari perbaikan ini adalah peningkatan jumlah dokumen yang
dapat terekstraksi menjadi KG. Setelah perbaikan framework dilakukan, Lex2KG dapat
mengekstraksi 1353 dokumen Undang-Undang (UU) dan 963 dari dokumen tersebut
mempunyai Jumlah Pasal yang lengkap. Sementara itu, framework Lex2KG sebelum
perbaikan hanya dapat mengekstraksi 784 dokumen dan 563 dokumen tersebut memiliki
jumlah pasal yang lengkap. Selain mengektraksi dokumen UU, pada penelitian ini
framework Lex2KG dapat mengekstraksi 3864 dari 4758 dokumen Peraturan Pemerintah
(PP) menjadi data KG. Selain melakukan perbaikan Lex2KG, penelitian ini juga mem-
buat SHACL shape yang dapat memvalidasi data KG yang dihasilkan Lex2KG. Dengan
validasi shape ini ditemukan 60 dokumen UU yang tidak memiliki judul dikarenakan
perbedaan format penulisan pada dokumen PDF nya. Untuk dapat mempermudah
memahami dan menganalisis data Legal KG, telah dibuat kode visualisasi untuk data KG.
Visualisasi ini berbentuk visualisasi statistik dan visualisasi graph. Penulis juga membuat
dataset yang berisikan pertanyaan beserta jawabannya yang digunakan untuk menjaga
kualitas aplikasi Legal VA yang menggunakan sumber data hasil ekstraksi Lex2KG.
Dataset pertanyaan ini yang akan memastikan kualitas jawaban yang dikembalikan oleh
aplikasi Legal VA akurat dan sesuai.
Kata kunci:
Knowledge graph, Peraturan perundang-undangan, SHACL, SPARQL, KG Quality,
Virtual Assistant, Scraping
|
|