ABSTRAK
Nama : Muhammad Rafif Priyo Waskito
Program Studi : Ilmu Komputer
Judul : Pengembangan Model Tanya Jawab Hukum Berbasis
LexID Knowledge Graph dengan Model Pipeline Berbasis
BERT (Bidirectional Encoder Representations from Transformers)
Pembimbing : Adila Alfa Krisnadhi, S.Kom., M.Sc., Ph.D
Peraturan perundang-undangan baru di Indonesia dapat mengganti, menghapus, atau
menambahkan aturan yang sudah berlaku sehingga setiap warga Indonesia memiliki
tanggung jawab untuk mengetahui aturan terbaru saat hendak digunakan. Laman
pengumpulan informasi ini sudah ada di laman pemerintah resmi seperti peraturan.go.id.
Akan tetapi ada informasi yang tidak mudah dicari seperti isi pasal terbaru pada dokumen
yang telah diubah oleh dokumen lain. Sekarang, sudah ada informasi peraturan
perundang-undangan yang disimpan dalam knowledge graph (KG)-sebuah basis data
terstruktur berbentuk kumpulan entitas dan relasi layaknya sebuah graf- bernama LexID
KG (Muninggar & Krisnadhi, 2023). Ditambah lagi, LexID QA (Handi, 2023), yaitu
sebuah sistem tanya jawab hukum dengan informasinya dari LexID KG, menangani
masalah ini tetapi dengan memaksakan struktur inputnya. Menurut Jain, Kumar, Kota,
dan Patel (2018) kebebasan membuat input (free-text) merupakan fitur bagus karena
seakan-akan sedang berinteraksi dengan manusia. Oleh karena itu, penelitian ini
berusaha untuk menyelesaikan permasalahan pemaksaan struktur input pada LexID QA
dengan beralih ke model machine learning pipeline. Model pipeline-nya tersusun dari
model klasifikasi pertanyaan bebas ke kueri SPARQL, sebuah bahasa untuk mengambil
informasi dari KG, dan model NER untuk mengambil informasi entitas penting seperti
judul dokumen yang dicari pada pertanyaan bebasnya. Kedua model ini berbasiskan
BERT (Bidirectional Encoder Representations from Transformers) (Devlin, Chang, Lee,
& Toutanova, 2018). Hasil dari model klasifikasi mencapai nilai sempurna pada dataset
baru yang dibuat pada penelitian ini. Kemudian, hasil dari model pipeline-nya juga
mencapai nilai makro-akurasi sebesar 0.949 pada dataset yang sama.
Kata kunci:
Tanya Jawab Berbasis Knowledge Graph, Tanya Jawab Hukum, Model Pipeline, BERT
|