ABSTRAK
ABSTRAK
Nama : Firdaus Solihin
Program Studi : Doktor Ilmu Komputer
Judul : Ekstraksi Informasi Dokumen Putusan Pengadilan yang Bersifat
Adaptif Menggunakan Metode Berbasis Aturan dan Pembelajaran
Mesin
Pembimbing : Prof. Dr. Indra Budi S.Kom., M.Kom.
Dokumen putusan pengadilan jumlahnya sangat banyak dan terus berkembang.
Menyaring jutaan dokumen putusan secara manual berdasarkan kriteria tertentu
membutuhkan banyak waktu dan tenaga. Ekstraksi informasi dokumen putusan adalah
salah satu solusi untuk dapat menyaring dan menggali informasi penting yang ada
dalam dokumen secara otomatis. Dokumen putusan memiliki berbagai klasifikasi,
masing-masing memiliki pola umum, pola khusus. Dokumen Putusan juga memiliki
banyak variasi penggunaan kata, penggunaan frasa, struktur sistematika yang berbeda.
Kondisi dan karakteristik dari dokumen putusan pengadilan membuat proses ekstraksi
informasi membutuhkan model yang lebih adaptif terhadap berbagai perbedaan tersebut.
Penelitian ini bertujuan untuk melakukan ekstraksi informasi dokumen putusan dari
klasifikasi yang berbeda baik pidana maupun perdata. Pendekatan yang digunakan
adalah metode berbasis aturan, SVM, CRF, BiLSTM dan BERT. Dataset yang
digunakan adalah putusan pidana dan perdata yang diambil dari directory putusan MA,
masing-masing sebanyak 200 putusan. Hasil ujicoba ekstraksi informasi dari dataset
pidana sebanyak 200 putusan menunjukkan nilai F1-score sebesar 0.89 untuk metode
berbasis aturan, masing-masing 0.65 dibanding 0.19 pada penggunaan metode mechine
learning klasik CRF dan SVM, 0.37 pada pemanfaatan BiLSTM, sedangkan pada
penggunaan metode BERT menunjukkan hasil 0.96. Pemanfaatan metode BERT
memiliki keunggulan lebih disamping penggunaan pre-trained juga memiliki hasil
akurasinya menunjukkan nilai tertinggi dibandingkan dengan metode lainnya. Hasil
ujicoba adaptif pada putusan pidana dan perdata sekaligus menggunakan dataset total
400 putusan dan metode BERT menunjukkan penggabungan dataset dari klasifikasi
yang berbeda dan juga penggabungan entitas dari kalsifikasi tersebut dapat menjadi
solusi agar model yang dapat adaptif terhadap perbedaan. metode BERT dengan pretrained
bert-base-indonesian-522M menghasilkan nilai akurasi terbaik pada model
adptive baik dari test acak sebesar 0.962, test pidana sebesar 0.975 maupun test perdata
sebesar 0.973. Pemanfaatan sifat adaptif dari informasi untuk putusan ini dapat menjadi
pendorong pengembangan pemanfaatan NLP khususnya di bidang hukum, dan hasil
ektrasi informasi dapat digunakan dan dimanfaatkan untuk berbagai proses penggalian
informasi hukum.
Kata kunci: Information Extraction, Putusan Pengadilan, Adaptif information
Extraction, SVM, CRF, BiLSTM, BERT.
|