ABSTRAK
Nama Penulis 1 / Program Studi : Naradhipa Mahardhika Setiawan Bhary / Ilmu Komputer
Nama Penulis 2 / Program Studi : Jafar Abdurrohman / Ilmu Komputer
Nama Penulis 3 / Program Studi : Fariz Wahyuzan Dwitilas / Sistem Informasi
Judul : Named Entity Recognition pada Dokumen Legal Berbahasa
Indonesia
Pembimbing : Evi Yulianti, Ph.D.
Eka Qadri Nuranti, M.Kom.
Sebagai negara hukum, Indonesia memiliki sistem peradilan yang aktif. Setiap bulannya,
terdapat sekitar 100.000 dokumen putusan yang dihasilkan oleh lembaga kehakiman di
Indonesia. Volume dokumen yang banyak tersebut menimbulkan suatu tantangan bagi
insan hukum di Indonesia. Guna mendukung dan mengakomodasi institusi publik dari
aspek teknologi dan informasi, serta mendorong pelaksanaan keterbukaan informasi
bagi masyarakat umum, maka dibutuhkan suatu metode yang dapat membantu untuk
mencari dan mengumpulkan informasi penting dari suatu dokumen putusan pengadilan.
Secara khusus, metode ini juga ditujukan untuk membantu para praktisi hukum untuk
kepentingan penegakan hukum dan para akademisi hukum untuk kepentingan pendidikan
dan pengembangan di bidang hukum. Salah satu teknik untuk mengumpulkan informasi
penting dari suatu dokumen adalah Named Entity Recognition (NER). Teknik NER
bekerja dengan cara menandai kata-kata yang merupakan informasi penting seperti
orang, tempat, lokasi, waktu, kejadian, dan lainnya. NER dapat diterapkan untuk
berbagai bidang permasalahan, seperti medis, hukum, dan pertanian. NER yang secara
spesifik bekerja untuk menandai entitas hukum disebut dengan Legal Entity Recognition
(LER). Penelitian sebelumnya telah menerapkan LER untuk dokumen legal berbahasa
Indonesia dengan pendekatan BiLSTM dan CRF sehingga diperlukan penelitian lebih
lanjut untuk mengetahui bagaimana performa model-model lain terhadap kasus tersebut.
Penelitian ini menguji performa language model, yaitu model berbasis RoBERTa dan
model berbasis BERT serta membandingkannya dengan deep learning model, yaitu
BiLSTM dan BiLSTM-CRF sebagai model baseline penelitian sebelumnya untuk task
LER bahasa indonesia. Hasil penelitian menunjukkan model berbasis RoBERTa memliki
performa terbaik untuk task LER pada dataset penulis, XLM-R large dengan skor F1
sebesar 0,9295, XLM-R base dengan skor F1 sebesar 0,9281 dan Indonesian RoBERTa
dengan skor F1 sebesar 0,9246.
Kata kunci:
Putusan pengadilan, Named Entity Recognition, Legal Entity Recognition, deep learning
model, language mode
|
|