Library Automation and Digital Archive
LONTAR
Fakultas Ilmu Komputer
Universitas Indonesia

Pencarian Sederhana

Find Similar Add to Favorite

Call Number SK-2517 (Softcopy SK-1999)
Collection Type Skripsi
Title An End-to-End Framework for Indonesian Legal Entailment:A Comparative Study of Retrieval Models and Long-Context Encoder Models
Author Andi Muhamad Dzaky Raihan / Azhra Yashna Azka;
Publisher Depok: Fasilkom UI, 2025
Subject Legal Textual Entailment
Location FASILKOM-UI;
Lokasi : Perpustakaan Fakultas Ilmu Komputer
Nomor Panggil ID Koleksi Status
SK-2517 (Softcopy SK-1999) TERSEDIA
Tidak ada review pada koleksi ini: 56068
ABSTRAK

Nama Penulis 1 / Program Studi : Andi Muhamad Dzaky Raihan / Computer Science Nama Penulis 2 / Program Studi : Azhra Yashna Azka / Computer Science Judul : An End-to-End Framework for Indonesian Legal Entailment: A Comparative Study of Retrieval Models and Long- Context Encoder Models Pembimbing : Adila Alfa Krisnadhi, S.Kom., M.Sc., Ph.D. Alfan Farizki Wicaksono, S.T., M.Sc., Ph.D. Meningkatnya volume dan kompleksitas informasi hukum dalam sistem berbasis perundang-undangan seperti di Indonesia menghadirkan tantangan signifikan terhadap analisis yang efisien. Tesis ini menjawab tantangan tersebut dengan mengembangkan dan mengevaluasi sebuah kerangka kerja end-to-end untuk entailmen tekstual hukum Indonesia. Studi ini secara sistematis menyelidiki interaksi krusial antara Information Retrieval (IR) di tingkat hulu dan penalaran konteks panjang di tingkat hilir, dengan menggunakan model encoder-only yang hemat sumber daya. Secara metodologis, penelitian ini melakukan analisis komparatif antara retrieval renggang (BM25) versus retrieval padat (dense), berbagai strategi pemenggalan dokumen (chunking), dan dampak dari re-ranking. Untuk tugas entailmen, penelitian ini membandingkan arsitektur konteks panjang natif (mGTE) dengan model konteks standar (mDeBERTaV3) yang diperkuat dengan teknik sliding window dan agregasi yang canggih. Salah satu temuan utama mengungkapkan adanya trade-off krusial antara retrieval dan penalaran: meskipun dokumen utuh optimal untuk retrieval, potongan-potongan dokumen yang tersegmentasi (chunks) lebih unggul untuk tugas entailmen di tingkat hilir karena adanya dilusi informasi. Studi ini lebih lanjut menunjukkan bahwa model konteks panjang natif menawarkan reliabilitas (Spesifisitas) yang jauh lebih tinggi pada dokumen panjang, meskipun dengan mengorbankan throughput komputasi. Lebih lanjut lagi, Continued Pre-Training (CPT) pada korpus hukum muncul sebagai pedang bermata dua: meningkatkan kinerja pada tugas-tugas definisional, namun menurunkan kemampuan penalaran abstrak yang diperlukan untuk entailmen berbasis skenario. Evaluasi end-to-end akhir mengonfirmasi bahwa sebuah pipeline khusus, yang memasangkan dense retriever dengan vanilla encoder menggunakan atensi yang dipandu pertanyaan (question-guided attention), dapat mencapai peningkatan yang signifikan secara statistik melebihi baseline LLM decoder-only yang kuat. Kontribusi utama dari penelitian ini adalah sebuah kerangka kerja trade-off yang berbasis empiris, yang dapat memandu para praktisi dalam merancang sistem AI hukum yang efektif. Tesis ini menyimpulkan bahwa desain sistem yang optimal memerlukan pilihan yang bernuansa berdasarkan tuntutan spesifik dari sisi arsitektural, komputasional, dan penalaran dari tugas hukum yang dihadapi.