Call Number | T-1420 (softcopy T-1129) MAK PI-220 TR-CSUI-390 |
Collection Type | Tesis |
Title | Implementasi Pretrained Language Mobil Tapas pada Tugas Tanya Jawab Berbasis Tabel Berbahasa Indonesia |
Author | Muhammad Rizki Syazali; |
Publisher | Depok: Fasilkom UI, 2025 |
Subject | Pretrained Language Model |
Location | FASILKOM-UI; |
Nomor Panggil | ID Koleksi | Status |
---|---|---|
T-1420 (softcopy T-1129) MAK PI-220 TR-CSUI-390 | TERSEDIA |
Nama : Muhammad Rizki Syazali Program Studi : Magister Ilmu Komputer Judul : Implementasi Pretrained Language Model TAPAS pada Tugas Tanya Jawab Berbasis Tabel Berbahasa Indonesia Pembimbing : Evi Yulianti, M.Comp.Sc, M.Kom., Ph.D. Pertumbuhan data digital yang eksponensial dalam beberapa tahun terakhir telah membuat kebutuhan akan pencarian informasi yang efisien menjadi lebih penting dari sebelumnya. Sistem Tanya Jawab (Question Answering System) telah diidentifikasi sebagai solusi yang tepat untuk memberikan jawaban yang cepat dan akurat terhadap pertanyaan pengguna yang diekspresikan dalam bahasa alami. Penelitian terbaru telah mengeksplorasi pemanfaatan data semi-terstruktur, seperti tabel, sebagai sumber data untuk QA. Tabel menyajikan informasi secara terstruktur dan sering dianggap lebih kredibel, namun pencarian manual dalam tabel yang kompleks dapat memakan waktu lama, terutama untuk pertanyaan yang memerlukan penalaran atau operasi agregasi. Namun, penelitian tentang QA berbasis tabel di luar bahasa Inggris masih sangat terbatas. Penelitian ini bertujuan mengembangkan sistem QA berbasis tabel berbahasa Indonesia, menggunakan model T!P!” (Table Parser), serta membangun dataset QA berbasis tabel berbahasa Indonesia. Model T!P!” dipilih karena performanya yang kompetitif. Kami melakukan pretraining model T!P!” menggunakan dataset Wikipedia bahasa Indonesia yang terdiri dari 1.636.656 pasangan teks dan tabel, yang kami sebut I#$%T!P!”. Hasil eksperimen menunjukkan bahwa performa I#$%T!P!” lebih unggul dibandingkan model baseline dalam menyelesaikan tugas QA berbasis tabel berbahasa Indonesia. Dengan nilai skor Exact Match sebesar 37,251%, I#$%T!P!” memiliki tingkat keberhasilan yang hampir dua kali lipat lebih tinggi daripada model baseline yang hanya mencapai 19,120%. Penelitian ini merupakan pionir dalam pengembangan sistem QA berbasis tabel berbahasa Indonesia, membuka jalan bagi pengembangan lebih lanjut di bidang ini.