Call Number | SK-2255 (Softcopy SK-1737) |
Collection Type | Skripsi |
Title | Perbandingan Metode Grammatical Correction Antara T5 dan Gector |
Author | Jeremy Victor Andre Napitupulu, Mirsa Salsabila; |
Publisher | Depok: Fakultas Ilmu Komputer UI, 2024 |
Subject | |
Location | FASILKOM-UI; |
Nomor Panggil | ID Koleksi | Status |
---|---|---|
SK-2255 (Softcopy SK-1737) | TERSEDIA |
ABSTRAK Nama Penulis 1 / Program Studi : Jeremy Victor Andre Napitupulu / Ilmu Komputer Nama Penulis 2 / Program Studi : Mirsa Salsabila / Ilmu Komputer Judul : Perbandingan Metode Grammatical Error Correction antara T5 dan GECToR Pembimbing : Dr. Ika Alfina, S.Kom., M.Kom. Arlisa Yuliawati, S.Kom., M.Kom. Grammatical Error Correction (GEC) adalah salah satu task Natural Language Processing (NLP) yang mendeteksi dan mengoreksi kesalahan tata bahasa dalam sebuah teks. Task ini terus berkembang sampai saat ini dan telah diterapkan menggunakan berbagai metode, seperti rule-based, machine learning-based, dan sebagainya. Tugas akhir ini bertujuan membandingkan dua metode state-of-the-art Grammatical Error Correction yaitu metode T5 dan GECToR menggunakan dataset bahasa Inggris dan bahasa Indonesia. Untuk metode T5, akan dibandingkan model Flan-T5 dan mT5 dengan variasi ukuran base dan large. Adapun model yang dibandingkan untuk metode GECToR adalah model RoBERTa dan XLNet dengan variasi ukuran base dan large. Untuk dataset bahasa Inggris, akan digunakan dataset FCE untuk training dan dataset CoNLL-14 untuk testing. Sedangkan untuk dataset bahasa Indonesia, akan digunakan dataset Gramatika. Kemudian, untuk evaluasi digunakan metrik F0.5. Berdasarkan hasil uji coba, didapatkan bahwa untuk dataset bahasa Inggris FCE+CoNLL-14, metode T5 dengan varian model Flan-T5 unggul dari kedua varian metode GECToR dengan skor F0.5 sebesar 52,85%. Varian Flan-T5 ini unggul dengan margin sebesar 15,83% dari varian terbaik metode GECToR, yaitu RoBERTa. Sedangkan, metode GECToR dengan varian RoBERTa lebih unggul dengan margin 10,12% dari metode T5 dengan varian model mT5. Untuk dataset bahasa Indonesia Gramatika, kedua varian metode T5 lebih unggul dari metode GECToR. Varian terbaik metode T5 dengan skor F0.5 sebesar 45,38% dengan margin 31,05% dari varian terbaik metode GECToR, yaitu RoBERTa. Kata kunci: Grammatical Error Correction, Natural Language Processing, transfer learning, Finetune, T5, GECToR