ABSTRAK
ABSTRAK
Nama Penulis 1 / Program Studi : Jeremy Victor Andre Napitupulu / Ilmu Komputer
Nama Penulis 2 / Program Studi : Mirsa Salsabila / Ilmu Komputer
Judul : Perbandingan Metode Grammatical Error Correction antara T5 dan GECToR
Pembimbing : Dr. Ika Alfina, S.Kom., M.Kom.
Arlisa Yuliawati, S.Kom., M.Kom.
Grammatical Error Correction (GEC) adalah salah satu task Natural Language
Processing (NLP) yang mendeteksi dan mengoreksi kesalahan tata bahasa dalam sebuah
teks. Task ini terus berkembang sampai saat ini dan telah diterapkan menggunakan
berbagai metode, seperti rule-based, machine learning-based, dan sebagainya. Tugas
akhir ini bertujuan membandingkan dua metode state-of-the-art Grammatical Error
Correction yaitu metode T5 dan GECToR menggunakan dataset bahasa Inggris dan
bahasa Indonesia. Untuk metode T5, akan dibandingkan model Flan-T5 dan mT5 dengan
variasi ukuran base dan large. Adapun model yang dibandingkan untuk metode GECToR
adalah model RoBERTa dan XLNet dengan variasi ukuran base dan large. Untuk dataset
bahasa Inggris, akan digunakan dataset FCE untuk training dan dataset CoNLL-14 untuk
testing. Sedangkan untuk dataset bahasa Indonesia, akan digunakan dataset Gramatika.
Kemudian, untuk evaluasi digunakan metrik F0.5. Berdasarkan hasil uji coba, didapatkan
bahwa untuk dataset bahasa Inggris FCE+CoNLL-14, metode T5 dengan varian model
Flan-T5 unggul dari kedua varian metode GECToR dengan skor F0.5 sebesar 52,85%.
Varian Flan-T5 ini unggul dengan margin sebesar 15,83% dari varian terbaik metode
GECToR, yaitu RoBERTa. Sedangkan, metode GECToR dengan varian RoBERTa
lebih unggul dengan margin 10,12% dari metode T5 dengan varian model mT5. Untuk
dataset bahasa Indonesia Gramatika, kedua varian metode T5 lebih unggul dari metode
GECToR. Varian terbaik metode T5 dengan skor F0.5 sebesar 45,38% dengan margin
31,05% dari varian terbaik metode GECToR, yaitu RoBERTa.
Kata kunci:
Grammatical Error Correction, Natural Language Processing, transfer learning, Finetune, T5, GECToR
|