ABSTRAK
Nama : Sultan Daffa Nusantara
Program Studi : Sistem Informasi
Judul : Pendekatan Rule-based Menggunakan Kamus dan Named
Entity Recognizer untuk Mendeteksi dan Mengoreksi Kesalahan Penulisan Huruf Kapital pada Teks Berbahasa Indonesia
Pembimbing : Dr. Ika Alfina, S.Kom., M.Kom.
Dipta Tanaya, S.Kom., M.Kom.
Penggunaan huruf kapital merupakan aspek penting dalam menulis bahasa Indonesia
yang baik dan benar. Aturan penggunaan huruf kapital dalam bahasa Indonesia telah
dijelaskan dalam Pedoman Umum Ejaan Bahasa Indonesia (PUEBI) yang terdiri dari
23 aturan. Penelitian sebelumnya telah memulai mengembangkan pendeteksi dan
pengoreksi kesalahan huruf kapital untuk bahasa Indonesia menggunakan pendekatan
rule-based dengan kamus dan komponen Named Entity Recognition (NER). Namun,
penelitian tersebut hanya mencakup 9 dari 23 aturan huruf kapital yang tercantum
dalam PUEBI dan dataset uji yang digunakan tidak dipublikasikan sehingga tidak dapat
digunakan untuk penelitian selanjutnya. Penelitian ini bertujuan untuk mengusulkan
metode untuk mendeteksi dan mengoreksi 14 dari 23 aturan PUEBI menggunakan
pendekatan yang mirip dengan penelitian sebelumnya. Model NER dikembangkan
menggunakan pretrained language model IndoBERT yang dilakukan fine-tuning dengan
dataset NER. Untuk menguji metode rule-based yang diusulkan, dibuat sebuah dataset
sintesis yang terdiri dari 5.000 pasang kalimat. Setiap pasang terdiri dari kalimat benar
secara aturan huruf kapital dan padanan kalimat salahnya. Kalimat salah dibuat dengan
mengubah beberapa huruf kapital di kalimat yang awalnya benar. Sebelum dilakukan
perbaikan terhadap kalimat yang salah, didapatkan akurasi sebesar 83,10%. Namun,
setelah menggunakan metode ini, tingkat akurasi meningkat 12,35% menjadi 95,45%.
Kata kunci:
bahasa Indonesia, NER, penulisan huruf kapital, rule-based
|