ABSTRAK Nama : Muhammad Izzunnaqi Program Studi : Ilmu Komputer Judul : Pengembangan Awal Dataset Kesalahan Penulisan Ilmiah Bahasa Indonesia Kesalahan penulisan yang terjadi pada suatu tulisan ilmiah dapat mengurangi kualitas dari tulisan ilmiah tersebut. Suatu aplikasi proofreading dapat membantu menangani hal tersebut. Namun, aplikasi proofreading yang dapat digunakan pada bahasaIndonesiamasihsangatsedikitsehinggaperludilakukanpengembanganterhadap aplikasi tersebut. Sebuah data dalam jumlah yang besar mengenai kesalahan penulisan dapat membantu pengembangan aplikasi proofreading dengan pendekatanstatistikuntukmenemukankesalahanyangterjadidanmemberikansugesti koreksi. Saat ini, belum ada korpus atau dataset mengenai kesalahan penulisan ilmiah untuk bahasa Indonesia yang sudah dikembangkan. Penelitian ini bertujuan untukmenghasilkansuatudataset kesalahanpenulisanilmiahbahasaIndonesiadengan metode penyesuaian (alignment) dokumen laporan ilmiah sebelum dan sesudah revisi secara otomatis. Pasa akhir penelitian diperoleh sekitar 300 pasang data traininguntukdigunakansebagaimodeldalamklasifikasijeniskesalahanpenulisan dan juga dapat digunakan membantu pengembangan aplikasi proofreading. Kata Kunci: Kesalahan penulisan, proofread, dataset, penyesuaian dokumen, laporan ilmiah, Bahasa Indonesia