Library Automation and Digital Archive
LONTAR
Fakultas Ilmu Komputer
Universitas Indonesia

Pencarian Sederhana

Find Similar Add to Favorite

Call Number SK-2491 (Softcopy SK-1973) Source Code-885
Collection Type Skripsi
Title Sistem Optical Character Recognition untuk Naskah Pegon Tulis Tangan
Author Farizs Muzhaffar;
Publisher Depok: Fasilkom UI, 2025
Subject Text Recognition
Location FASILKOM-UI;
Lokasi : Perpustakaan Fakultas Ilmu Komputer
Nomor Panggil ID Koleksi Status
SK-2491 (Softcopy SK-1973) Source Code-885 TERSEDIA
Tidak ada review pada koleksi ini: 55971
ABSTRAK

Nama : Faris Muzhaffar Program Studi : Ilmu Komputer Judul : Sistem Optical Character Recognition untuk Naskah Pegon Tulis Tangan Pembimbing : Yova Ruldeviyani, S.Kom., M.Kom. Abjad Pegon adalah bentuk adaptasi aksara Arab untuk penulisan Bahasa Jawa, Sunda, atau Melayu. Sistem penulisan Pegon mengikuti sistem penulisan huruf-huruf Arab, ditulis secara bersambung dari kanan ke kiri, dan menggunakan diakritik seperti harakat. Seiring berjalannya waktu, penggunaan Pegon semakin jarang, dan berbagai macam media cetak maupun tulis yang menggunakan aksara Pegon pun terancam punah. Oleh karena itu, dilakukanlah penelitian ini yang bertujuan untuk merancang sistem untuk mendigitisasi naskah-naskah Pegon tulis tangan secara otomatis dengan menggunakan optical character recognition (OCR). Penelitian ini merupakan lanjutan dari penelitian sebelumnya yang merancang sistem OCR untuk teks Pegon ketik, metode dari penelitian tersebut dicoba dan dibandingkan dengan metode baru yang dicoba di penelitian ini. Untuk segmentasi baris teks, hasil penelitian ini menunjukkan bahwa metode Mask-RCNN mendapat nilai yang lebih tinggi daripada metode YOLO yang dipakai pada penelitian sebelumnya dengan F1-score sebesar 0.98. Sedangkan untuk line text recognition, performa metode CRNN-CTC yang dipakai di penelitian sebelumnya ditingkatkan dengan menggandakan hidden dimensions pada RNN dan menambah proses binarization pada gambar input. Model CRNN tersebut berhasil mendapatkan rata-rata nilai character error rate (CER) sebesar 0.2 serta median nilai CER sebesar 0.146.