Penggunaan Kartu Tanda Penduduk (KTP) sebagai kartu identitas aplikasi sudah umum diimplementasikan, terutama pada sektor teknologi finansial (fintech) yang sudah banyak diadopsi masyarakat. Meskipun begitu, modul ekstraksi data dari KTP yang bersifat terbuka (open source) dan siap guna belum tersedia. Penelitian ini memiliki tujuan membuat modul tersebut, untuk penggunaan penelitian dan/atau membantu bisnis startup dengan memberikan opsi gratis perihal ekstrak data KTP pelanggan mereka. Penelitian ini juga dibuat dengan harapan dapat menggunakan penelitian sebelumnya sebagai pembelajaran dan referensi, dan memperbaiki kekurangan penelitian tersebut. Modul ini memiliki bentuk akhir docker image yang dapat digunakan langsung dengan utilisasi docker engine, dengan harapan proses containerisasi tersebut dapat mempermudah layanan - layanan yang menggunakan container orchestration seperti kubernetes, yang sangat umum digunakan e-commerce, untuk mengadopsi modul ini. Data dari gambar KTP akan melalui tahap preprocessing, pengenalan karakter, pengelompokan data, dan pembersihan data. Hasil eksperimen menggunakan 30 sampel KTP asli menunjukkan bahwa penggunaan masukan yang sudah tercrop lebih baik karena tingkat keberhasilan otomasi cropping hanya 43,3%. Selain itu, dari hasil bacaan pada sampel 75% berhasil terbaca dan dikelompokkan dengan tepat. Dari data yang sudah berhasil dibaca dan dikelompokan, 17% value dari data mengandung kesalahan. Dari kesalahan yang terjadi, 52.94% kesalahan berhasil dikoreksi oleh algoritma pembersihan data. Secara keseluruhan sistem berhasil membaca dengan tingkat keberhasilan 74,6% Kata Kunci : KTP, OCR, ekstraksi data, perangkat lunak