UBHARAUBHARA

JEECS (Journal of Electrical Engineering and Computer Sciences)JEECS (Journal of Electrical Engineering and Computer Sciences)

Transkripsi data manual dari kartu identitas Indonesia (KTP) masih umum terjadi, menyebabkan inefisiensi dan kesalahan manusia yang mengganggu akurasi data. Sementara itu, teknologi Optical Character Recognition (OCR) seperti Tesseract telah banyak diadopsi. Namun, kinerja pada gambar KTP masih tidak konsisten karena tata letak yang tidak seragam, kontras rendah, dan noise latar belakang. Penelitian ini mengusulkan kerangka kerja OCR dual-pipeline yang dirancang untuk meningkatkan akurasi pengenalan KTP Indonesia dalam kondisi dunia nyata. Pertama, pipeline melakukan segmentasi region statis berdasarkan Region of Interest (ROI) yang predefined, kemudian menggunakan heuristik keyword dinamis untuk melokalisasi teks secara adaptif di seluruh tata letak yang bervariasi. Keluaran dari kedua pipeline digabungkan melalui mekanisme post-processing berbasis voting dan regex, yang mencakup normalisasi karakter dan validasi bidang menggunakan kamus predefined. Eksperimen dilakukan pada 78 sampel KTP yang dianotasi dengan resolusi dan kualitas gambar yang beragam. Evaluasi menggunakan Character Error Rate (CER), Word Error Rate (WER), dan metrik akurasi tingkat bidang menghasilkan rata-rata CER sebesar 69,82%, WER sebesar 80,20%, dan akurasi tingkat karakter sebesar 30,18%. Meskipun kinerja moderat di area teks bebas seperti alamat atau pekerjaan, bidang terstruktur mencapai akurasi di atas 60%. Metode ini berjalan efisien dalam lingkungan CPU-only tanpa memerlukan dataset yang besar, menunjukkan kesesuaiannya dengan pendekatan single-pipeline konvensional, kerangka kerja dual-pipeline yang diusulkan meningkatkan ketahanan di seluruh tata letak dokumen yang heterogen dan kondisi pencahayaan. Temuan ini menunjukkan potensi sistem OCR berbasis aturan ringan untuk digitalisasi e-KYC praktis dan membentuk fondasi untuk mengintegrasikan deteksi tata letak berbasis deep learning dalam penelitian masa depan.

Penelitian ini mengusulkan kerangka kerja OCR dual-pipeline untuk kartu identitas Indonesia (KTP), yang menggabungkan Tesseract OCR dengan segmentasi ROI berbasis struktur, ekstraksi keyword dinamis, dan post-processing berbasis regex.Arsitektur ini dirancang untuk meningkatkan akurasi pengenalan di bawah kondisi pengambilan gambar yang bervariasi yang umum terjadi dalam alur kerja e-KYC.Eksperimen awal yang dilakukan pada dua sampel KTP yang dianotasi mencapai akurasi karakter rata-rata sekitar 96% dan akurasi tingkat bidang 100% pada gambar yang bersih dan berkualitas tinggi.Namun, dataset terbatas ini tidak sepenuhnya mewakili kondisi dunia nyata.Oleh karena itu, eksperimen diperluas ke 78 gambar KTP yang mencakup berbagai kualitas pengambilan gambar (blur, skew, cropped, damaged, dan kartu dengan kontras rendah).Evaluasi berskala besar ini mengungkapkan Character Error Rate (CER) secara keseluruhan sebesar 69,82%, Word Error Rate (WER) sebesar 80,20%, dan rata-rata akurasi tingkat bidang sebesar 30,18%, menunjukkan bahwa kinerja pengenalan menurun secara signifikan pada masukan yang terdegradasi.Meskipun penurunan metrik kuantitatif secara keseluruhan, evaluasi yang diperluas memberikan pemahaman yang lebih jelas tentang kekuatan dan kelemahan sistem.Bidang terstruktur seperti NIK, RT/RW, dan agama mempertahankan akurasi yang relatif lebih tinggi karena pola yang dapat diprediksi dan validasi regex.Sebaliknya, bidang teks bebas seperti nama, alamat, dan pekerjaan lebih rentan terhadap kesalahan yang disebabkan oleh blur, skew, dan cropping yang tidak lengkap.Analisis kesalahan juga menunjukkan bahwa kesalahan klasifikasi yang sering terjadi seperti O↔0, I↔1, S↔5, dan B↔8 berhasil dikurangi oleh aturan pemetaan karakter pada tahap post-processing.Dibandingkan dengan baseline Tesseract single-pipeline konvensional, pendekatan dual-pipeline yang diusulkan menunjukkan ketahanan yang lebih tinggi pada dataset berkualitas campuran dengan memanfaatkan voting dan validasi berbasis aturan untuk memulihkan bidang yang hilang atau tidak selaras.Meskipun sistem OCR berbasis deep learning mungkin mencapai akurasi yang lebih tinggi, desain hybrid berbasis aturan ini tetap menguntungkan untuk implementasi sumber daya rendah dan on-device karena biaya komputasi minimal dan interpretabilitasnya.Penelitian masa depan akan fokus pada tiga arah kunci.perluasan dataset dan kategorisasi ke dalam kelas kualitas gambar (clean, blur, skew, cropped, damaged) untuk evaluasi yang lebih seimbang.integrasi modul deep learning ringan (misalnya deteksi tata letak berbasis MobileNet atau pengelompokan baris teks yang dibantu transformer) untuk melengkapi ekstraksi berbasis aturan.dan generasi data sintetis dan augmentasi untuk mensimulasikan noise, distorsi, dan rotasi untuk generalisasi model yang kuat.

Untuk meningkatkan akurasi OCR pada kartu identitas Indonesia (KTP), penelitian selanjutnya dapat mempertimbangkan integrasi modul deep learning ringan, seperti deteksi tata letak berbasis MobileNet atau pengelompokan baris teks yang dibantu transformer, untuk melengkapi ekstraksi berbasis aturan. Selain itu, generasi data sintetis dan augmentasi dapat digunakan untuk mensimulasikan noise, distorsi, dan rotasi, sehingga meningkatkan generalisasi model. Dengan memperluas dataset dan kategorisasi ke dalam kelas kualitas gambar yang berbeda, evaluasi yang lebih seimbang dapat dilakukan, sehingga memberikan pemahaman yang lebih baik tentang kinerja sistem di berbagai kondisi. Dengan demikian, penelitian ini dapat memberikan kontribusi yang signifikan dalam meningkatkan akurasi OCR untuk KTP Indonesia, yang pada akhirnya akan meningkatkan efisiensi dan keandalan digitalisasi e-KYC.

  1. Implementation of OCR (Optical Character Recognition) Using Tesseract in Detecting Character in Quotes... doi.org/10.37385/JAETS.V4I1.905Implementation of OCR Optical Character Recognition Using Tesseract in Detecting Character in Quotes doi 10 37385 JAETS V4I1 905
  2. An impact of linguistic features on automated classification of OCR texts | Proceedings of the 9th IAPR... dl.acm.org/doi/10.1145/1815330.1815367An impact of linguistic features on automated classification of OCR texts Proceedings of the 9th IAPR dl acm doi 10 1145 1815330 1815367
Read online
File size886.95 KB
Pages9
DMCAReport

Related /

ads-block-test