UMKLAUMKLA

JKTI Jurnal Keilmuan Teknologi InformasiJKTI Jurnal Keilmuan Teknologi Informasi

Proses input data dari Kartu Tanda Mahasiswa (KTM) yang dilakukan secara manual seringkali tidak efisien dan rentan terhadap kesalahan. Oleh karena itu, otomatisasi proses ini menjadi solusi penting untuk meningkatkan akurasi dan kecepatan. Penelitian ini bertujuan untuk merancang dan mengimplementasikan sistem Optical Character Recognition (OCR) untuk mengekstraksi informasi dari gambar KTM Universitas Muhammadiyah Klaten (UMKLA) secara otomatis. Metodologi yang digunakan meliputi pra-pemrosesan citra menggunakan pustaka OpenCV untuk meningkatkan kualitas gambar melalui konversi grayscale dan binarisasi Otsu. Selanjutnya, Tesseract OCR Engine digunakan untuk mengubah citra menjadi teks mentah, yang kemudian diurai (parsing) menggunakan Regular Expressions (Regex) untuk memisahkan field data seperti Nama, NIM, dan Program Studi. Hasil pengujian menunjukkan sistem mampu mengekstrak informasi dengan tingkat keberhasilan yang baik, meskipun akurasi sangat dipengaruhi oleh kualitas gambar, seperti pencahayaan dan kejelasan teks. Field dengan format cetak standar terbukti memiliki akurasi lebih tinggi. Kesimpulannya, sistem berbasis Tesseract ini berhasil membuktikan kelayakannya untuk otomatisasi data KTM secara lokal, namun diperlukan pengembangan lebih lanjut pada tahap pasca-pemrosesan untuk menangani variasi hasil OCR yang lebih kompleks.

Penelitian berhasil mengimplementasikan sistem OCR berbasis Tesseract dengan OpenCV dan Python, menghasilkan akurasi tinggi dalam ekstraksi data kartu mahasiswa.Namun, terdapat kesalahan substitusi karakter pada data numerik, menunjukkan sensitivitas Tesseract terhadap variasi kecil karakter.Oleh karena itu, diperlukan pengembangan pasca‑pemrosesan yang lebih cerdas untuk memperbaiki kesalahan tersebut.

Penelitian lanjutan dapat menyelidiki bagaimana penerapan teknik pembelajaran mesin berbasis deep learning, seperti model transformer atau LSTM, dapat meningkatkan akurasi pengenalan karakter pada gambar KTM dengan kualitas rendah, sehingga sistem menjadi lebih robust terhadap variasi pencahayaan dan noise. Selanjutnya, penting untuk mengembangkan algoritma pasca‑pemrosesan yang memanfaatkan pendekatan koreksi berbasis Hamming Distance atau Named Entity Recognition untuk secara otomatis memperbaiki kesalahan substitusi angka maupun teks, khususnya pada data numerik kritis seperti tahun lahir. Terakhir, penelitian dapat mengevaluasi integrasi sistem OCR ini ke dalam platform manajemen data kampus berbasis cloud, dengan menilai dampak penerapan terhadap efisiensi proses administrasi, keamanan data, dan kepuasan pengguna serta mengidentifikasi tantangan implementasi skala besar.

  1. #program studi sistem#program studi sistem
  2. #integrasi sistem manajemen#integrasi sistem manajemen
Read online
File size378.92 KB
Pages4
DMCAReport

Related /

ads-block-test