Menulis dengan LaTeX: Optical Character Recognition (OCR) #1

Pernahkah Anda menemukan suatu dokumen teks dalam bentuk gambar (image)? Padahal tulisan yang sedang Anda buat merujuk pada dokumen tersebut. Perhatikan contoh berikut ini.

Anda ingin "mengambil" teks dari dokumen gambar di atas. Apa yang Anda lakukan? Mengetikkan ulang teks itu secara manual? Melelahkan, bukan?

Sekarang tidak lagi, karena Anda dapat menggunakan optical character recognition (OCR). OCR adalah pengubah mekanik atau elektronik dari gambar teks yang diketik atau dicetak ke dalam mesin-pengkode teks.

Sifat dari teknologi ini adalah untuk menyederhanakan entri dokumen agar dapat diproses lebih lanjut. Tujuannya adalah untuk memiliki versi digital dari dokumen kertas dan menghindari entri karakter secara manual.

Saat ini, perusahaan-perusahaan induk sudah mengintegrasikan teknologi ini ke dalam proses global perusahaannya, dari penagihan (billing) menjadi dokumen arsip.

Gambar di atas menunjukkan proses:

Pemindaian (scan) atau pemotongan (capture) dokumen: suatu pemindai (scanner) atau kamera memotong dokumen kertas tersebut.
Mesin OCR memindahkan (ekstrak) teks dari gambar.
Teks yang telah dikenali itu dikirim untuk diproses.

OCR tidaklah sempurna, karena memiliki keterbatasan atas beberapa faktor yang mengubah kualitas pengenalan/rekognisinya:

Resolusi: file beresolusi tinggi memberikan hasil terbaik karena lebih rinci dalam membantu pengenalan
Orientasi: Kebanyakan mesin hanya mengenali dokumen dengan teks kiri-ke-kanan secara horisontal.
Bahasa, jenis huruf: jenis huruf yang umum berhasil lebih baik. Jenis huruf tulisan tangan dan modus matematika cenderung tidak dikenali dengan baik. Bahasa juga menentukan himpunan karakter yang dapat dikenali, beberapa karakter bersifat khas untuk suatu bahasa.
Kualitas gambar: gambar yang tajam dengan pencahayaan yang baik dan kontras yang jelas akan memberikan hasil terbaik. Gambar yang buram akan mengurangi kualitas pengenalan.

Teknologi OCR membandingkan pola-pola yang dikenali pada gambar dengan pola tersebut pada jenis-jenis huruf. Jadi seolah-olah semakin banyak jenis huruf yang dikenali dengan baik saat ini, maka masih ada beberapa jenis huruf atau orientasi teks yang sangat mungkin tidak dikenali.
Rata-rata kinerja pengenalan karakter saat ini adalah sekitar 95%.

Selain penggunaan oleh perusahaan, seperti digitalisasi dokumen untuk arsip, OCR juga digunakan dalam pelayanan publik.

Pemindaian kartu identitas dan paspor
Pemindaian plat mobil untuk perparkiran
Pembaca dokumen untuk penyandang cacat

Sejak tahun 2000 dan melonjaknya pengguna ponsel, teknologi OCR juga merambah perangkat mobile. Kita dapat menemukan OCR dalam banyak aplikasi: Business Card Reader, Document Reader, dan Camera Translator.

Ponsel pintar sekarang berada di saku semua orang, OCR menyederhanakan entri teks. Sekarang Anda dapat memasukkan info kontak langsung ke ponsel Anda hanya dengan mengambil gambar dari kartu kontak (business card). Anda dapat menerjemahkan menu atau tanda-tanda ketika Anda sedang bepergian. Anda dapat memindai dokumen dan mengintegrasikannya ke dalam pengolahan data perusahaan saat Anda bepergian tanpa komputer.

Demikian dulu untuk bagian pertama ini. Tulisan "pengantar" ini merujuk pada dua situs, yaitu Wikipedia dan XMSCAN.

Semoga bermanfaat.

Adjie Gumarang Pujakelana 2015

Pages

Sunday, April 5, 2015

Optical Character Recognition (OCR) #1

No comments:

Followers

Feedjit