Senin, 20 April 2020

CARA KERJA OCR

Apakah kamu pernah mendengar istilah OCR sebelumnya? OCR adalah kepanjangan dari Optical Character Recognition, yang merupakan teknologi yang dapat membedakan dan mengenali bentuk tulisan pada sebuah gambar.
Lho, kalau seperti sama saja seperti scanner dong? Fungsinya bisa dibilang mirip, hanya saja teknologi OCR memiliki cara kerja dan teknis yang berbeda dari sebuah scanner. Untuk mengetahui lebih jauh lagi mengenai OCR (optical character recognition) kamu harus baca artikel ini lebih lanjut.
Pada artikel ini kamu akan menjelaskan pengertian dari OCR itu sendiri, cara kerjanya, dan informasi menarik lainnya. Yuk, langsung saja kita mulai pembahasannya.

OCR adalah teknologi yang dapat mengenali tulisan dalam sebuah gambar menjadi data teks yang dapat dibaca dalam sebuah komputer. Baik itu tulisan tangan ataupun tulisan digital.
Pernahkah kamu mengalami masalah seperti berikut? Saat kamu melakukan scan sebuah dokumen dan kamu ingin melakukan pengeditan atau apapun itu, pada teks yang telah kamu scan ke dalam sebuah program pengolahan data, misal Ms.Word. Apa yang terjadi?
Kamu pasti tidak akan dapat melakukan pengeditan teks tersebut, karena cara kerja pada scanner sendiri hanya mengubah teks atau dokumen kedalam bentuk gambar yang umumnya memiliki format JPG.
Jangankan pengeditan, untuk melakukan copy paste kata-kata yang ada saja tidak mungkin bisa kamu lakukan. Berbeda halnya jika scanner kamu atau alat lain yang memiliki program Optical Character Recognition.
Kamu pasti dapat langsung melakukan perubahan pada teks dokumen yang telah discan dengan alat yang memiliki sistem atau program OCR. Mengapa demikian? Yuk, simak cara kerjanya.


Teknologi OCR (Optical Character Recognition) sudah lama kita dengar, tetapi apakah kita sudah mengetahui fungsi dan cara kerja dari software tersebut?
Seperti yang sudah kita ketahui bahwa software OCR berfungsi untuk merubah file Image/Gambar menjadi file Teks dengan format TXT. Hal ini berguna apabila kita ingin mendapatkan file teks dari sebuah surat tanpa harus mengetik ulang seluruh tulisan yang terdapat didalam surat tersebut.
Pada dasarnya setiap scanner hanya menghasilkan file gambar/image dalam format TIFF saja, setelah file gambar/image tersebut dihasilkan, file tersebut di kirim ke dalam komputer dan langsung disambut dan diproses oleh program OCR untuk diproses menjadi file teks, berikut ini saya jelaskan susunan cara kerja software OCR tersebut:
1. Meratakan gambar (Auto Deskewing)
File image (gambar) akan diatur kemiringannya, apabila hasil scan ada kemiringan, maka gambar akan dibuat sejajar atau lurus.



2. Menganalisa (Analysis)
Software (program) OCR akan menganalisa dan memisahkan bagian teks dan bagian gambar.



3. Otomatis mengatur arah gambar (Auto Orientation)
Software (program) OCR akan mengambil sebagian area pada file image (gambar) dan mengidentifikasi arah teks yang benar. File image (gambar) akan diputar ke arah yang benar, pilihannya adalah 90°, 180°, atau 270°.



4. Memisahkan setiap karakter huruf dan angka (Separating single character)
Software (program) OCR akan memisahkan setiap karakter yang terdapat pada image (gambar) menjadi sebuah huruf atau angka.



5. Mengidentifikasi gambar (Capturing the features of the characters and comparing)
Software (program) OCR akan mengidentifikasi satu persatu setiap gambar yang sudah dipisahkan, dan melakukan pengecekan terhadap database yang dimiliki oleh software (program) OCR, dan menetapkan huruf atau angka yang akan digunakan.



6. Menghasilkan file akhir (Recognition result output)
Setelah setiap image (gambar) sudah dirubah menjadi huruf atau angka (format teks) maka software (program) OCR akan menghasilkan sebuah file dengan format teks, seperti Microsoft Word, Microsoft Excel, TXT, Rich Text dan Searchable PDF, tergantung dari pengaturan awal.



Catatan:
Untuk menghasilkan sebuah proses OCR yang sempurna, gunakan resolusi scan 300dpi, dengan format warna Grayscale.

Ada juga kebutuhkan untuk mengkonversi buku menjadi “buku digital” sehingga kita tidak perlu repot-repot membawa buku lagi, semua buku kita sudah terdapat didalam komputer kita.
Kesimpulannya adalah Software OCR berfungsi untuk merubah data gambar/image menjadi teks, hal ini membantu kita untuk mendapatkan data teks secara cepat dari sebuah surat/dokumen.
Semoga bermanfaat!