Mediawana.com - Optical character recognition (OCR) adalah proses konversi gambar huruf menjadi karakter ASCII yang dikenali oleh komputer. Artinya adalah Gambar huruf yang dimaksud dapat berupa hasil scan dari dokumen, hasil print-screen halaman web, hasil foto, dan lain-lain.
Dengan kata lain, Optical Character Recognition atau OCR digunakan untuk mengubah hasil pemindahan dengan scanner dari gambar menjadi data yang dapat diedit.
Pengertian Optical character recognition (OCR)
Salah satu kebutuhan mengapa perlu konversi gambar huruf menjadi karakter ASCII adalah karakter ASCII memiliki kapasitas penyimpanan yang lebih kecil.
Contohnya, suatu paragraf di-printscreen dan disimpan dalam format png. Paragraf tersebut juga di-copy dan disimpan dalam format .txt. Untuk file gambar, memiliki size 42KB, sedangkan untuk file teks, memiliki size 1KB. Dari sini bisa terlihat bahwa file gambar akan selalu relatif lebih besar ketimbang menyimpan langsung teks ASCII-nya saja.
Fungsi dan Cara Kerja Optical Character Recognition (OCR)
Fungsi dari Character Recognition ini bertugas untuk mengenali tulisan didalam mengenali karakter tulisan dalam gambar dan merubahnya kedalam American Standad Code for Information Interchange (ASCII) atau bahasa mesin lainnya yang setara dan dapat diedit. Terdapat dua macam Character Recognition, antara lain: Offline dan Online Character Recognition
Character recognition juga diklasifikasikan kedalam dua tipe berdasarkan metode tulisannya, apa saja? Yaitu. Optical Character Recognition (OCR) dan Handwritten Character Recognition (HCR).
Dimana akurasi pada HCR biasanya masih lebih rendah dikarnakan besarnya perbedaan bentuk dan tipe tulisan. Perbedaan karakter dalam Bahasa juga berpengaruh besar, contohnya: tulisan kanji mandarin, jepang, dan lainnya.
Kesimpulan
Kesimpulannya adalah bahwa untuk OCR dengan karakter yang tercetak, akurasi
sudah baik. Yang perlu dikembangkan lagi adalah karakter tulis tangan (HCR).
Untuk meningkatkan akurasinya, bisa dilakukan metode preprocessing pada
gambar, atau menggunakan fitur lainnya. Bisa juga menggabungkan beberapa
fitur atau metode sekaligus menggunakan teknik ensemble.
Teknik ensemble atau metode ansamble adalah algoritma dalam pembelajaran mesin (machine learning) dimana algoritma ini sebagai pencarian solusi prediksi terbaik dibandingkan dengan algoritma yang lain karena metode ensemble ini menggunakan beberapa algoritma pembelajaran untuk pencapaian solusi prediksi yang lebih baik.