Apa Itu OCR? Panduan Bahasa Melayu Mudah
OCR dalam satu ayat
OCR, singkatan untuk pengecaman aksara optik, ialah teknologi yang membaca teks dalam gambar dan menukarnya menjadi teks yang boleh anda edit, salin, dan cari. Ia membolehkan penukar imej ke teks seperti ocrX mengambil foto halaman dan mengembalikan perkataan sebenar kepada anda.
Apa masalah yang diselesaikannya?
Foto atau imbasan teks hanyalah titik berwarna kepada komputer. Ia tidak boleh membezakan B daripada 8. OCR melihat titik-titik itu, mengecam bentuk sebagai huruf dan nombor, dan menulisnya sebagai teks sebenar. Itulah perbezaan antara gambar halaman dan dokumen yang boleh anda gunakan.
Bagaimana ia berfungsi, secara ringkas
Anda tidak perlu tahu butiran untuk menggunakannya, tetapi intinya mudah. Perisian mencari kawasan yang mengandungi teks, memisahkan baris dan aksara, dan memadankan setiap bentuk dengan apa yang ia tahu tentang huruf dalam bahasa tertentu. OCR moden menggunakan pembelajaran mesin, sebab itu ia mengendalikan fon yang berbeza, tulisan tangan, dan banyak bahasa jauh lebih baik daripada alat lama.
Di mana anda telah melihatnya
- Telefon anda mengambil nombor telefon dari foto.
- Pengimbas membuat PDF yang boleh dicari.
- Apl perbankan membaca cek.
- Apl terjemahan membaca menu asing melalui kamera.
Apa OCR bagus dan tidak begitu bagus
Ia cemerlang dengan teks cetakan yang jelas dan baik dengan tulisan tangan yang kemas. Ia sukar dengan kabur, cahaya malap, latar belakang sibuk, dan tulisan bersambung atau tidak kemas. Lebih bersih imej, lebih baik hasilnya, setiap masa.
Cubalah sendiri
Cara paling mudah untuk memahami OCR adalah dengan menggunakannya. Muat naik foto mana-mana teks ke ocrX, pilih bahasa, dan saksikan imej rata menjadi perkataan yang boleh anda salin.
