Què és l'OCR? Una Guia en Català Clar
L'OCR en una frase
L'OCR, abreviatura d'optical character recognition (reconeixement òptic de caràcters), és la tecnologia que llegeix el text d'una imatge i el converteix en text que pots editar, copiar i cercar. És el que permet a un conversor d'imatge a text com ocrX agafar una foto d'una pàgina i retornar-te les paraules reals.
Quin problema soluciona?
Una foto o escaneig de text són només punts de color per a un ordinador. No pot distingir una B d'un 8. L'OCR mira aquests punts, reconeix les formes com a lletres i números, i les escriu com a text real. Aquesta és la diferència entre una imatge d'una pàgina i un document amb què pots treballar.
Com funciona, a grans trets
No necessites els detalls per utilitzar-lo, però la idea és simple. El programari troba les àrees que contenen text, separa les línies i caràcters, i fa coincidir cada forma amb el que sap sobre lletres en un idioma determinat. L'OCR modern utilitza aprenentatge automàtic, per això gestiona diferents fonts, escriptura manual i molts idiomes molt millor que les eines antigues.
On l'has vist ja
- El teu mòbil capturant un número de telèfon d'una foto.
- Un escàner fent un PDF que pots cercar.
- Una aplicació bancària llegint un xec.
- Una aplicació de traducció llegint un menú estranger a través de la càmera.
En què l'OCR és bo i no tan bo
És excel·lent amb text imprès clar i bo amb escriptura manual neta. Lluita amb el desenfocament, la poca llum, els fons ocupats i l'escriptura desordenada o cursiva. Com més neta sigui la imatge, millor serà el resultat, sempre.
Prova-ho tu mateix
La manera més fàcil d'entendre l'OCR és utilitzar-lo. Puja una foto de qualsevol text a ocrX, tria l'idioma i mira com una imatge plana es converteix en paraules que pots copiar.
