Cos'è l'OCR? Una Guida in Termini Semplici
OCR in una frase
OCR, acronimo di optical character recognition (riconoscimento ottico dei caratteri), è la tecnologia che legge il testo in un'immagine e lo trasforma in testo modificabile, copiabile e ricercabile. È ciò che permette a un convertitore da immagine a testo come ocrX di prendere una foto di una pagina e restituirti le parole reali.
Che problema risolve?
Una foto o scansione di testo è solo punti colorati per un computer. Non riesce a distinguere una B da un 8. L'OCR guarda quei punti, riconosce le forme come lettere e numeri e le scrive come testo reale. Questa è la differenza tra un'immagine di una pagina e un documento con cui puoi lavorare.
Come funziona, in parole povere
Non hai bisogno dei dettagli per usarlo, ma l'essenza è semplice. Il software trova le aree che contengono testo, separa le righe e i caratteri e abbina ogni forma a ciò che sa sulle lettere in una data lingua. L'OCR moderno usa l'apprendimento automatico, motivo per cui gestisce caratteri diversi, scrittura a mano e molte lingue molto meglio degli strumenti più vecchi.
Dove lo hai già visto
- Il tuo telefono che cattura un numero di telefono da una foto.
- Uno scanner che crea un PDF ricercabile.
- Un'app bancaria che legge un assegno.
- Un'app di traduzione che legge un menu straniero attraverso la fotocamera.
Cosa fa bene l'OCR e cosa meno
È eccellente con testo stampato chiaro e buono con scrittura a mano ordinata. Ha difficoltà con sfocatura, scarsa illuminazione, sfondi affollati e scrittura disordinata o corsiva. Più l'immagine è pulita, migliore è il risultato, ogni volta.
Provalo tu stesso
Il modo più semplice per capire l'OCR è usarlo. Carica una foto di qualsiasi testo su ocrX, scegli la lingua e guarda un'immagine fissa diventare parole che puoi copiare.
