Tornar a tots els articles12 d’abril del 2026

Què és l'OCR? Una Guia en Català Clar

L'OCR en una frase

L'OCR, abreviatura d'optical character recognition (reconeixement òptic de caràcters), és la tecnologia que llegeix el text d'una imatge i el converteix en text que pots editar, copiar i cercar. És el que permet a un conversor d'imatge a text com ocrX agafar una foto d'una pàgina i retornar-te les paraules reals.

Quin problema soluciona?

Una foto o escaneig de text són només punts de color per a un ordinador. No pot distingir una B d'un 8. L'OCR mira aquests punts, reconeix les formes com a lletres i números, i les escriu com a text real. Aquesta és la diferència entre una imatge d'una pàgina i un document amb què pots treballar.

Com funciona, a grans trets

No necessites els detalls per utilitzar-lo, però la idea és simple. El programari troba les àrees que contenen text, separa les línies i caràcters, i fa coincidir cada forma amb el que sap sobre lletres en un idioma determinat. L'OCR modern utilitza aprenentatge automàtic, per això gestiona diferents fonts, escriptura manual i molts idiomes molt millor que les eines antigues.

On l'has vist ja

  • El teu mòbil capturant un número de telèfon d'una foto.
  • Un escàner fent un PDF que pots cercar.
  • Una aplicació bancària llegint un xec.
  • Una aplicació de traducció llegint un menú estranger a través de la càmera.

En què l'OCR és bo i no tan bo

És excel·lent amb text imprès clar i bo amb escriptura manual neta. Lluita amb el desenfocament, la poca llum, els fons ocupats i l'escriptura desordenada o cursiva. Com més neta sigui la imatge, millor serà el resultat, sempre.

Prova-ho tu mateix

La manera més fàcil d'entendre l'OCR és utilitzar-lo. Puja una foto de qualsevol text a ocrX, tria l'idioma i mira com una imatge plana es converteix en paraules que pots copiar.

Prova ocrX

Deixa anar una foto o un escaneig i extreu el text en segons. Gratuït, més de 100 idiomes, sense registre.

Conversor d'Imatge a Text

Més del blog