Vad är OCR? En guide på ren svenska

OCR i en mening

OCR, förkortning för optical character recognition (optisk teckenigenkänning), är tekniken som läser texten i en bild och omvandlar den till text du kan redigera, kopiera och söka i. Det är vad som låter en bild till text-omvandlare som ocrX ta ett foto av en sida och lämna tillbaka de faktiska orden.

Vilket problem löser det?

Ett foto eller en skanning av text är bara färgade punkter för en dator. Den kan inte skilja ett B från en 8. OCR tittar på dessa punkter, känner igen formerna som bokstäver och siffror och skriver ut dem som riktig text. Det är skillnaden mellan en bild av en sida och ett dokument du kan arbeta med.

Hur det fungerar, grovt

Du behöver inte detaljerna för att använda det, men grundidén är enkel. Programvaran hittar områdena som innehåller text, separerar raderna och tecknen och matchar varje form mot vad den vet om bokstäver på ett givet språk. Modern OCR använder maskininlärning, vilket är varför den hanterar olika typsnitt, handskrift och många språk mycket bättre än äldre verktyg gjorde.

Var du redan har sett det

  • Din telefon som hämtar ett telefonnummer ur ett foto.
  • En skanner som gör en sökbar PDF.
  • En bankapp som läser en check.
  • En översättningsapp som läser en utländsk meny genom kameran.

Vad OCR är bra och mindre bra på

Den är utmärkt med tydlig tryckt text och bra med prydlig handskrift. Den kämpar med suddighet, svagt ljus, röriga bakgrunder och slarvig eller kursiv skrift. Ju renare bild, desto bättre resultat, varje gång.

Prova själv

Det enklaste sättet att förstå OCR är att använda det. Ladda upp ett foto av valfri text till ocrX, välj språket och se en platt bild bli ord du kan kopiera.

Prova ocrX

Släng in ett foto eller en skanning och få ut texten på några sekunder. Gratis, över 100 språk, ingen registrering.

Bild till text-omvandlare

Mer från bloggen