Wat is OCR? Een eenvoudige uitleg

OCR in één zin

OCR, optische tekenherkenning, is de technologie die de tekst in een afbeelding leest en omzet in tekst die u kunt bewerken, kopiëren en doorzoeken. Het is wat een afbeelding naar tekst converter zoals ocrX in staat stelt een foto van een pagina te nemen en u de echte woorden terug te geven.

Welk probleem lost het op?

Een foto of scan van tekst is voor een computer slechts gekleurde stippen. Het kan een B niet van een 8 onderscheiden. OCR kijkt naar die stippen, herkent de vormen als letters en cijfers en schrijft ze uit als echte tekst. Dat is het verschil tussen een afbeelding van een pagina en een document waarmee u kunt werken.

Hoe het ongeveer werkt

U heeft de details niet nodig om het te gebruiken, maar de kern is eenvoudig. De software vindt de gebieden die tekst bevatten, scheidt de regels en tekens en vergelijkt elke vorm met wat het weet over letters in een bepaalde taal. Moderne OCR gebruikt machine learning, waardoor het verschillende lettertypen, handschrift en vele talen veel beter verwerkt dan oudere tools deden.

Waar u het al heeft gezien

  • Uw telefoon die een telefoonnummer uit een foto haalt.
  • Een scanner die een doorzoekbare PDF maakt.
  • Een bank-app die een cheque leest.
  • Een vertaal-app die een buitenlandse menukaart via de camera leest.

Waar OCR goed en niet zo goed in is

Het is uitstekend met duidelijke gedrukte tekst en goed met net handschrift. Het worstelt met vervaging, weinig licht, drukke achtergronden en rommelig of cursief schrift. Hoe schoner de afbeelding, hoe beter het resultaat, elke keer.

Probeer het zelf

De makkelijkste manier om OCR te begrijpen is door het te gebruiken. Upload een foto van tekst naar ocrX, kies de taal en zie hoe een platte afbeelding woorden wordt die u kunt kopiëren.

Probeer ocrX

Plaats een foto of scan en haal de tekst er in seconden uit. Gratis, meer dan 100 talen, geen registratie.

Afbeelding naar Tekst Converter

Meer van de blog