Wat is OCR? Een eenvoudige uitleg
OCR in één zin
OCR, optische tekenherkenning, is de technologie die de tekst in een afbeelding leest en omzet in tekst die u kunt bewerken, kopiëren en doorzoeken. Het is wat een afbeelding naar tekst converter zoals ocrX in staat stelt een foto van een pagina te nemen en u de echte woorden terug te geven.
Welk probleem lost het op?
Een foto of scan van tekst is voor een computer slechts gekleurde stippen. Het kan een B niet van een 8 onderscheiden. OCR kijkt naar die stippen, herkent de vormen als letters en cijfers en schrijft ze uit als echte tekst. Dat is het verschil tussen een afbeelding van een pagina en een document waarmee u kunt werken.
Hoe het ongeveer werkt
U heeft de details niet nodig om het te gebruiken, maar de kern is eenvoudig. De software vindt de gebieden die tekst bevatten, scheidt de regels en tekens en vergelijkt elke vorm met wat het weet over letters in een bepaalde taal. Moderne OCR gebruikt machine learning, waardoor het verschillende lettertypen, handschrift en vele talen veel beter verwerkt dan oudere tools deden.
Waar u het al heeft gezien
- Uw telefoon die een telefoonnummer uit een foto haalt.
- Een scanner die een doorzoekbare PDF maakt.
- Een bank-app die een cheque leest.
- Een vertaal-app die een buitenlandse menukaart via de camera leest.
Waar OCR goed en niet zo goed in is
Het is uitstekend met duidelijke gedrukte tekst en goed met net handschrift. Het worstelt met vervaging, weinig licht, drukke achtergronden en rommelig of cursief schrift. Hoe schoner de afbeelding, hoe beter het resultaat, elke keer.
Probeer het zelf
De makkelijkste manier om OCR te begrijpen is door het te gebruiken. Upload een foto van tekst naar ocrX, kies de taal en zie hoe een platte afbeelding woorden wordt die u kunt kopiëren.
