Was ist OCR? Ein Leitfaden in verständlichem Englisch
OCR in einem Satz
OCR, kurz für optische Zeichenerkennung, ist die Technologie, die den Text in einem Bild liest und in Text umwandelt, den Sie bearbeiten, kopieren und durchsuchen können. Es ist das, was es einem Bild-zu-Text-Konverter wie ocrX ermöglicht, ein Foto einer Seite aufzunehmen und Ihnen die tatsächlichen Wörter zurückzugeben.
Welches Problem löst es?
Ein Foto oder Scan von Text sind für einen Computer nur farbige Punkte. Er kann ein B nicht von einer 8 unterscheiden. OCR betrachtet diese Punkte, erkennt die Formen als Buchstaben und Zahlen und schreibt sie als echten Text aus. Das ist der Unterschied zwischen einem Bild einer Seite und einem Dokument, mit dem Sie arbeiten können.
Wie es grob funktioniert
Sie brauchen die Details nicht, um es zu nutzen, aber das Prinzip ist einfach. Die Software findet die Bereiche, die Text enthalten, trennt Zeilen und Zeichen und gleicht jede Form mit dem ab, was sie über Buchstaben in einer bestimmten Sprache weiß. Moderne OCR verwendet maschinelles Lernen, weshalb sie verschiedene Schriftarten, Handschriften und viele Sprachen weitaus besser verarbeitet als ältere Tools.
Wo Sie es bereits gesehen haben
- Ihr Telefon, das eine Telefonnummer aus einem Foto extrahiert.
- Ein Scanner, der ein durchsuchbares PDF erstellt.
- Eine Banking-App, die einen Scheck liest.
- Eine Übersetzungs-App, die eine fremdländische Speisekarte durch die Kamera liest.
Worin OCR gut und weniger gut ist
Es ist hervorragend mit klarem, gedrucktem Text und gut mit sauberer Handschrift. Es kämpft mit Unschärfe, schlechtem Licht, unruhigem Hintergrund und unordentlicher oder kursiver Schrift. Je sauberer das Bild, desto besser das Ergebnis, jedes Mal.
Probieren Sie es selbst aus
Der einfachste Weg, OCR zu verstehen, ist es zu nutzen. Laden Sie ein Foto mit einem beliebigen Text zu ocrX hoch, wählen Sie die Sprache und sehen Sie zu, wie ein flaches Bild zu kopierbaren Wörtern wird.
