Czym jest OCR? Przewodnik po polsku
OCR w jednym zdaniu
OCR, czyli optyczne rozpoznawanie znaków, to technologia, która czyta tekst na obrazie i zamienia go w tekst, który możesz edytować, kopiować i przeszukiwać. To dzięki niemu konwerter obrazu na tekst taki jak ocrX może zrobić zdjęcie strony i zwrócić Ci rzeczywiste słowa.
Jaki problem rozwiązuje?
Zdjęcie lub skan tekstu to dla komputera tylko kolorowe kropki. Nie odróżnia B od 8. OCR patrzy na te kropki, rozpoznaje kształty jako litery i cyfry oraz zapisuje je jako prawdziwy tekst. To różnica między obrazem strony a dokumentem, z którym możesz pracować.
Jak mniej więcej działa
Nie potrzebujesz szczegółów, aby go używać, ale sedno jest proste. Oprogramowanie znajduje obszary zawierające tekst, oddziela linie i znaki oraz dopasowuje każdy kształt do tego, co wie o literach w danym języku. Nowoczesny OCR wykorzystuje uczenie maszynowe, dlatego radzi sobie z różnymi czcionkami, pismem ręcznym i wieloma językami znacznie lepiej niż starsze narzędzia.
Gdzie już go widziałeś
- Twój telefon wyłapujący numer telefonu ze zdjęcia.
- Skaner tworzący PDF, który można przeszukiwać.
- Aplikacja bankowa odczytująca czek.
- Aplikacja do tłumaczenia czytająca obce menu przez aparat.
W czym OCR jest dobry, a w czym nie
Jest doskonały w przypadku wyraźnego drukowanego tekstu i dobry w przypadku czytelnego pisma ręcznego. Ma trudności z rozmyciem, słabym światłem, zagraconym tłem i nieczytelnym lub kursywnym pismem. Im czystszy obraz, tym lepszy wynik – zawsze.
Wypróbuj sam
Najłatwiejszym sposobem zrozumienia OCR jest użycie go. Prześlij zdjęcie dowolnego tekstu do ocrX, wybierz język i zobacz, jak płaski obraz staje się słowami, które możesz kopiować.
