Какво е OCR? Ръководство на прост език
OCR в едно изречение
OCR, съкращение от optical character recognition (оптично разпознаване на символи), е технологията, която чете текста в снимка и го превръща в текст, който можете да редактирате, копирате и търсите. Това е, което позволява на конвертор на изображения в текст като ocrX да вземе снимка на страница и да ви върне действителните думи.
Какъв проблем решава?
Снимка или сканиран документ на текст са просто цветни точки за компютъра. Той не може да различи B от 8. OCR разглежда тези точки, разпознава формите като букви и цифри и ги изписва като реален текст. Това е разликата между снимка на страница и документ, с който можете да работите.
Как работи, грубо казано
Нямате нужда от детайлите, за да го използвате, но същността е проста. Софтуерът намира областите, които съдържат текст, разделя редовете и символите и съпоставя всяка форма с това, което знае за буквите на даден език. Модерният OCR използва машинно обучение, поради което се справя с различни шрифтове, ръкописен текст и много езици далеч по-добре от по-старите инструменти.
Къде вече сте го виждали
- Телефонът ви извлича телефонен номер от снимка.
- Скенер създава PDF, който можете да търсите.
- Банково приложение чете чек.
- Приложение за превод чете чуждо меню през камерата.
В какво OCR е добър и не толкова добър
Отличен е с ясен печатен текст и добър с четлив ръкописен текст. Затруднява се с размазване, слаба светлина, натоварен фон и объркан или курсивен почерк. Колкото по-чисто е изображението, толкова по-добър е резултатът, винаги.
Опитайте сами
Най-лесният начин да разберете OCR е да го използвате. Качете снимка на произволен текст в ocrX, изберете езика и гледайте как плоско изображение се превръща в думи, които можете да копирате.
