Как да извлечете хинди текст от изображение
Четене на хинди от снимка
Хинди се пише с писмеността деванагари, която обикновен английски четец не може да обработи. ocrX чете деванагари. Качете изображението си в конвертор на изображения в текст, задайте езика на хинди и извлечете текста.
Защо настройката на езика е ключова
Деванагари свързва символи по горна линия и подрежда знаци над и под тях. OCR трябва да бъде обучен специално за нея. Избирането на хинди преди извличане е разликата между чист текст и боклук.
Стъпка по стъпка
1. Качете изображението
Снимка, екранна снимка или сканиран документ с хинди текст.
2. Изберете хинди
Задайте езика, така че ocrX да чете деванагари.
3. Извлечете и запазете
Копирайте текста или го изтеглете. PDF експортът използва шрифт деванагари, така че писмеността се визуализира правилно, вместо да се превръща в кутии.
Отвъд хинди
Същата поддръжка на деванагари помага с маратхи, непалски, санскрит и други езици, които използват тази писменост. Изберете този, който съответства на вашия текст, където е предложен.
Съвети
- Използвайте рязко изображение, така че знаците над и под буквите да останат ясни.
- Задайте езика на хинди, а не на английски.
- Добрият контраст помага на фините черти да се виждат.
Приключваме
С език, зададен на хинди, ocrX превръща снимка на деванагари в текст, който можете да копирате, търсите и превеждате.
