Как извлечь текст на хинди из изображения
Чтение хинди с картинки
Хинди пишется письменностью деванагари, с которой обычное средство чтения английского не справится. ocrX читает деванагари. Загрузите изображение в конвертер изображений в текст, установите язык «Хинди» и извлеките текст.
Почему настройка языка ключевая
Деванагари соединяет символы вдоль верхней линии и накапливает знаки сверху и снизу. OCR должен быть специально обучен на ней. Выбор хинди перед извлечением — это то, что отличает чистый текст от бессмыслицы.
Шаг за шагом
1. Загрузите изображение
Фото, скриншот или скан с текстом на хинди.
2. Выберите хинди
Установите язык, чтобы ocrX читал деванагари.
3. Извлеките и сохраните
Скопируйте текст или скачайте его. Экспорт в PDF использует шрифт деванагари, поэтому письменность отображается правильно, а не в виде квадратов.
Помимо хинди
Та же поддержка деванагари помогает с маратхи, непали, санскритом и другими языками, использующими это письмо. Выбирайте тот, который соответствует вашему тексту, где это предлагается.
Советы
- Используйте чёткое изображение, чтобы знаки над и под буквами оставались ясными.
- Установите язык «Хинди», а не английский.
- Хороший контраст помогает тонким штрихам проявиться.
Заключение
С установленным языком хинди ocrX превращает картинку с деванагари в текст, который можно копировать, искать и переводить.
