Как извлечь текст на хинди из изображения

Чтение хинди с картинки

Хинди пишется письменностью деванагари, с которой обычное средство чтения английского не справится. ocrX читает деванагари. Загрузите изображение в конвертер изображений в текст, установите язык «Хинди» и извлеките текст.

Почему настройка языка ключевая

Деванагари соединяет символы вдоль верхней линии и накапливает знаки сверху и снизу. OCR должен быть специально обучен на ней. Выбор хинди перед извлечением — это то, что отличает чистый текст от бессмыслицы.

Шаг за шагом

1. Загрузите изображение

Фото, скриншот или скан с текстом на хинди.

2. Выберите хинди

Установите язык, чтобы ocrX читал деванагари.

3. Извлеките и сохраните

Скопируйте текст или скачайте его. Экспорт в PDF использует шрифт деванагари, поэтому письменность отображается правильно, а не в виде квадратов.

Помимо хинди

Та же поддержка деванагари помогает с маратхи, непали, санскритом и другими языками, использующими это письмо. Выбирайте тот, который соответствует вашему тексту, где это предлагается.

Советы

  • Используйте чёткое изображение, чтобы знаки над и под буквами оставались ясными.
  • Установите язык «Хинди», а не английский.
  • Хороший контраст помогает тонким штрихам проявиться.

Заключение

С установленным языком хинди ocrX превращает картинку с деванагари в текст, который можно копировать, искать и переводить.

Попробуйте ocrX

Загрузите фото или скан и извлеките текст за секунды. Бесплатно, более 100 языков, без регистрации.

Конвертер изображений в текст

Больше из блога