Jak wyodrębnić tekst w hindi z obrazu

Czytanie hindi z obrazu

Hindi jest zapisywane w piśmie dewanagari, z którym zwykły angielski czytnik sobie nie poradzi. ocrX czyta dewanagari. Prześlij obraz do konwertera obrazu na tekst, ustaw język na hindi i wyodrębnij tekst.

Dlaczego ustawienie języka jest kluczowe

Dewanagari łączy znaki wzdłuż górnej linii i układa znaki nad i pod nimi. OCR musi być specjalnie na to wytrenowany. Wybranie hindi przed ekstrakcją to różnica między czystym tekstem a śmieciami.

Krok po kroku

1. Prześlij obraz

Zdjęcie, zrzut ekranu lub skan z tekstem w hindi.

2. Wybierz hindi

Ustaw język, aby ocrX odczytał dewanagari.

3. Wyodrębnij i zapisz

Skopiuj tekst lub pobierz go. Eksport do PDF używa czcionki dewanagari, dzięki czemu pismo renderuje się prawidłowo, a nie jako pola.

Poza hindi

Ta sama obsługa dewanagari pomaga w przypadku marathi, nepalskiego, sanskrytu i innych języków używających tego pisma. Wybierz ten, który pasuje do Twojego tekstu, gdy jest dostępny.

Wskazówki

  • Użyj ostrego obrazu, aby znaki nad i pod literami pozostały wyraźne.
  • Ustaw język na hindi, nie angielski.
  • Dobry kontrast pomaga wydobyć cienkie kreski.

Podsumowanie

Z językiem ustawionym na hindi, ocrX zamienia obraz dewanagari na tekst, który możesz kopiować, przeszukiwać i tłumaczyć.

Wypróbuj ocrX

Wrzuć zdjęcie lub skan i wydobądź tekst w kilka sekund. Za darmo, ponad 100 języków, bez rejestracji.

Konwerter obrazu na tekst

Więcej z bloga