Jak wyodrębnić tekst w hindi z obrazu
Czytanie hindi z obrazu
Hindi jest zapisywane w piśmie dewanagari, z którym zwykły angielski czytnik sobie nie poradzi. ocrX czyta dewanagari. Prześlij obraz do konwertera obrazu na tekst, ustaw język na hindi i wyodrębnij tekst.
Dlaczego ustawienie języka jest kluczowe
Dewanagari łączy znaki wzdłuż górnej linii i układa znaki nad i pod nimi. OCR musi być specjalnie na to wytrenowany. Wybranie hindi przed ekstrakcją to różnica między czystym tekstem a śmieciami.
Krok po kroku
1. Prześlij obraz
Zdjęcie, zrzut ekranu lub skan z tekstem w hindi.
2. Wybierz hindi
Ustaw język, aby ocrX odczytał dewanagari.
3. Wyodrębnij i zapisz
Skopiuj tekst lub pobierz go. Eksport do PDF używa czcionki dewanagari, dzięki czemu pismo renderuje się prawidłowo, a nie jako pola.
Poza hindi
Ta sama obsługa dewanagari pomaga w przypadku marathi, nepalskiego, sanskrytu i innych języków używających tego pisma. Wybierz ten, który pasuje do Twojego tekstu, gdy jest dostępny.
Wskazówki
- Użyj ostrego obrazu, aby znaki nad i pod literami pozostały wyraźne.
- Ustaw język na hindi, nie angielski.
- Dobry kontrast pomaga wydobyć cienkie kreski.
Podsumowanie
Z językiem ustawionym na hindi, ocrX zamienia obraz dewanagari na tekst, który możesz kopiować, przeszukiwać i tłumaczyć.
