Hur man extraherar hindi-text från en bild
Läsa hindi från en bild
Hindi skrivs med devanagari-skriften, som en vanlig engelsk läsare inte kan hantera. ocrX läser devanagari. Ladda upp din bild till bild till text-omvandlaren, ställ in språket till hindi och extrahera texten.
Varför språkinställningen är avgörande
Devanagari sammanfogar tecken längs en topplinje och staplar markeringar ovanför och under dem. OCR måste vara specifikt tränat på det. Att välja hindi innan extrahering är vad som gör skillnaden mellan ren text och skräp.
Steg för steg
1. Ladda upp bilden
Ett foto, skärmdump eller skanning med hindi-text.
2. Välj hindi
Ställ in språket så att ocrX läser devanagari.
3. Extrahera och spara
Kopiera texten eller ladda ner den. PDF-exporten använder ett devanagari-typsnitt, så skriften renderas korrekt istället för att bli till rutor.
Bortom hindi
Samma devanagari-stöd hjälper med marathi, nepali, sanskrit och andra språk som använder skriften. Välj det som matchar din text där det erbjuds.
Tips
- Använd en skarp bild så att markeringarna ovanför och under bokstäverna förblir tydliga.
- Ställ in språket till hindi, inte engelska.
- Bra kontrast hjälper de fina strecken att komma igenom.
Sammanfattning
Med språket inställt på hindi förvandlar ocrX en bild av devanagari till text du kan kopiera, söka i och översätta.
