Cara Mengekstrak Teks Hindi daripada Imej

Membaca Hindi dari gambar

Hindi ditulis dalam skrip Devanagari, yang tidak dapat dikendalikan oleh pembaca Inggeris biasa. ocrX membaca Devanagari. Muat naik imej anda ke penukar imej ke teks, tetapkan bahasa kepada Hindi, dan ekstrak teks.

Mengapa tetapan bahasa adalah kunci

Devanagari menyambungkan aksara di sepanjang garis atas dan menyusun tanda di atas dan di bawahnya. OCR perlu dilatih khusus padanya. Memilih Hindi sebelum mengekstrak adalah apa yang membezakan antara teks bersih dan sampah.

Langkah demi langkah

1. Muat naik imej

Foto, tangkapan skrin, atau imbasan dengan teks Hindi.

2. Pilih Hindi

Tetapkan bahasa supaya ocrX membaca Devanagari.

3. Ekstrak dan simpan

Salin teks atau muat turun. Eksport PDF menggunakan fon Devanagari, jadi skrip dipaparkan dengan betul dan bukan bertukar menjadi kotak.

Selain Hindi

Sokongan Devanagari yang sama membantu dengan Marathi, Nepal, Sanskrit, dan bahasa lain yang menggunakan skrip tersebut. Pilih yang sepadan dengan teks anda jika ditawarkan.

Petua

  • Gunakan imej tajam supaya tanda di atas dan di bawah huruf kekal jelas.
  • Tetapkan bahasa kepada Hindi, bukan Inggeris.
  • Kontras yang baik membantu lejang halus kelihatan.

Kesimpulan

Dengan bahasa ditetapkan kepada Hindi, ocrX menukar gambar Devanagari menjadi teks yang boleh anda salin, cari, dan terjemah.

Cuba ocrX

Masukkan foto atau imbasan dan dapatkan teks dalam beberapa saat. Percuma, lebih 100 bahasa, tanpa pendaftaran.

Penukar Imej ke Teks

Lagi dari blog