Cara Mengekstrak Teks Hindi daripada Imej
Membaca Hindi dari gambar
Hindi ditulis dalam skrip Devanagari, yang tidak dapat dikendalikan oleh pembaca Inggeris biasa. ocrX membaca Devanagari. Muat naik imej anda ke penukar imej ke teks, tetapkan bahasa kepada Hindi, dan ekstrak teks.
Mengapa tetapan bahasa adalah kunci
Devanagari menyambungkan aksara di sepanjang garis atas dan menyusun tanda di atas dan di bawahnya. OCR perlu dilatih khusus padanya. Memilih Hindi sebelum mengekstrak adalah apa yang membezakan antara teks bersih dan sampah.
Langkah demi langkah
1. Muat naik imej
Foto, tangkapan skrin, atau imbasan dengan teks Hindi.
2. Pilih Hindi
Tetapkan bahasa supaya ocrX membaca Devanagari.
3. Ekstrak dan simpan
Salin teks atau muat turun. Eksport PDF menggunakan fon Devanagari, jadi skrip dipaparkan dengan betul dan bukan bertukar menjadi kotak.
Selain Hindi
Sokongan Devanagari yang sama membantu dengan Marathi, Nepal, Sanskrit, dan bahasa lain yang menggunakan skrip tersebut. Pilih yang sepadan dengan teks anda jika ditawarkan.
Petua
- Gunakan imej tajam supaya tanda di atas dan di bawah huruf kekal jelas.
- Tetapkan bahasa kepada Hindi, bukan Inggeris.
- Kontras yang baik membantu lejang halus kelihatan.
Kesimpulan
Dengan bahasa ditetapkan kepada Hindi, ocrX menukar gambar Devanagari menjadi teks yang boleh anda salin, cari, dan terjemah.
