Cara Mengekstrak Teks Arab daripada Foto
Membaca Arab dari gambar
Arab ditulis dari kanan ke kiri dan menyambungkan hurufnya, jadi ia memerlukan alat OCR yang dibina untuknya. ocrX membaca skrip Arab. Muat naik foto anda ke penukar imej ke teks, tetapkan bahasa kepada Arab, dan ekstrak teks.
Mengapa pembaca Arab khusus penting
Huruf Arab berubah bentuk bergantung pada kedudukannya dalam perkataan, dan teks berjalan dari kanan ke kiri. Pembaca generik yang ditetapkan kepada Inggeris akan merosakkan semua itu. Memilih Arab memberitahu ocrX untuk membaca skrip dengan betul, termasuk arah.
Langkah demi langkah
1. Muat naik foto
Apa-apa dengan teks Arab: papan tanda, dokumen, tangkapan skrin.
2. Pilih Arab
Tetapkan bahasa sebelum mengekstrak.
3. Ekstrak dan simpan
Salin teks, atau muat turun fail. Apabila anda menyimpan ke PDF, ocrX menggunakan fon Arab dan menyusun teks dari kanan ke kiri, supaya ia dibaca dengan betul.
Yang perlu diketahui tentang teks kanan-ke-kiri
Apabila anda menampal Arab ke dalam apl lain, apl itu juga perlu menyokong teks kanan-ke-kiri untuk ia dipaparkan dengan betul. Aksara yang ocrX berikan adalah betul; bagaimana ia kelihatan bergantung pada tempat anda menampalnya.
Petua
- Gunakan imej yang jelas dan kontras tinggi.
- Tetapkan bahasa kepada Arab, bukan Inggeris.
- Ini juga membantu dengan Parsi, Urdu, dan bahasa skrip Arab lain, yang disokong ocrX juga.
Kesimpulan
Ditetapkan kepada Arab, ocrX membaca skrip sebagaimana yang sepatutnya dibaca dan memberikan anda teks yang boleh anda salin, terjemah, atau simpan.
