Cara Mendapatkan Teks dari PDF Hasil Pindaian
Mengapa Anda tidak bisa menyalin dari PDF hasil pindaian
PDF hasil pindaian adalah kumpulan foto dalam pembungkus PDF. Halaman-halamannya terlihat seperti dokumen, tetapi teksnya adalah gambar, jadi Anda tidak dapat memilih atau mencarinya. Untuk mendapatkan teks yang dapat digunakan, Anda menjalankan setiap halaman melalui OCR. Simpan atau tangkap layar halaman sebagai gambar, lalu masukkan ke konverter gambar ke teks.
Langkah demi langkah
1. Ubah halaman PDF menjadi gambar
Ekspor halaman sebagai JPG atau PNG dari penampil PDF Anda, atau ambil tangkapan layar ukuran penuh yang jelas dari setiap halaman.
2. Unggah ke ocrX
Tambahkan gambar halaman, pilih bahasa, dan ekstrak.
3. Kerjakan semua halaman
Lakukan secara berurutan dan simpan teksnya bersama-sama.
4. Simpan hasilnya
Unduh sebagai TXT, atau sebagai file PDF atau Word jika Anda ingin dokumen yang rapi.
Mengapa repot-repot
Setelah teks menjadi teks asli, Anda dapat mencari kontrak untuk sebuah klausa, menyalin alamat dari surat lama, atau mengutip paragraf tanpa mengetik ulang. Arsip yang dapat dicari mengalahkan folder gambar datar.
Tips
- Ekspor halaman dengan ukuran yang layak. Thumbnail kecil terbaca buruk.
- Pilih bahasa yang sesuai dengan dokumen.
- Untuk PDF panjang, kerjakan dalam batch kecil agar tidak kehilangan posisi.
Kesimpulan
PDF hasil pindaian hanyalah gambar sampai Anda membacanya. ocrX mengubah halaman-halaman itu kembali menjadi teks yang dapat Anda cari, salin, dan edit.
