Cara Mendapatkan Teks dari PDF Hasil Pindaian

Mengapa Anda tidak bisa menyalin dari PDF hasil pindaian

PDF hasil pindaian adalah kumpulan foto dalam pembungkus PDF. Halaman-halamannya terlihat seperti dokumen, tetapi teksnya adalah gambar, jadi Anda tidak dapat memilih atau mencarinya. Untuk mendapatkan teks yang dapat digunakan, Anda menjalankan setiap halaman melalui OCR. Simpan atau tangkap layar halaman sebagai gambar, lalu masukkan ke konverter gambar ke teks.

Langkah demi langkah

1. Ubah halaman PDF menjadi gambar

Ekspor halaman sebagai JPG atau PNG dari penampil PDF Anda, atau ambil tangkapan layar ukuran penuh yang jelas dari setiap halaman.

2. Unggah ke ocrX

Tambahkan gambar halaman, pilih bahasa, dan ekstrak.

3. Kerjakan semua halaman

Lakukan secara berurutan dan simpan teksnya bersama-sama.

4. Simpan hasilnya

Unduh sebagai TXT, atau sebagai file PDF atau Word jika Anda ingin dokumen yang rapi.

Mengapa repot-repot

Setelah teks menjadi teks asli, Anda dapat mencari kontrak untuk sebuah klausa, menyalin alamat dari surat lama, atau mengutip paragraf tanpa mengetik ulang. Arsip yang dapat dicari mengalahkan folder gambar datar.

Tips

  • Ekspor halaman dengan ukuran yang layak. Thumbnail kecil terbaca buruk.
  • Pilih bahasa yang sesuai dengan dokumen.
  • Untuk PDF panjang, kerjakan dalam batch kecil agar tidak kehilangan posisi.

Kesimpulan

PDF hasil pindaian hanyalah gambar sampai Anda membacanya. ocrX mengubah halaman-halaman itu kembali menjadi teks yang dapat Anda cari, salin, dan edit.

Coba ocrX

Masukkan foto atau pindaian dan dapatkan teksnya dalam hitungan detik. Gratis, lebih dari 100 bahasa, tanpa pendaftaran.

Konversi Gambar ke Teks

Lainnya dari blog