Come Estrarre Testo da un PDF Scansionato

Perché non puoi copiare da un PDF scansionato

Un PDF scansionato è una pila di foto in un involucro PDF. Le pagine sembrano documenti, ma il testo è un'immagine, quindi non puoi selezionarlo o cercarlo. Per ottenere testo utilizzabile, devi passare ogni pagina attraverso l'OCR. Salva o cattura una pagina come immagine, poi caricala nel convertitore da immagine a testo.

Passo dopo passo

1. Trasforma le pagine PDF in immagini

Esporta le pagine come JPG o PNG dal tuo visualizzatore PDF o fai uno screenshot nitido a schermo intero di ogni pagina.

2. Carica su ocrX

Aggiungi l'immagine della pagina, scegli la lingua ed estrai.

3. Procedi attraverso le pagine

Falle in ordine e tieni il testo insieme man mano che procedi.

4. Salva il risultato

Scarica come TXT o come file PDF o Word se desideri un documento ordinato.

Perché preoccuparsi

Una volta che il testo è vero testo, puoi cercare una clausola in un contratto, copiare un indirizzo da una vecchia lettera o citare un paragrafo senza riscriverlo. Un archivio ricercabile batte una cartella di immagini fisse.

Consigli

  • Esporta le pagine a una dimensione decente. Le miniature minuscole si leggono male.
  • Scegli la lingua che corrisponde al documento.
  • Per PDF lunghi, lavora in piccoli lotti per non perdere il tuo posto.

Conclusione

Un PDF scansionato sono solo immagini finché non lo leggi. ocrX trasforma quelle pagine in testo che puoi cercare, copiare e modificare.

Prova ocrX

Carica una foto o una scansione ed estrai il testo in secondi. Gratuito, oltre 100 lingue, nessuna registrazione.

Convertitore Immagini in Testo

Altro dal blog