Hur man får ut text från en skannad PDF

Varför du inte kan kopiera från en skannad PDF

En skannad PDF är en bunt foton i ett PDF-omslag. Sidorna ser ut som dokument, men texten är en bild, så du kan inte markera eller söka i den. För att få användbar text kör du varje sida genom OCR. Spara eller skärmdumpa en sida som bild och släpp den sedan i bild till text-omvandlaren.

Steg för steg

1. Gör PDF-sidorna till bilder

Exportera sidorna som JPG eller PNG från din PDF-visare, eller ta en tydlig skärmdump i full storlek av varje sida.

2. Ladda upp till ocrX

Lägg till sidbilden, välj språk och extrahera.

3. Arbeta igenom sidorna

Gör dem i ordning och håll ihop texten allt eftersom.

4. Spara resultatet

Ladda ner som TXT, eller som PDF eller Word-fil om du vill ha ett snyggt dokument.

Varför bry sig

När texten väl är riktig text kan du söka i ett kontrakt efter en klausul, kopiera en adress ur ett gammalt brev eller citera ett stycke utan att skriva om det. Ett sökbart arkiv slår en mapp med platta bilder.

Tips

  • Exportera sidor i en anständig storlek. Små miniatyrer läses dåligt.
  • Välj språk som matchar dokumentet.
  • För långa PDF-filer, arbeta i små omgångar så att du inte tappar bort dig.

Sammanfattning

En skannad PDF är bara bilder tills du läser den. ocrX förvandlar dessa sidor tillbaka till text du kan söka i, kopiera och redigera.

Prova ocrX

Släng in ett foto eller en skanning och få ut texten på några sekunder. Gratis, över 100 språk, ingen registrering.

Bild till text-omvandlare

Mer från bloggen