Hur man får ut text från en skannad PDF
Varför du inte kan kopiera från en skannad PDF
En skannad PDF är en bunt foton i ett PDF-omslag. Sidorna ser ut som dokument, men texten är en bild, så du kan inte markera eller söka i den. För att få användbar text kör du varje sida genom OCR. Spara eller skärmdumpa en sida som bild och släpp den sedan i bild till text-omvandlaren.
Steg för steg
1. Gör PDF-sidorna till bilder
Exportera sidorna som JPG eller PNG från din PDF-visare, eller ta en tydlig skärmdump i full storlek av varje sida.
2. Ladda upp till ocrX
Lägg till sidbilden, välj språk och extrahera.
3. Arbeta igenom sidorna
Gör dem i ordning och håll ihop texten allt eftersom.
4. Spara resultatet
Ladda ner som TXT, eller som PDF eller Word-fil om du vill ha ett snyggt dokument.
Varför bry sig
När texten väl är riktig text kan du söka i ett kontrakt efter en klausul, kopiera en adress ur ett gammalt brev eller citera ett stycke utan att skriva om det. Ett sökbart arkiv slår en mapp med platta bilder.
Tips
- Exportera sidor i en anständig storlek. Små miniatyrer läses dåligt.
- Välj språk som matchar dokumentet.
- För långa PDF-filer, arbeta i små omgångar så att du inte tappar bort dig.
Sammanfattning
En skannad PDF är bara bilder tills du läser den. ocrX förvandlar dessa sidor tillbaka till text du kan söka i, kopiera och redigera.
