Hoe u tekst uit een gescande PDF haalt
Waarom u niet kunt kopiëren uit een gescande PDF
Een gescande PDF is een stapel foto's in een PDF-verpakking. De pagina's zien eruit als documenten, maar de tekst is een afbeelding, dus u kunt het niet selecteren of doorzoeken. Om bruikbare tekst te krijgen, voert u elke pagina door OCR. Sla een pagina op of maak er een screenshot van als afbeelding en plaats deze in de afbeelding naar tekst converter.
Step by step
1. Zet de PDF-pagina's om in afbeeldingen
Exporteer de pagina's als JPG of PNG vanuit uw PDF-viewer of maak een duidelijke, volledige screenshot van elke pagina.
2. Upload naar ocrX
Voeg de pagina-afbeelding toe, kies de taal en extraheer.
3. Werk door de pagina's heen
Doe ze op volgorde en houd de tekst bij elkaar terwijl u bezig bent.
4. Sla het resultaat op
Download als TXT, of als PDF of Word-bestand als u een net document wilt.
Waarom de moeite nemen
Zodra de tekst echte tekst is, kunt u een contract doorzoeken op een clausule, een adres uit een oude brief kopiëren of een paragraaf citeren zonder deze over te typen. Een doorzoekbaar archief verslaat een map met platte afbeeldingen.
Tips
- Exporteer pagina's op een redelijk formaat. Kleine miniaturen lezen slecht.
- Kies de taal die bij het document past.
- Werk bij lange PDF's in kleine batches zodat u de plaats niet verliest.
Wrapping up
Een gescande PDF is slechts afbeeldingen totdat u het leest. ocrX zet die pagina's terug in tekst die u kunt doorzoeken, kopiëren en bewerken.
