스캔한 PDF에서 텍스트를 추출하는 방법

스캔한 PDF에서 복사할 수 없는 이유

스캔한 PDF는 PDF 래퍼에 있는 사진 더미입니다. 페이지는 문서처럼 보이지만 텍스트는 이미지이므로 선택하거나 검색할 수 없습니다. 사용 가능한 텍스트를 얻으려면 각 페이지를 OCR로 처리하세요. 페이지를 이미지로 저장하거나 스크린샷을 찍은 다음 이미지 텍스트 변환기에 넣으세요.

단계별

1. PDF 페이지를 이미지로 변환

PDF 뷰어에서 페이지를 JPG 또는 PNG로 내보내거나 각 페이지의 선명한 전체 크기 스크린샷을 찍으세요.

2. ocrX에 업로드

페이지 이미지를 추가하고 언어를 선택한 다음 추출하세요.

3. 페이지 작업

순서대로 처리하고 텍스트를 함께 유지하세요.

4. 결과 저장

TXT로 다운로드하거나, 깔끔한 문서를 원하면 PDF나 Word 파일로 다운로드하세요.

왜 해야 하나요

텍스트가 실제 텍스트가 되면 계약서에서 조항을 검색하고, 오래된 편지에서 주소를 복사하거나, 다시 입력하지 않고 단락을 인용할 수 있습니다. 검색 가능한 아카이브는 평평한 이미지 폴더보다 낫습니다.

  • 적절한 크기로 페이지를 내보내세요. 아주 작은 썸네일은 읽기 어렵습니다.
  • 문서와 일치하는 언어를 선택하세요.
  • 긴 PDF의 경우 작은 배치로 작업하여 위치를 잃지 않도록 하세요.

마무리

스캔한 PDF는 읽기 전까지는 그저 그림일 뿐입니다. ocrX가 그 페이지들을 검색, 복사 및 편집할 수 있는 텍스트로 되돌려줍니다.

ocrX 사용해보기

사진이나 스캔을 넣고 몇 초 만에 텍스트를 추출하세요. 무료, 100개 이상의 언어, 가입 불필요.

이미지 텍스트 변환기

블로그 더 보기