返回所有文章2026年4月28日

如何從掃描的 PDF 中獲取文字

為什麼無法從掃描的 PDF 中複製文字

掃描的 PDF 是包裝在 PDF 外殼中的一堆照片。頁面看起來像文件,但文字是圖片,因此您無法選取或搜尋它。要獲得可用的文字,您需要對每頁進行 OCR 處理。將頁面儲存或截圖為圖片,然後將其放入 圖片轉文字工具

逐步操作

1. 將 PDF 頁面轉換為圖片

從您的 PDF 檢視器中將頁面匯出為 JPG 或 PNG,或者對每頁拍攝一張清晰的全尺寸螢幕截圖。

2. 上傳到 ocrX

新增頁面圖片,選擇語言,然後提取。

3. 逐頁處理

按順序進行,並在過程中將文字整合在一起。

4. 儲存結果

下載為 TXT,或者如果您想要一份整齊的文件,可以下載為 PDF 或 Word 檔案。

為什麼要這麼做

一旦文字變成真正的文字,您就可以搜尋合約中的條款、從舊信件中複製地址,或引用段落而無需重新打字。可搜尋的檔案庫勝過一資料夾的靜態圖片。

提示

  • 以適當的大小匯出頁面。微小的縮圖讀取效果不佳。
  • 選擇與文件相符的語言。
  • 對於較長的 PDF,分批處理,以免失去進度。

總結

掃描的 PDF 在您讀取之前只是圖片。ocrX 將這些頁面轉換回您可以搜尋、複製和編輯的文字。

試用 ocrX

放入照片或掃描檔,幾秒鐘即可提取文字。免費,超過 100 種語言,無需註冊。

圖片轉文字工具

更多來自部落格