画像を検索可能なPDFに変換する方法

重要な違い

写真をPDFとして保存しても、そのテキストが検索可能になるわけではありません。テキストは依然として画像です。検索やコピーができるPDFを得るには、まずテキストを読み取り、その後保存する必要があります。ocrXがこれを処理します:画像を画像テキスト変換ツールにかけ、結果をPDFとしてダウンロードします。

検索可能なPDFの価値

内部の単語を検索したり、行をコピーしたり、スクリーンリーダーが読み上げることができます。これは、後でファイルして見つけたい文書、レシート、記録に期待される形式です。

ステップバイステップ

1. 画像をアップロード

ページの写真やスキャンをドロップします。

2. 言語を選択して抽出

テキストが正しく読み取れるように言語を設定し、抽出します。

3. PDFとしてダウンロード

形式にPDFを選択してダウンロードします。ocrXは読み取ったテキストからPDFを構築し、非英語の言語が適切に表示されるよう正しいフォントを使用します。

知っておくと良いこと

これにより、背後に隠しテキストがある重いスキャン画像PDFではなく、クリーンなテキストPDFが得られます。ほとんどの人にとって、これはより有用な結果です:ファイルが小さく、テキストを実際に選択できます。

ヒント

  • 最もクリーンなテキストを得るには、鮮明で真正面から撮った画像を使用します。
  • 複数ページの場合は、それぞれを抽出して順序を保ちます。
  • 特にアラビア語、中国語、その他の非ラテン文字の場合は、適切な言語を選択します。

まとめ

PDF内の画像は検索できません。ocrXはそれを実際のテキストを持つPDFに変換するため、中身を検索してコピーできます。アップロード、抽出、PDFとして保存。

ocrXを試す

写真やスキャンをドロップするだけで、数秒でテキストを抽出。無料、100以上の言語対応、登録不要。

画像をテキストに変換

ブログをもっと見る