كيفية استخراج النص من PDF ممسوح ضوئيًا

لماذا لا يمكنك النسخ من PDF ممسوح ضوئيًا

PDF الممسوح ضوئيًا هو مجموعة من الصور في غلاف PDF. الصفحات تبدو كمستندات، لكن النص صورة، لذلك لا يمكنك تحديده أو البحث فيه. للحصول على نص قابل للاستخدام، تمرر كل صفحة عبر OCR. احفظ أو التقط لقطة شاشة للصفحة كصورة، ثم أسقطها في محول الصور إلى نص.

خطوة بخطوة

1. حوّل صفحات PDF إلى صور

صدّر الصفحات كـ JPG أو PNG من عارض PDF، أو التقط لقطة شاشة واضحة بالحجم الكامل لكل صفحة.

2. حمّل إلى ocrX

أضف صورة الصفحة، اختر اللغة، واستخرج.

3. اعمل عبر الصفحات

قم بها بالترتيب واحتفظ بالنص معًا أثناء تقدمك.

4. احفظ النتيجة

حمّل كـ TXT، أو كـ PDF أو Word إذا كنت تريد مستندًا مرتبًا.

لماذا تتعب نفسك

بمجرد أن يصبح النص نصًا حقيقيًا، يمكنك البحث في عقد عن بند، أو نسخ عنوان من رسالة قديمة، أو اقتباس فقرة دون إعادة كتابتها. أرشيف قابل للبحث يتفوق على مجلد من الصور الثابتة.

نصائح

  • صدّر الصفحات بحجم مناسب. الصور المصغرة الصغيرة تُقرأ بشكل سيء.
  • اختر اللغة التي تطابق المستند.
  • لـ PDF الطويلة، اعمل على دفعات صغيرة حتى لا تفقد مكانك.

الخاتمة

PDF الممسوح ضوئيًا هو مجرد صور حتى تقرأه. يحوّل ocrX تلك الصفحات إلى نص يمكنك البحث فيه ونسخه وتحريره.

جرّب ocrX

أسقط صورة أو مسحًا ضوئيًا واستخرج النص في ثوانٍ. مجاني، أكثر من 100 لغة، بدون تسجيل.

محول الصور إلى نص

المزيد من المدونة