ما هو OCR؟ دليل بلغة بسيطة

OCR في جملة واحدة

OCR، اختصار للتعرف البصري على الأحرف، هي التقنية التي تقرأ النص في الصورة وتحوله إلى نص يمكنك تحريره ونسخه والبحث فيه. إنها ما يسمح لـ محول الصور إلى نص مثل ocrX بأخذ صورة لصفحة وإعادتها إليك ككلمات فعلية.

ما المشكلة التي تحلها؟

صورة أو مسح ضوئي للنص هي مجرد نقاط ملونة للكمبيوتر. لا يمكنه التمييز بين B و8. ينظر OCR إلى تلك النقاط، ويتعرف على الأشكال كحروف وأرقام، ويكتبها كنص حقيقي. هذا هو الفرق بين صورة لصفحة ومستند يمكنك العمل عليه.

كيف تعمل، بشكل تقريبي

لست بحاجة للتفاصيل لاستخدامها، لكن الفكرة بسيطة. يجد البرنامج المناطق التي تحتوي على نص، ويفصل الأسطر والأحرف، ويطابق كل شكل مع ما يعرفه عن الحروف في لغة معينة. يستخدم OCR الحديث التعلم الآلي، ولهذا يتعامل مع الخطوط المختلفة وخط اليد والعديد من اللغات بشكل أفضل بكثير من الأدوات القديمة.

أين رأيتها بالفعل

  • هاتفك يلتقط رقم هاتف من صورة.
  • ماسح ضوئي يصنع PDF يمكنك البحث فيه.
  • تطبيق بنكي يقرأ شيكًا.
  • تطبيق ترجمة يقرأ قائمة طعام بلغة أجنبية عبر الكاميرا.

ما يجيده OCR وما لا يجيده

إنه ممتاز مع النص المطبوع الواضح وجيد مع خط اليد المرتب. إنه يعاني من الضبابية والإضاءة المنخفضة والخلفيات المزدحمة والكتابة الفوضوية أو المتصلة. كلما كانت الصورة أنظف، كانت النتيجة أفضل، في كل مرة.

جرّبه بنفسك

أسهل طريقة لفهم OCR هي استخدامه. حمّل صورة لأي نص إلى ocrX، اختر اللغة، وشاهد صورة ثابتة تتحول إلى كلمات يمكنك نسخها.

جرّب ocrX

أسقط صورة أو مسحًا ضوئيًا واستخرج النص في ثوانٍ. مجاني، أكثر من 100 لغة، بدون تسجيل.

محول الصور إلى نص

المزيد من المدونة