ما هو OCR؟ دليل بلغة بسيطة
OCR في جملة واحدة
OCR، اختصار للتعرف البصري على الأحرف، هي التقنية التي تقرأ النص في الصورة وتحوله إلى نص يمكنك تحريره ونسخه والبحث فيه. إنها ما يسمح لـ محول الصور إلى نص مثل ocrX بأخذ صورة لصفحة وإعادتها إليك ككلمات فعلية.
ما المشكلة التي تحلها؟
صورة أو مسح ضوئي للنص هي مجرد نقاط ملونة للكمبيوتر. لا يمكنه التمييز بين B و8. ينظر OCR إلى تلك النقاط، ويتعرف على الأشكال كحروف وأرقام، ويكتبها كنص حقيقي. هذا هو الفرق بين صورة لصفحة ومستند يمكنك العمل عليه.
كيف تعمل، بشكل تقريبي
لست بحاجة للتفاصيل لاستخدامها، لكن الفكرة بسيطة. يجد البرنامج المناطق التي تحتوي على نص، ويفصل الأسطر والأحرف، ويطابق كل شكل مع ما يعرفه عن الحروف في لغة معينة. يستخدم OCR الحديث التعلم الآلي، ولهذا يتعامل مع الخطوط المختلفة وخط اليد والعديد من اللغات بشكل أفضل بكثير من الأدوات القديمة.
أين رأيتها بالفعل
- هاتفك يلتقط رقم هاتف من صورة.
- ماسح ضوئي يصنع PDF يمكنك البحث فيه.
- تطبيق بنكي يقرأ شيكًا.
- تطبيق ترجمة يقرأ قائمة طعام بلغة أجنبية عبر الكاميرا.
ما يجيده OCR وما لا يجيده
إنه ممتاز مع النص المطبوع الواضح وجيد مع خط اليد المرتب. إنه يعاني من الضبابية والإضاءة المنخفضة والخلفيات المزدحمة والكتابة الفوضوية أو المتصلة. كلما كانت الصورة أنظف، كانت النتيجة أفضل، في كل مرة.
جرّبه بنفسك
أسهل طريقة لفهم OCR هي استخدامه. حمّل صورة لأي نص إلى ocrX، اختر اللغة، وشاهد صورة ثابتة تتحول إلى كلمات يمكنك نسخها.
