OCR คืออะไร? คู่มือภาษาอังกฤษแบบง่าย
OCR ในหนึ่งประโยค
OCR ย่อมาจาก optical character recognition (การรู้จำอักขระด้วยแสง) คือเทคโนโลยีที่อ่านข้อความในรูปภาพและเปลี่ยนเป็นข้อความที่คุณสามารถแก้ไข คัดลอก และค้นหาได้ มันคือสิ่งที่ทำให้ตัวแปลงรูปภาพเป็นข้อความอย่าง ocrX สามารถรับรูปภาพของหน้าและส่งคืนคำจริงให้คุณ
มันแก้ปัญหาอะไร?
รูปภาพหรือสแกนของข้อความเป็นเพียงจุดสีสำหรับคอมพิวเตอร์ มันไม่สามารถแยก B ออกจาก 8 ได้ OCR มองที่จุดเหล่านั้น รู้จักรูปร่างเป็นตัวอักษรและตัวเลข และเขียนออกมาเป็นข้อความจริง นั่นคือความแตกต่างระหว่างรูปภาพของหน้ากับเอกสารที่คุณสามารถทำงานได้
มันทำงานอย่างไร คร่าวๆ
คุณไม่จำเป็นต้องมีรายละเอียดเพื่อใช้มัน แต่สาระสำคัญนั้นง่าย ซอฟต์แวร์หาพื้นที่ที่มีข้อความ แยกบรรทัดและตัวอักษร และจับคู่แต่ละรูปร่างกับสิ่งที่มันรู้เกี่ยวกับตัวอักษรในภาษาที่กำหนด OCR สมัยใหม่ใช้การเรียนรู้ของเครื่อง ซึ่งเป็นเหตุผลว่าทำไมมันจึงจัดการฟอนต์ ลายมือ และหลายภาษาได้ดีกว่าเครื่องมือเก่ามาก
ที่ที่คุณเคยเห็นมัน
- โทรศัพท์ของคุณดึงหมายเลขโทรศัพท์จากรูปภาพ
- สแกนเนอร์ทำ PDF ที่คุณสามารถค้นหาได้
- แอปธนาคารอ่านเช็ค
- แอปแปลภาษาอ่านเมนูต่างประเทศผ่านกล้อง
OCR ถนัดอะไรและไม่ถนัดอะไร
มันยอดเยี่ยมกับข้อความพิมพ์ที่ชัดเจนและดีกับลายมือที่เป็นระเบียบ มันมีปัญหากับภาพเบลอ แสงน้อย พื้นหลังที่รก และลายมือที่ยุ่งเหยิงหรือหวัด ยิ่งรูปภาพสะอาดมากเท่าไหร่ ผลลัพธ์ก็ยิ่งดีเท่านั้น ทุกครั้ง
ลองด้วยตัวเอง
วิธีที่ง่ายที่สุดในการเข้าใจ OCR คือการใช้มัน อัปโหลดรูปภาพของข้อความใดๆ ไปยัง ocrX เลือกภาษา และดูรูปภาพธรรมดากลายเป็นคำที่คุณสามารถคัดลอกได้
