OCR คืออะไร? คู่มือภาษาอังกฤษแบบง่าย

OCR ในหนึ่งประโยค

OCR ย่อมาจาก optical character recognition (การรู้จำอักขระด้วยแสง) คือเทคโนโลยีที่อ่านข้อความในรูปภาพและเปลี่ยนเป็นข้อความที่คุณสามารถแก้ไข คัดลอก และค้นหาได้ มันคือสิ่งที่ทำให้ตัวแปลงรูปภาพเป็นข้อความอย่าง ocrX สามารถรับรูปภาพของหน้าและส่งคืนคำจริงให้คุณ

มันแก้ปัญหาอะไร?

รูปภาพหรือสแกนของข้อความเป็นเพียงจุดสีสำหรับคอมพิวเตอร์ มันไม่สามารถแยก B ออกจาก 8 ได้ OCR มองที่จุดเหล่านั้น รู้จักรูปร่างเป็นตัวอักษรและตัวเลข และเขียนออกมาเป็นข้อความจริง นั่นคือความแตกต่างระหว่างรูปภาพของหน้ากับเอกสารที่คุณสามารถทำงานได้

มันทำงานอย่างไร คร่าวๆ

คุณไม่จำเป็นต้องมีรายละเอียดเพื่อใช้มัน แต่สาระสำคัญนั้นง่าย ซอฟต์แวร์หาพื้นที่ที่มีข้อความ แยกบรรทัดและตัวอักษร และจับคู่แต่ละรูปร่างกับสิ่งที่มันรู้เกี่ยวกับตัวอักษรในภาษาที่กำหนด OCR สมัยใหม่ใช้การเรียนรู้ของเครื่อง ซึ่งเป็นเหตุผลว่าทำไมมันจึงจัดการฟอนต์ ลายมือ และหลายภาษาได้ดีกว่าเครื่องมือเก่ามาก

ที่ที่คุณเคยเห็นมัน

โทรศัพท์ของคุณดึงหมายเลขโทรศัพท์จากรูปภาพ
สแกนเนอร์ทำ PDF ที่คุณสามารถค้นหาได้
แอปธนาคารอ่านเช็ค
แอปแปลภาษาอ่านเมนูต่างประเทศผ่านกล้อง

OCR ถนัดอะไรและไม่ถนัดอะไร

มันยอดเยี่ยมกับข้อความพิมพ์ที่ชัดเจนและดีกับลายมือที่เป็นระเบียบ มันมีปัญหากับภาพเบลอ แสงน้อย พื้นหลังที่รก และลายมือที่ยุ่งเหยิงหรือหวัด ยิ่งรูปภาพสะอาดมากเท่าไหร่ ผลลัพธ์ก็ยิ่งดีเท่านั้น ทุกครั้ง

ลองด้วยตัวเอง

วิธีที่ง่ายที่สุดในการเข้าใจ OCR คือการใช้มัน อัปโหลดรูปภาพของข้อความใดๆ ไปยัง ocrX เลือกภาษา และดูรูปภาพธรรมดากลายเป็นคำที่คุณสามารถคัดลอกได้

OCR คืออะไร? คู่มือภาษาอังกฤษแบบง่าย

OCR ในหนึ่งประโยค

มันแก้ปัญหาอะไร?

มันทำงานอย่างไร คร่าวๆ

ที่ที่คุณเคยเห็นมัน

OCR ถนัดอะไรและไม่ถนัดอะไร

ลองด้วยตัวเอง

ลองใช้ ocrX

เพิ่มเติมจากบล็อก

วิธีแยกข้อความจากรูปภาพ (ไม่ต้องพิมพ์)

วิธีแปลงรูปภาพเป็นข้อความบน iPhone และ Android

วิธีคัดลอกข้อความจากภาพหน้าจอ