OCR คืออะไร? คู่มือภาษาอังกฤษแบบง่าย

OCR ในหนึ่งประโยค

OCR ย่อมาจาก optical character recognition (การรู้จำอักขระด้วยแสง) คือเทคโนโลยีที่อ่านข้อความในรูปภาพและเปลี่ยนเป็นข้อความที่คุณสามารถแก้ไข คัดลอก และค้นหาได้ มันคือสิ่งที่ทำให้ตัวแปลงรูปภาพเป็นข้อความอย่าง ocrX สามารถรับรูปภาพของหน้าและส่งคืนคำจริงให้คุณ

มันแก้ปัญหาอะไร?

รูปภาพหรือสแกนของข้อความเป็นเพียงจุดสีสำหรับคอมพิวเตอร์ มันไม่สามารถแยก B ออกจาก 8 ได้ OCR มองที่จุดเหล่านั้น รู้จักรูปร่างเป็นตัวอักษรและตัวเลข และเขียนออกมาเป็นข้อความจริง นั่นคือความแตกต่างระหว่างรูปภาพของหน้ากับเอกสารที่คุณสามารถทำงานได้

มันทำงานอย่างไร คร่าวๆ

คุณไม่จำเป็นต้องมีรายละเอียดเพื่อใช้มัน แต่สาระสำคัญนั้นง่าย ซอฟต์แวร์หาพื้นที่ที่มีข้อความ แยกบรรทัดและตัวอักษร และจับคู่แต่ละรูปร่างกับสิ่งที่มันรู้เกี่ยวกับตัวอักษรในภาษาที่กำหนด OCR สมัยใหม่ใช้การเรียนรู้ของเครื่อง ซึ่งเป็นเหตุผลว่าทำไมมันจึงจัดการฟอนต์ ลายมือ และหลายภาษาได้ดีกว่าเครื่องมือเก่ามาก

ที่ที่คุณเคยเห็นมัน

  • โทรศัพท์ของคุณดึงหมายเลขโทรศัพท์จากรูปภาพ
  • สแกนเนอร์ทำ PDF ที่คุณสามารถค้นหาได้
  • แอปธนาคารอ่านเช็ค
  • แอปแปลภาษาอ่านเมนูต่างประเทศผ่านกล้อง

OCR ถนัดอะไรและไม่ถนัดอะไร

มันยอดเยี่ยมกับข้อความพิมพ์ที่ชัดเจนและดีกับลายมือที่เป็นระเบียบ มันมีปัญหากับภาพเบลอ แสงน้อย พื้นหลังที่รก และลายมือที่ยุ่งเหยิงหรือหวัด ยิ่งรูปภาพสะอาดมากเท่าไหร่ ผลลัพธ์ก็ยิ่งดีเท่านั้น ทุกครั้ง

ลองด้วยตัวเอง

วิธีที่ง่ายที่สุดในการเข้าใจ OCR คือการใช้มัน อัปโหลดรูปภาพของข้อความใดๆ ไปยัง ocrX เลือกภาษา และดูรูปภาพธรรมดากลายเป็นคำที่คุณสามารถคัดลอกได้

ลองใช้ ocrX

วางรูปภาพหรือสแกน แล้วดึงข้อความออกมาในไม่กี่วินาที ฟรี กว่า 100 ภาษา ไม่ต้องสมัคร

ตัวแปลงรูปภาพเป็นข้อความ

เพิ่มเติมจากบล็อก