วิธีรับข้อความจาก PDF ที่สแกน

ทำไมคุณถึงไม่สามารถคัดลอกจาก PDF ที่สแกนได้

PDF ที่สแกนคือกองรูปภาพในเปลือกหุ้ม PDF หน้าต่างๆ ดูเหมือนเอกสาร แต่ข้อความเป็นรูปภาพ ดังนั้นคุณจึงไม่สามารถเลือกหรือค้นหาได้ ในการรับข้อความที่ใช้งานได้ คุณต้องรันแต่ละหน้าผ่าน OCR บันทึกหรือถ่ายภาพหน้าจอของหน้าเป็นรูปภาพ จากนั้นวางลงในตัวแปลงรูปภาพเป็นข้อความ

ทีละขั้นตอน

1. เปลี่ยนหน้า PDF เป็นรูปภาพ

ส่งออกหน้าเป็น JPG หรือ PNG จากโปรแกรมดู PDF ของคุณ หรือถ่ายภาพหน้าจอที่ชัดเจนขนาดเต็มของแต่ละหน้า

2. อัปโหลดไปยัง ocrX

เพิ่มรูปภาพหน้า เลือกภาษา และแยกข้อความ

3. ทำงานผ่านหน้า

ทำตามลำดับและเก็บข้อความไว้ด้วยกันขณะที่คุณดำเนินการ

4. บันทึกผลลัพธ์

ดาวน์โหลดเป็น TXT หรือเป็นไฟล์ PDF หรือ Word หากคุณต้องการเอกสารที่เป็นระเบียบ

ทำไมต้องทำ

เมื่อข้อความเป็นข้อความจริง คุณสามารถค้นหาสัญญาสำหรับข้อกำหนด คัดลอกที่อยู่จากจดหมายเก่า หรืออ้างอิงย่อหน้าโดยไม่ต้องพิมพ์ใหม่ คลังข้อมูลที่ค้นหาได้ดีกว่าโฟลเดอร์รูปภาพธรรมดา

เคล็ดลับ

  • ส่งออกหน้าด้วยขนาดที่เหมาะสม ภาพขนาดเล็กอ่านได้ไม่ดี
  • เลือกภาษาที่ตรงกับเอกสาร
  • สำหรับ PDF ยาวๆ ทำงานเป็นชุดเล็กๆ เพื่อไม่ให้คุณหลงตำแหน่ง

สรุป

PDF ที่สแกนเป็นเพียงรูปภาพจนกว่าคุณจะอ่านมัน ocrX เปลี่ยนหน้าเหล่านั้นกลับเป็นข้อความที่คุณสามารถค้นหา คัดลอก และแก้ไขได้

ลองใช้ ocrX

วางรูปภาพหรือสแกน แล้วดึงข้อความออกมาในไม่กี่วินาที ฟรี กว่า 100 ภาษา ไม่ต้องสมัคร

ตัวแปลงรูปภาพเป็นข้อความ

เพิ่มเติมจากบล็อก