OCR là gì? Hướng dẫn bằng tiếng Anh đơn giản
OCR trong một câu
OCR, viết tắt của nhận dạng ký tự quang học, là công nghệ đọc văn bản trong hình ảnh và biến nó thành văn bản bạn có thể chỉnh sửa, sao chép và tìm kiếm. Đó là những gì cho phép trình chuyển đổi hình ảnh thành văn bản như ocrX lấy ảnh chụp một trang và trả lại cho bạn các từ thực tế.
Nó giải quyết vấn đề gì?
Ảnh hoặc bản quét văn bản chỉ là các chấm màu đối với máy tính. Nó không thể phân biệt chữ B với số 8. OCR nhìn vào những chấm đó, nhận ra các hình dạng là chữ cái và số, và viết chúng ra dưới dạng văn bản thực. Đó là sự khác biệt giữa hình ảnh của một trang và một tài liệu bạn có thể làm việc.
Cách nó hoạt động, đại khái
Bạn không cần chi tiết để sử dụng nó, nhưng ý chính rất đơn giản. Phần mềm tìm các khu vực chứa văn bản, tách các dòng và ký tự, và khớp mỗi hình dạng với những gì nó biết về chữ cái trong một ngôn ngữ nhất định. OCR hiện đại sử dụng học máy, đó là lý do tại sao nó xử lý các phông chữ khác nhau, chữ viết tay và nhiều ngôn ngữ tốt hơn nhiều so với các công cụ cũ.
Nơi bạn đã thấy nó
- Điện thoại của bạn lấy số điện thoại từ ảnh.
- Máy quét tạo PDF bạn có thể tìm kiếm.
- Ứng dụng ngân hàng đọc séc.
- Ứng dụng dịch thuật đọc thực đơn nước ngoài qua camera.
OCR giỏi và không giỏi ở điểm nào
Nó xuất sắc với văn bản in rõ và tốt với chữ viết tay gọn gàng. Nó gặp khó khăn với độ mờ, ánh sáng yếu, nền bận rộn và chữ viết lộn xộn hoặc thảo. Hình ảnh càng sạch, kết quả càng tốt, mọi lúc.
Tự mình thử
Cách dễ nhất để hiểu OCR là sử dụng nó. Tải lên ảnh của bất kỳ văn bản nào lên ocrX, chọn ngôn ngữ và xem một hình ảnh tĩnh trở thành các từ bạn có thể sao chép.
