OCR이란 무엇인가요? 쉬운 영어 가이드

OCR을 한 문장으로

OCR은 광학 문자 인식(Optical Character Recognition)의 약자로, 사진 속 텍스트를 읽고 편집, 복사 및 검색할 수 있는 텍스트로 변환하는 기술입니다. ocrX와 같은 이미지 텍스트 변환기가 페이지 사진을 찍어 실제 단어를 반환할 수 있게 해주는 것입니다.

어떤 문제를 해결하나요?

텍스트의 사진이나 스캔은 컴퓨터에게는 그저 색깔 있는 점에 불과합니다. B와 8을 구분할 수 없습니다. OCR은 그 점들을 보고 모양을 글자와 숫자로 인식하여 실제 텍스트로 작성합니다. 이것이 페이지 사진과 작업할 수 있는 문서의 차이입니다.

대략적인 작동 방식

사용하는 데 세부 사항을 알 필요는 없지만, 요지는 간단합니다. 소프트웨어가 텍스트를 보유한 영역을 찾고, 줄과 문자를 분리한 다음, 각 모양을 주어진 언어의 글자에 대해 알고 있는 것과 일치시킵니다. 최신 OCR은 머신 러닝을 사용하므로 다양한 글꼴, 손글씨 및 많은 언어를 이전 도구보다 훨씬 잘 처리합니다.

이미 본 적이 있는 곳

  • 사진에서 전화번호를 가져오는 휴대폰.
  • 검색 가능한 PDF를 만드는 스캐너.
  • 수표를 읽는 은행 앱.
  • 카메라를 통해 외국 메뉴를 읽는 번역 앱.

OCR이 잘하는 것과 그렇지 않은 것

선명한 인쇄 텍스트에는 탁월하고 깔끔한 손글씨에는 좋습니다. 흐릿함, 저조도, 복잡한 배경 및 지저분하거나 필기체에는 어려움을 겪습니다. 이미지가 깨끗할수록 결과는 항상 더 좋습니다.

직접 사용해보세요

OCR을 이해하는 가장 쉬운 방법은 사용해보는 것입니다. 텍스트 사진을 ocrX에 업로드하고 언어를 선택한 다음 평평한 이미지가 복사할 수 있는 단어가 되는 것을 지켜보세요.

ocrX 사용해보기

사진이나 스캔을 넣고 몇 초 만에 텍스트를 추출하세요. 무료, 100개 이상의 언어, 가입 불필요.

이미지 텍스트 변환기

블로그 더 보기