모든 게시물로 돌아가기2026년 4월 12일
OCR이란 무엇인가요? 쉬운 영어 가이드
OCR을 한 문장으로
OCR은 광학 문자 인식(Optical Character Recognition)의 약자로, 사진 속 텍스트를 읽고 편집, 복사 및 검색할 수 있는 텍스트로 변환하는 기술입니다. ocrX와 같은 이미지 텍스트 변환기가 페이지 사진을 찍어 실제 단어를 반환할 수 있게 해주는 것입니다.
어떤 문제를 해결하나요?
텍스트의 사진이나 스캔은 컴퓨터에게는 그저 색깔 있는 점에 불과합니다. B와 8을 구분할 수 없습니다. OCR은 그 점들을 보고 모양을 글자와 숫자로 인식하여 실제 텍스트로 작성합니다. 이것이 페이지 사진과 작업할 수 있는 문서의 차이입니다.
대략적인 작동 방식
사용하는 데 세부 사항을 알 필요는 없지만, 요지는 간단합니다. 소프트웨어가 텍스트를 보유한 영역을 찾고, 줄과 문자를 분리한 다음, 각 모양을 주어진 언어의 글자에 대해 알고 있는 것과 일치시킵니다. 최신 OCR은 머신 러닝을 사용하므로 다양한 글꼴, 손글씨 및 많은 언어를 이전 도구보다 훨씬 잘 처리합니다.
이미 본 적이 있는 곳
- 사진에서 전화번호를 가져오는 휴대폰.
- 검색 가능한 PDF를 만드는 스캐너.
- 수표를 읽는 은행 앱.
- 카메라를 통해 외국 메뉴를 읽는 번역 앱.
OCR이 잘하는 것과 그렇지 않은 것
선명한 인쇄 텍스트에는 탁월하고 깔끔한 손글씨에는 좋습니다. 흐릿함, 저조도, 복잡한 배경 및 지저분하거나 필기체에는 어려움을 겪습니다. 이미지가 깨끗할수록 결과는 항상 더 좋습니다.
직접 사용해보세요
OCR을 이해하는 가장 쉬운 방법은 사용해보는 것입니다. 텍스트 사진을 ocrX에 업로드하고 언어를 선택한 다음 평평한 이미지가 복사할 수 있는 단어가 되는 것을 지켜보세요.
