O que é OCR? Um Guia em Português Claro
OCR em uma frase
OCR, abreviação de reconhecimento óptico de caracteres, é a tecnologia que lê o texto em uma imagem e o transforma em texto que você pode editar, copiar e pesquisar. É o que permite que um conversor de imagem para texto como o ocrX tire uma foto de uma página e devolva as palavras reais.
Qual problema ele resolve?
Uma foto ou digitalização de texto são apenas pontos coloridos para um computador. Ele não consegue distinguir um B de um 8. O OCR olha para esses pontos, reconhece as formas como letras e números e os escreve como texto real. Essa é a diferença entre uma imagem de uma página e um documento com o qual você pode trabalhar.
Como funciona, resumidamente
Você não precisa dos detalhes para usá-lo, mas a essência é simples. O software encontra as áreas que contêm texto, separa as linhas e caracteres e combina cada forma com o que sabe sobre letras em um determinado idioma. O OCR moderno usa aprendizado de máquina, e é por isso que ele lida com diferentes fontes, caligrafia e muitos idiomas muito melhor do que as ferramentas antigas.
Onde você já viu isso
- Seu celular capturando um número de telefone de uma foto.
- Um scanner fazendo um PDF que você pode pesquisar.
- Um aplicativo bancário lendo um cheque.
- Um aplicativo de tradução lendo um cardápio estrangeiro através da câmera.
No que o OCR é bom e no que não é tão bom
É excelente com texto impresso claro e bom com caligrafia legível. Ele luta com desfoque, pouca luz, fundos poluídos e escrita bagunçada ou cursiva. Quanto mais limpa a imagem, melhor o resultado, sempre.
Experimente você mesmo
A maneira mais fácil de entender o OCR é usá-lo. Envie uma foto de qualquer texto para o ocrX, escolha o idioma e veja uma imagem estática se transformar em palavras que você pode copiar.
