Reconhecimento ótico de caracteres




OCR é um acrónimo para o inglês Optical Character Recognition, é uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem ou mapa de bits sejam eles escaneados, escritos a mão, datilografados ou impressos. Dessa forma, através do OCR é possível obter um arquivo de texto editável por um computador.




Índice






  • 1 História


  • 2 Programas gratuitos de OCR


  • 3 Fornecedores de OCR


  • 4 Ver também


  • 5 Referências





História |


Em 1950 David Shepard e Louis Tordella começaram a pesquisa do procedimento para automação de dados da então Agência de Segurança das Forças Armadas (AFSA) dos Estados Unidos, que dois anos depois se tornaria a Agência de Segurança Nacional (NSA). Com a ajuda de Harvey Cook eles construíram o "Gismo", o primeiro software de OCR. Shepard então fundou a Intelligent Machines Research Corporation (IMR) que fez os primeiros softwares OCR comerciais.


Em 1953 a IBM obteve uma licença da IMR e desenvolveu um software próprio classificando-o como Optical Character Recognition, tornando o termo OCR um padrão na indústria para essa tecnologia.



Programas gratuitos de OCR |


































































Nome
Licença
Sistema Op.
Notas
Última versão
Google Drive
Freeware
Acesso Web
Software de acesso Web que traz todas as funcionalidades do OCR e converte em vários formatos após conversão.

GOCR GPL
Linux, Windows, OS/2
Também conhecido por JOCR. É utilizado por linha de comando, ou seja, sem interface gráfica.[1]

0.50, 05 de março de 2013, ainda não atualizado no SourceForge[2]


HOCR GPL Linux OCR Hebraico
SimpleOCR Freeware Windows Programa OCR para scan de textos de imagens. Vem também em formato ActiveX DLL para melhor interoperabilidade entre componentes COM e afins. 3.5, 2008
TopOCR Freeware Windows Programa OCR para scan de textos de imagens. Possui reconhecimento de texto em português, boa qualidade das ferramentas de edição para configuração da leitura do texto. 3.1
OCR Terminal Freeware e versões comerciais Windows, Mac OS X, Linux Serviço de OCR baseado na Web.
FreeOCR Licença Apache 2.0 Windows Utiliza o motor do Tesseract, suporta PDF e os formatos mais comuns de imagem, a partir da versão 4.2 suporta reconhecimento em português. 4.2, Agosto de 2012

Tesseract

Licença Apache 2.0
Windows, Mac OS X, Linux
Motor que permite o reconhecimento de textos em imagens, suportando diferentes linguas.
3.05.01

Também é possível submeter arquivos em conversores on-line como o disponível no sítio do Google Drive e no sítio do Free OCR (não confundir com o FreeOCR listado acima).



Fornecedores de OCR |




  • Adobe Acrobat (Windows, Mac OS)

  • BIT-Alpha (Windows)


  • ABBYY FineReader (Unix, Windows, Mac OS)


  • ExactScan Pro (Mac OS)


  • OCRKit (Mac OS)

  • Readiris (Unix, Windows, Mac OS)

  • Nuance Omnipage (Windows)

  • Nicomsoft OCR (Windows, Unix)



Ver também |



  • CAPTCHA

  • Gerenciamento Eletrônico de Documentos



Referências




  1. http://www.digipedia.org/man/doc/view/gocr.1/


  2. «GOCR». Consultado em 10 de junho de 2013 























Ícone de esboço
Este artigo sobre Informática é um esboço. Você pode ajudar a Wikipédia expandindo-o.



Popular posts from this blog

Index of /

Tribalistas

Listed building