Reconhecimento óptico de caracteres através de uma rede neural de kohonen
Daniel Correia Barreto1, Christiano Lima Santos1
1
Departamento de Computação– Universidade Federal de Sergipe (UFS) 49.100-000 – São Cristóvão – SE – Brasil daniel@sigmawd.com.br, christianolimasantos@gmail.com
Abstract. The optical character recognition (OCR) is a computational problem known long ago by researchers and has several different approaches such as artificial neural networks, genetic algorithms and algorithms for pattern recognition. This article brings a study of the Kohonen model as feasible to the OCR problem, and in addition, presents the development of an OCR tool using the model shown. Resumo. O reconhecimento óptico de caracteres (OCR) é um problema computacional conhecido há muito tempo por pesquisadores e que possui várias abordagens diferentes como redes neurais artificiais, algoritmos genéticos e algoritmos de reconhecimento de padrões. Este artigo traz um estudo do modelo de Kohonen como forma viável para o problema da OCR e, adicionalmente, apresenta o desenvolvimento de uma ferramenta OCR utilizando o modelo apresentado.
1. Introdução
Desde o surgimento dos primeiros computadores digitais na década de 60, o homem vem trabalhando em como tratar, otimizar e armazenar a informação. Porém muito da informação disponível até os dias atuais é armazenada em meios não-digitais como: jornais, revistas e até documentos escritos à mão. Diante dessa necessidade de se digitalizar essa informação off-line, pesquisadores vêm trabalhando em formas de interpretar esses dados e transformá-los em informação tratável. Um dos métodos utilizados é o chamado Reconhecimento Óptico de Caracteres (ou OCR - acrônimo de Optical Character Recognition) que é um campo de pesquisa em reconhecimento de padrões, inteligência artificial e visão computacional. O denominado Reconhecimento Óptico de Caracteres se resume em um método eletrônico de tradução de imagens textuais manuscritas,