Análise Léxica de Computadores
Analíse Léxica de Compiladores
José Rogério de Oliveira da Silva
Ciência da Computação
ASPER – Associação Paraibana de Ensino Renovado
João Pessoa, 21 de dezembro de 2011.
Resumo
Esse trabalho apresenta uma compreensão sobre analíse léxica de compiladores, como funciona um analisador léxico. Trasendo, de uma maneira mais clara, uma metodologia simples para melhor entendimento para estudantes de compiladores.
Palavras chave: Análise léxica, analisador léxico.
Análise Léxica
Análise léxica é o processo de analisar a entrada de linhas de caracteres (tal como o código-fonte de um programa de computador) e produzir uma seqüência de símbolos chamado "símbolos léxicos" (lexical tokens), ou somente "símbolos" (tokens), que podem ser manipulados mais facilmente por um parser (leitor de saída). O componente do compilador responsável pela execução desse processo é conhecido como Analisador léxico.
A análise léxica é a forma de verificar determinado alfabeto. Quando analisamos uma palavra, podemos definir através da análise léxica se existe ou não algum caracter que não faz parte do nosso alfabeto, ou um alfabeto inventado por nós.
É a primeira etapa do processo de compilação e seu objetivo é dividir o código fonte em símbolos, preparado-o para a Análise Sintática. Neste processo pode-se destacar três atividades como fundamentais:
Extração e classificação dos tokens;
Eliminação de delimitadores e comentários;
Recuperação de Erros.
O analisador léxico funciona de duas maneiras:
Primeiro estado da análise: A primeira etapa lê a entrada de caracteres, um de cada vez, mudando o estado em que os caracteres se encontram. Quando o analisador encontra um caracter que ele não identifica como correto, ele o chama de "estado morto" então, ele volta à última análise que foi aceita e assim tem o tipo e comprimento do léxico válido.
Um léxico, entretanto, é uma única lista de caracteres conhecidas de ser um tipo correto. Para construir um