Codificação adaptativa utilizando n-gramas
1
Codificação Adaptativa Utilizando n-Gramas
Wagner Regis de Araujo1 Daniella Dias C da Silva1 César Vasconcelos Rocha1
Federal de Educação, Ciência e Tecnologia da Paraíba, Campina Grande,PB
E-mails: wraraujo@gmail.com, daniella.silva@ifpb.edu.br, cesarocha@ifpb.edu.br
1 Instituto
Resumo—O uso de tecnologias minimalistas favorecem a convivência em níveis elevados de interação homem-máquina. Neste contexto, a compressão torna-se um recurso indispensável no desenvolvimento de aplicativos que, em muitos casos, são gerados de forma comprimida ou otimizada para tornar viável o uso em tais dispositivos. Considerando que o agente compressor software reconheça o tipo de informação que está sendo comprimida, é possível simplificar o processo de compressão e descompressão.
Neste trabalho, foram utilizados dicionários n-gramas como ferramenta de decisão na descompressão. Foi elaborado um esquema de codificação em quatro bits para representar trinta e sete caracteres. Os dicionários foram formados com base em listas de nomes, análise de frequência de n-gramas e análise da formação de palavras. Os algoritmos desenvolvidos podem ser utilizados na criação de dicionários adaptados a qualquer finalidade, não circunscrito ao tipo ou finalidade da informação e estendido a outros objetivos e aplicações O processo de codificação e decodificação apresentou uma taxa de acerto bastante promissora. Index Terms—Codificação, Decodificação, Compressão, Descompressão, n-Grama,
I. I NTRODUÇÃO
Bjetivo contínuo da informática, a compressão de dados é subsidiada por altos investimentos da indústria de softwares, bancos de dados e de empresas de segurança de dados [1]. A compressão utilizada nas transferências de dados merece destaque, sobretudo quando o armazenamento dos mesmos é realizado em dispositivos móveis com recursos de memória e processamento limitados [2]. Quanto menor for o