Teste
Lida om o armazenamento de documentos e a recuperação automática de informação associada a eles. É também uma ciência de pesquisa sobre busca por informações em documentos, busca pelos documentos propriamente ditos, busca por metadados que descrevam documentos e busca em banco de dados, sejam eles relacionais e isolados ou banco de dados interligados em rede de hipermídia, tais como a World Wide Web.
* Tradução Automática
É o processo automático de tradução de um idioma original para outro através do computador, que investiga o uso de programas computacionais para traduzir qualquer texto ou qualquer língua natural a outra.
Essa tradução usa técnicas de corpus, traduções mais complexas podem ser experimentas, levando em conta melhor o manejo das diferenças da tipologia linguística, reconhecimento de frases, e tradução de idiomas. A tradução não é uma coisa muito simples, não é uma mera substituição de cada palavra, mas ter a habilidade de conhecer "todas palavras" em uma frase ou oração e como uma pode influenciar a outra. As línguas humanas consistem em morfologia (o modo com que as palavras são montadas a partir de pequenas unidades de sentido), sintaxe (estrutura de frase), e semântica (sentido). Mesmo textos simples podem estar repletos de ambiguidades.
* Geração Automática de texto
É um domínio do tratamento automático da linguagem, cujo objetivo é o de gerar uma forma linguística a partir de dados brutos não linguísticos, a partir de uma representação formal de um conteúdo. Os primeiros sistemas (reais) de geração automática de texto foram no início dos anos 1970.
* Correção Ortogrática
* Extração de informação É a identificação de dados relevantes presentes nos documentos sem estruturação precisa, onde extrai informações relevantes baseando-se no provável domínio de conhecimento do documento. Também filtra o resultado de uma tarefa de RI(Recuperação de