LINGUÍSTICA DE CORPUS
TEORIA, INTERFACES E APLICAÇÕES
Lúcia Pacheco de Oliveira
(PUC-Rio/FAPERJ)
RESUMO
O objetivo deste trabalho é apresentar uma visão geral da
Linguística de Corpus, caracterizando-a como uma área do conhecimento; levando em consideração sua interface com outras áreas; e ilustrando suas aplicações, com foco mais específico no português do Brasil. Para atingir este objetivo, este artigo discute características da Linguística de Corpus que a distinguem de outras áreas, tais como: (1) a perspectiva de linguagem que adota e a forma de fazer pesquisas empíricas, com auxílio de ferramentas computacionais e com base em evidências linguísticas extraídas de corpora; (2) a possibilidade de trazer contribuições teóricas para os estudos da linguagem, através de novas descrições de diferentes usos da língua; (3) as interfaces de pesquisa com outras áreas, tais como Linguística Sistêmico-Funcional, Linguística
Aplicada e Linguística Computacional; (4) o desenvolvimento da área, inclusive no Brasil, devido às novas perspectivas que possibilita em relação à lexicografia, léxico-gramática, estudos da variação linguística em gêneros discursivos e estudos interculturais.
Através da discussão dos pontos acima, espera-se indicar que a
Linguística de Corpus é uma área que permite o aprofundamento sobre o conhecimento empírico de diferentes línguas estudadas, levando a novas concepções teóricas sobre a linguagem, não podendo ser considerada, portanto, apenas como uma metodologia de análise. No final do trabalho, serão brevemente apresentadas três pesquisas que incluem dados da língua portuguesa, visando exemplificar aplicações da Linguística de Corpus para o estudo do uso do português. Esses trabalhos foram desenvolvidos a partir do CORPOBRAS PUC-Rio, compilado com o objetivo de ser um corpus representativo do português do Brasil1 .
PALAVRAS-CHAVE: linguística de corpus, teoria e corpus, pesquisa empírica, corpus do português do Brasil,