T ECNOLOGIAS DA I NFORMAÇÃO E C OMUNICAÇÃO
282 palavras
2 páginas
RESUMOAtualmente
, o volume de informação gerado aumenta expo nencialmente, sendo que uma parcela significativa das informações encontra
-
se em formato textual.
A partir desse formato é possível extrair determinados conhecimento
s.
Entretanto, f ace ao grande volume de informações disponíveis, seja na web ou mesmo nas organizações, tal tarefa constitui
-
se como um desafio computacional .
Superado os obstáculos, o conhecimento obtido através de informações textuais pode ser utilizado na tomada de decisão com o intuito de gerar vantagem competitiva. Um dos meio s de se extrair conhecimento é através da utilização do processo de
D
escoberta de
C
onhecimento em Bases de Dados e , n o caso de informações textuais
,
através d o processo de
D
escoberta de
C
onhecimento em
T
extos.
De maneira geral, o s processos de descoberta de conhecimento tradicionais são custos os quando aplicados em grande s coleções de documentos, por exemplo
,
a web
. Com este pressuposto é proposto neste trabalho uma arquitetura para descoberta de conhecimento a partir de bases textuais almejando sua utilização em grandes fontes de informação.
Para
atingir este objetivo
,
a proposta utiliza, além d a computação distribuída visando o aumento de desempenho , um modelo com base n o conceito de correlação rápida. A demonstração de viabilidade é realizada através de um protótipo que implementa a arquitetura propost a
. O protótipo tem a capacidade de gerar informações que relacionam padrões textuais (termos) e de permitir uma visão d a evolução temporal em determinado domínio de problema.
A aplicação do protótipo em um cenário possibilitou demonstrar que a arquitetura proposta é capaz de obter resultados consistentes e satisfatórios, tanto para o entendimento de determinado domínio, quanto para a análise de grandes bases textuais