Text mining com weka
Mariana de Azevedo Santos¹, Clayton Ferreira Santos¹
¹Departamento de Ciência da Computação – Universidade Federal de Lavras (DCC/UFLA) Lavras – MG – Brasil – CEP 37200-000 {mariana@bsi.ufla.br},{claytonfs@hotmail.com}
Introdução Os sistemas e-learning tem se tornado uma solução viável para a instrução e aquisição do conhecimento (ROSENBERG, 2001). Muito além da simples função de prover diversas ferramentas que auxiliam no aprendizado do aluno, esses sistemas acumulam muitas informações úteis para a realização de vários tipos de estudos na área educacional (ROMERO, VENTURA & GARCIA, 2008). Uma vez que se consegue gerar uma grande quantidade de dados oriundos destes sistemas, gerenciar e analisar essas informações torna-se uma tarefa não trivial. No ponto de vista computacional, as informações podem ser facilmente processadas utilizando Mineração de Dados (Data Mining). Mineração de Dados é um processo em que se executam várias análises estatísticas e de inteligência artificial em base de dados estruturados e de dados numéricos (CHEN, 2001). Uma das áreas recorrentes na Mineração de Dados para o tratamento de informações textuais é a Mineração de Texto (Text Mining). A área de Mineração de Texto (Text Mining) tem por objetivo a execução de funções de pesquisa, análise lingüística, e categorizações de palavras. Este trabalho tem como objetivo a análise textual em uma sala de um ambiente de aprendizado virtual o Moodle. Através de algoritmos de Mineração de Texto (Text Mining), foi possível a extração e classificação de informações que são relevantes e não relevantes ao contexto de aprendizado do aluno na disciplina. Mineração de Texto (Text Mining) A Mineração de Texto é o estudo e a prática de extrair informação de textos usando os princípios da lingüística computacional (SULLIVAN, 2001). Segundo Yangarber e Grishman apud Zavaglia et al. (2005), extração de