4
Conclusões e Trabalhos Futuros
A utilização de técnicas de aprendizagem de máquina na categorização de textos não é uma tarefa trivial, pois envolve uma série de decisões inerentes às técnicas de aprendizagem utilizadas, bem como a escolha de métodos que melhor representem as informações, ou seja, os métodos de pré- processamento. Um grande problema apresentado na categorização de documentos é alta dimensionalidade dos textos, fazendo-se necessário um pré-processamento custoso, a fim de alcançar uma representação dos dados adequada para o aprendizado de máquina, e algoritmos de aprendizado que apresentem soluções para lidar com um espaço de entradas tão grande. O objetivo deste trabalho foi realizar um estudo comparativo da utilização de técnicas de aprendizagem de máquina combinadas ao uso