Senhor
Gesualdo Crocco Stanley Loh < sloh@terra.com.br> – Orientador
Universidade Luterana do Brasil (Ulbra) – Curso de Ciência da Computação – Câmpus Canoas Av. Farroupilha, 8.001 – Bairro São José – CEP 92425-900 – Canoas/RS
29 de novembro de 2010
RESUMO
Existe hoje na internet, uma quantidade infinita de informações, que crescem de acordo com a maior interação dos usuários, sendo que o acompanhamento e a compreensão dos acontecimentos de uma notícia se tornam uma tarefa mais complicada a cada dia. Tendo esta motivação em vista, neste trabalho realizou-se um estudo e a implementação de um protótipo capaz de buscar notícias sobre tópicos específicos em fontes monitoradas e agrupálas em subtópicos, com a expectativa de facilitar a compreensão do desenvolver dos fatos do tópico em questão. Buscando os principais conceitos de processamento de texto e de mineração de dados na literatura, diversas técnicas e algoritmos foram estudados e analisados, com o intuito de escolher uma técnica e implementá-la num sistema online de fácil utilização capaz de executar para o usuário tal tarefa. Neste documento serão apresentados os estudos envolvidos neste trabalho, bem como a avaliação e os resultados da implementação deste sistema. Palavras-chave: Clipping; Cluster; Clusterização; Agrupamento; Cliques; Star; Similaridade.
ABSTRACT
Title: “Grouping by similarity of texts for web clipping system: Cluster Clipping” The Internet has an infinite amount of information, which grows according to user interaction, which makes monitoring and understanding the events of a story a task more complicated every day. Having this motivation in mind, this work was carried out the study and implementation of a prototype able to get news about specific topics in monitored sources and group them into subtopics, expecting to facilitate understanding of the fact. Several techniques and algorithms were used,