Artigo computacoa evolutiva

633 palavras 3 páginas
-------------------------------------------------
Clusterização de Banco de dados
Douglas Kenji Otsuka

Resumo
Atualmente um banco de dados de grandes empresa contem muitas informações sendo que nem a capacidade humana poderia processar essa quantidade de dados.
Com isso vem a motivação de encontrar grupos com certas semelhanças, Clusterização , foram desenvolvidas diversas técnicas computacionais capazes de realizar esses dados .
Já foram usado algoritmo genético para essa abordagem e os resultados foram bons[1].
Neste trabalho será usado o Particle Swarm Optimization (PSO) que é uma técnica baseada no comportamento social bastante nova que vem sendo aplicada com sucesso a diversos tipos de problemas.

Introdução

Clustering, também conhecido como Agrupamento ou Clusterização, é uma das principais tarefas de descoberta de conhecimento a partir de bancos de dados, e consiste em encontrar grupos em um certo conjunto de dados. Cada grupo contém objetos similares entre si e diferentes daqueles em outros grupos. Para Merwe e Engelbrecht (2003), Data Clustering é o processo de reunir em grupos, vetores de dados multidimensionais similares , Data Clustering tem aplicações em diversas áreas como Biologia, Pesquisa de Mercado, Processamento de Imagens, Reconhecimento de Padrões, Geografia, e muitas outras
De acordo com Han e Kamber (2001), os principais métodos de Clusterização podem ser classificados nas seguintes categorias: Métodos de Particionamento, Métodos Hierárquicos ,Métodos Baseados em Densidade ,Métodos Baseados em Grid ,Métodos Baseados em Modelos .
A Clusterização já foi usado com algoritmos genético usando 3 bancos de dados Iris, Wine e Web, os Banco de dados Iris e Wine são encontrados UCI Machine Learning Repository. O resultado foram satisfatórios resultados obtidos com o banco Web não foram conclusivos. Pois Iris e Wine dispunham de um banco de dados bastante diversificado representativa.

Relacionados