Mineração de dados
Curso em 1 slide
Introdução n Avanços recentes nas tecnologias de aquisição, transmissão e armazenamento de dados Bases de
dados cada vez
maiores
Introdução n Estima-se que a quantidade de dados em Bases de
Dados mundiais dobra a cada 20 anos
n
Crescimento tem ocorrido em várias áreas q q q q q q q Transações bancárias
Utilização de cartões de crédito
Dados governamentais
Medições ambientais
Dados clínicos
Projetos genoma
Informações disponíveis na web
Introdução
Número de páginas na web
Crescimento do GenBank
1982-2005
Seqüências (milhões)
Fonte: Genbank
Pares de bases seqüências 1982 1986 1990 1994 1998 2002
Pares de bases de DNA (bilhões)
Introdução
Introdução
Incidentes de segurança na Internet brasileira
Introdução
Incidentes de segurança na Internet brasileira
Introdução n Alguns números: q Transações eletrônicas n q
Controle e monitoramento n q
BD Wal-Mart: 20 milhões transações / dia
BD NASA: recebe de satélites 50 GB / hora
Dispositivos de armazenamento massivo n Mobil Data Warehouse: 100 TB de dados armazenados
Pesquisas KDnuggets n Maiores bancos de dados minerados q Fonte: n n n http://www.kdnuggets.com/polls/2006/ largest_database_mined.htm Data: junho de 2006
181 votantes
Pesquisas KDnuggets n Maiores bancos de dados minerados
Introdução n Bases de Dados muito grandes podem conter (esconder) dados e informações preciosos n
Existe um interesse crescente em explorar esses dados armazenados q q
Descobrir conhecimento novo e útil
Ferramenta de suporte a decisão
Poder dos dados
Poder dos dados
Poder dos dodos
Introdução n Técnicas tradicionais de análise de dados permitem apenas consultas simples q q
q
Quantos itens de um produto em particular foram vendidos em um