Mortes nas prais portuguesas
Este trabalho de insere-se no âmbito da cadeira de Sistemas de Apoio à Decisão e compreende a estruturação, organização e análise de dados de forma a auxiliar a decisão em problemas complexos que carecem de especificação. Pretende-se assim criar um sistema de apoio a decisão através do Data Mining uma técnica de Business Intelligence de maneira a extrair informação desconhecida a partir de bases de dados utilizando essa informação como suporte à previsão de acidentes nas praias nacionais.
O Data Mining é uma área vasta que junta técnicas de visualização de dados, estruturação de dados, estatística e verificação de padrões. Os principais objetivos no Data Mining são a predição e descrição de dados. A predição consiste na previsão de uma variável objetivo a partir da visualização e estruturação de um conjunto de variáveis. A descrição de dados é a descoberta de padrões nos dados por forma a descrevê-los.
O projeto em si consiste na seleção de dados históricos relativos a mortos nas praias nacionais sendo que os resultados obtidos servem para fazer uma predição de referência, para tal foi necessária uma escolha seletiva dos dados de forma a não desprezar informação útil mas simplificada.
2. DADOS 3.1 Planeamento de Recolha
No início do processo de recolha de dados em qualquer trabalho de Data Mining é importante ter conhecimento do universo de dados que vamos manipular. Na fase inicial de qualquer trabalho de Data Mining é essencial o conhecimento a fundo do universo de dados envolventes de forma a fazer uma seleção dos dados mais relevantes. Para este estudo utilizámos os dados estatísticos pertencentes ao Instituto de Socorro a Náufragos (I.S.N.) entre 2007 e 2011. Para este período de 5 anos dispomos de N registos.
A seleção dos dados é um processo demorado e bastante rigoroso que requer uma certa experiência em data Mining e em processos de seleção. No nosso caso, a grande dificuldade foi enquadrar as varáveis dentro de