Projeto integrador
Artigo Original
Pré-processamento para mineração de dados sobre beneficiários de planos de saúde suplementar
Data mining pre-processing for beneficiaries of health insurance Procesamiento para la minerá de datos los beneficiarios de los planes de salud complementario Everton Fernando Barros1, Wesley Romão2, Ademir Aparecido Constantino3, Celso Lara de Souza4
RESUMO
Descritores: Base de Dados, Mineração de Dados, Planos de PréPagamento em Saúde Objetivo: O objetivo é preparar dados de um PSS para facilitar a utilização por algoritmos de mineração de dados (MD) e demonstrar uma metodologia para sua preparação. Métodos: Os métodos utilizados para preparar os dados foram propostos por Fayyad: entender o domínio da aplicação; criação de um conjunto de dados alvo; limpeza dos dados, redução e projeção dos dados. Essa metodologia foi aplicada de forma iterativa e interativa: iterativa porque realizou-se consultas a analistas de domínio e interativa porque alguns processos se repetem no decorrer da preparação. Resultados: Conseguiu-se organizar os dados, originalmente em um banco de dados relacional, em apenas uma tabela e reduzir o número de atributos em mais de 50%, além reduzir a quantidade de instâncias em 14%. Conclusão: Demonstrou-se um pré-processamento sobre dados de um PSS e obteve-se dados adequados para serem utilizados por algoritmos de MD.
ABSTRACT
Keywords: Database, Data Mining, Prepaid Health Plans Objective: The goal is to prepare data from a HI to facilitate the use of data mining (DM) algorithms and demonstrate a methodology for preparation of such data. Methods: The methods used to prepare these data are the methods proposed by Fayyad: understanding the application domain, create a set of target data, data cleansing, data reduction and projection. This methodology are both iterative and interactive. It is iterative by interviews with the domain analysts. It is interactive because the processes are repeated