Exercício Mineração de dados
(Resolução em folha avulsa) b - Supondo que tais valores correspondem aos assumidos em um experimento por uma variável aleatória X, estime sua média E[X] = _, E[X2], variância, o desvio padrão e o desvio médio absoluto
(Resolução em folha avulsa) c - X é uma variável aleatória ou contínua?
(Resolução em folha avulsa)
2) Suponha um problema de regressão com um vetor de parâmetros (atributos) de entrada x E R², x = (x1; x2) e classe de saída y 2 R. Dado o conjunto de dados T abaixo, faça o que se pede.
i) Normalize os atributos (incluindo a classe) utilizando a técnica de reescala (min-max) e em seguida calcule as matrizes de covariância e correlação.
Os passos para que a matriz de covariância e Correlação sejam calculadas, primeiramente aplicamos a normalização dos dados, a técnica que será utilizada será a técnica de reescala. Os valores originais irão assumir valores entre 0 e 1, estes valores são equivalentes ao valor original em relação aos demais valores do conjunto.
Dados Originais x1 x2 y 0,50 0,70 1,50 1,00 1,10 1,10 1,10 0,90 1,00 1,50 1,60 1,60 1,90 2,20 2,00 2,00 1,60 1,80 2,20 2,90 2,30 2,30 2,70 2,50
2,50 2,40 1,00 3,10 3,00 3,00
Dados após normalização x1 x2 y
0 0 0,25
0,192308 0,173913 0,05
0,230769 0,086957 0
0,384615 0,391304 0,3
0,538462 0,652174 0,5
0,576923 0,391304 0,4
0,653846 0,956522 0,65
0,692308 0,869565 0,75
0,769231 0,73913 0
1 1 1
A seguir os dados serão tratados para que possamos gerar a matriz de covariância e correlação. A Matriz de correlação entre duas variáveis pode ser operacionalizada a partir da seguinte forma:
corr(X,Y)= □(1/n ∑_(i=1)^n▒〖((X_1- X ̅)/(dp(x)))〗) (