Análise estatística multivariada
O problema apresentado procura relacionar propriedades de fibras de celulose com a qualidade do papel feito a partir delas. Para isso, foram coletadas, de 62 amostras, medições referentes a quatro propriedades das fibras (comprimento de fibra, fração de fibras longas, fração de fibras finas e força de tração) e quatro propriedades do papel resultante (comprimento de ruptura, elasticidade, tensão de ruptura e resistência).
O trabalho tem como objetivo modelar a relação entre cada uma das variáveis resposta e as características das fibras e comparar com o modelo completo, que relaciona todas as variáveis resposta a todas as características disponíveis das fibras.
2.Metodologia
Primeiramente, ajustamos um modelo de regressão múltipla para cada variável resposta Yi, de modo que tivéssemos um modelo mais explicativo usando o menor número de regressores possível. Para isso utilizamos o coeficiente de determinação R² e avaliamos o modelo que explica um maior percentual da variável resposta, excluindo as variáveis independentes que provocam uma pequena variação nesse coeficiente em relação ao modelo completo. Posteriormente, faz-se uma análise de resíduos de cada modelo múltiplo com o objetivo de checar as suposições do modelo (independência e normalidade dos erros, homocedasticidade da variância, etc.) e detectar possíveis outliers. Após a verificação das suposições do modelo, foi construído um intervalo de 95% de confiança para um novo vetor de observações das características da fibra. Após a análise univariada fazemos o ajuste de um modelo multivariado para o conjunto de dados, achando a matriz de coeficientes e a matriz de correlação dos erros. Feito o ajuste, checamos através da análise de resíduos a presença de outliers no modelo. Assim, construímos um intervalo de confiança simultâneo para a nova observação (a mesma utilizada no caso univariado) e comparamos com o intervalo encontrado anteriormente.
3. Aplicação
3.1. Descrição da