Presentación
Dr. Byron González [email protected]
Dr. Ezequiel López [email protected]
Se ajusta un modelo polinomial de grado 2, para explicar el comportamiento de la tensión que soporta el papel, en relación con la concentración de la pulpa de madera. Es necesario importar el archivo de datos como se muestra a continuación.
library(readxl)
maderat<- read_excel("madera.y.tension.xlsx")
head(maderat)
Diagrama de dispersión
Graficar la relación entre la concentración de pulpa de madera y la tensión
plot(maderat$madera,maderat$tension, xlab="Concentración de pulpa de madera", ylab="Tensión", col="red", lwd=3)
Instalar los paquetes Performance y see
El procedimiento de ajuste, requiere la instalación como se muestra enseguida
install.packages("performance")
install.packages("see")
Ajuste de un modelo polinomial de grado 1
El análisis inicia con evaluar el ajuste de un modelo de regresión lineal simple, que no resulta adecuado. Note el comportamiento de los residuales, que describe la forma de parábola.
# Ajuste de un modelo lineal simple
library(performance)
mad1<- lm(tension~madera, data=maderat)
summary(mad1)
check_model(mad1)
Ajuste de un modelo polinómico de grado 2 con intercepto
Se repite el procedimiento de ajuste, con la definición de un modelo cuadrático. Note la mejora en el comportamiento de los residuales, y la homogeneidad de varianzas. No se aprecian puntos de influencia, aunque los VIF son superiores a 10. Es necesario remover el intercepto del modelo.
mad2<- lm(tension~madera+I(madera^2), data=maderat)
summary(mad2)
check_model(mad2)
Ajuste de modelo polinómico de grado 2 sin intercepto
Observe que se agrega el valor de -1 al modelo, para eliminar la estimación del intercepto. Se obtiene un modelo con mejor ajuste, aunque los VIF son elevados.
# Procedimiento 1 para obtener al ajuste del modelo de grado 2 sin intercepto
mad3<- lm(tension~-1+madera+I(madera^2), data=maderat)
summary(mad3)
check_model(mad3)
# Procedimiento 2 para obtener al ajuste del modelo de grado 2 sin intercepto
mad4<- lm(tension~-1+poly(madera,2, raw=TRUE), data=maderat)
summary(mad4)
check_model(mad4)
Revisar la normalidad de los residuos del modelo seleccionado, sin intercepto
Se calcula el valor del estadístico de Shapiro & Wilk y su p-value para verificar el cumplimiento del supuesto de normalidad de los residuos
check_normality(mad3)