Presentación y lectura de datos
Dr. Byron González [email protected]
Dr. Ezequiel López [email protected]
Los datos presentados corresponden a un estudio realizado con el propósito de conocer la salinidad de las aguas de riego de un sistema hidrográfico, medida a través de diferentes variables: conductividad eléctrica, cationes, aniones, y pH. En general, se determinó que los ríos se clasifican como salinos y muy altamente salinos, de acuerdo a la salinidad cuantitativa.
El artículo de donde provienen los datos está disponible aquí, en tanto que el archivo de datos puede obtenerse aquí.
En este ejercicio, se describe la correlación entre algunas de las variables medidas.
Previo a iniciar el análisis, se importa el archivo de datos de la siguiente manera:
library(readxl)
salin<-read_excel("salinidad.xlsx")
head(salin)Instalación y solicitud de paquetes
Se hará uso de tres paquetes para solicitar diferentes tipos de gráficos y calcular el coeficiente de correlación de Pearson, para distintas parejas de variables. Estos paquetes deben instalarse y luego solicitarse.
# Instalación de los paquetes requeridos
install.packages("corrplot")
install.packages("ggcorrplot")
# Solicitar los paquetes requeridos
library(corrplot)
library(ggcorrplot)Solicitar correlogramas tipo círculo y elipse
Ambos correlogramas brindan la misma información sobre la correlación, con diferente estilo de presentación. Debe notarse correlación positiva fuerte para el color azul intenso y correlación inversa fuerte para el color rojo.
De esta manera, observe la correlación positiva alta entre el Calcio (Ca2+) y la conductividad eléctrica (CE)
corrplot(cor(salin), method="circle")
corrplot(cor(salin), method="ellipse")Solicitar otras vistas de correlogramas
Los tres correlogramas siguientes, muestran el comportamiento del coeficiente de correlación de Pearson entre parejas de variables. El primer correlograma es de tipo numérico. El segundo solamente muestra la esquina superior, en tanto que el tercero muestra solamente la esquina inferior.
corrplot(cor(salin), method="number")
corrplot(cor(salin), type="upper")
corrplot(cor(salin), type="lower")Correlograma tipo "mapa de calor"
El primer correlograma se muestra completo en un diferencial de color dependiendo de la intensidad de la relación entre variables. En tanto que, el segundo muestra solamente la esquina inferior y añade el valor numérico del coeficiente de correlación de Pearson.
sal<-cor(salin)
ggcorrplot(sal)
ggcorrplot(sal, type="lower", lab=T)Matriz con diagramas de dispersión y coeficientes
Este gráfico muestra en simultáneo, los diagramas de dispersión para cada pareja de variables, y agrega el valor del coeficiente de correlación de Pearson, junto a su significancia, indicada mediante asteriscos. Significa que, todo coeficiente con tres astericos, es altamente significativo.
# Instalar el paquete PerformanceAnalytics
install.packages("PerformanceAnalytics")# Solicitar la matriz de diagramas de dispersión
library(PerformanceAnalytics)
chart.Correlation(salin, histogram = T)