Accéder au contenu principal
Documents
Partager
LinkedIn
Facebook
Twitter
Copy
R DocumentationEntrée de données en RGestion des données en RGraphiques en RR InterfaceStatistiques en R

Corrélations dans R

Vous pouvez utiliser la fonction cor( ) pour produire des corrélations et la fonction cov ( ) pour produire des covariances.

Un format simplifié est cor(x, use=, method= )

   
Option Description
x Matrice ou cadre de données
use Spécifie le traitement des données manquantes. Les options sont all.obs (suppose qu'il n'y a pas de données manquantes - les données manquantes produiront une erreur), complete.obs (suppression par liste), et pairwise.complete.obs (suppression par paire).
méthode Spécifie le type de corrélation. Les options sont pearson, spearman ou kendall.
# Correlations/covariances among numeric variables in
# data frame mtcars. Use listwise deletion of missing data.
cor(mtcars, use="complete.obs", method="kendall")
cov(mtcars, use="complete.obs")

Malheureusement, ni cor( ) ni cov( ) ne produisent de tests de signification, bien que vous puissiez utiliser la fonction cor.test( ) pour tester un seul coefficient de corrélation.

La fonction rcorr( ) du package Hmisc produit des corrélations/covariances et des niveaux de signification pour les corrélations de Pearson et de Spearman. Cependant, l'entrée doit être une matrice et la suppression par paire est utilisée.

# Correlations with significance levels
library(Hmisc)
rcorr(x, type="pearson") # type can be pearson or spearman

#mtcars is a data frame
rcorr(as.matrix(mtcars))

Vous pouvez utiliser le format cor(X, Y) ou rcorr(X, Y) pour générer des corrélations entre les colonnes de X et les colonnes de Y. Ceci est similaire aux commandes VAR et WITH dans SAS PROC CORR.

# Correlation matrix from mtcars
# with mpg, cyl, and disp as rows
# and hp, drat, and wt as columns
x <- mtcars[1:3]
y <- mtcars[4:6]
cor(x, y)

Autres types de corrélations

# polychoric correlation
# x is a contingency table of counts
library(polycor)
polychor(x)

# heterogeneous correlations in one matrix
# pearson (numeric-numeric),
# polyserial (numeric-ordinal),
# and polychoric (ordinal-ordinal)
# x is a data frame with ordered factors
# and numeric variables
library(polycor)
hetcor(x)

# partial correlations
library(ggm)
data(mydata)
pcor(c("a", "b", "x", "y", "z"), var(mydata))
# partial corr between a and b controlling for x, y, z

Visualisation des corrélations

Utilisez corrgram( )pour tracer des corrélogrammes.

Utilisez les fonctions pairs()ou splom( )pour créer des matrices de nuage de points.

Pratiquer

Essayez ce cours interactif sur l'apprentissage supervisé dans R : Régression