Statistiques de rééchantillonnage dans R
Le logiciel Coin permet d'effectuer une grande variété de tests statistiques basés sur la ré-randomisation ou la permutation. Ces tests ne supposent pas un échantillonnage aléatoire à partir de populations bien définies. Elles peuvent constituer une alternative raisonnable aux procédures classiques lorsque les hypothèses de test ne peuvent être respectées. Voir pièce de monnaie : Un cadre informatique pour l'inférence conditionnelle pour plus de détails.
Dans les exemples ci-dessous, les lettres minuscules représentent des variables numériques et les lettres majuscules des facteurs catégoriels. Des simulations de Monte-Carlo sont disponibles pour tous les tests. Des tests exacts sont disponibles pour deux procédures de groupe.
Tests de localisation indépendants à deux et à K échantillons
# Exact Wilcoxon Mann Whitney Rank Sum Test
# where y is numeric and A is a binary factor
library(coin)
wilcox_test(y~A, data=mydata, distribution="exact")
# One-Way Permutation Test based on 9999 Monte-Carlo
# resamplings. y is numeric and A is a categorical factor
library(coin)
oneway_test(y~A, data=mydata,
distribution=approximate(B=9999))
Symétrie d'une réponse pour des mesures répétées
# Exact Wilcoxon Signed Rank Test
# where y1 and y2 are repeated measures
library(coin)
wilcoxsign_test(y1~y2, data=mydata, distribution="exact")
# Freidman Test based on 9999 Monte-Carlo resamplings.
# y is numeric, A is a grouping factor, and B is a
#
blocking factor.
library(coin)
friedman_test(y~A|B, data=mydata,
distribution=approximate(B=9999))
Indépendance de deux variables numériques
# Spearman Test of Independence based on 9999 Monte-Carlo
# resamplings. x and y are numeric variables.
library(coin)
spearman_test(y~x, data=mydata,
distribution=approximate(B=9999))
Indépendance dans les tableaux de contingence
# Independence in 2-way Contingency Table based on
# 9999 Monte-Carlo resamplings. A and B are factors.
library(coin)
chisq_test(A~B, data=mydata,
distribution=approximate(B=9999))
# Cochran-Mantel-Haenzsel Test of 3-way Contingency Table
# based on 9999 Monte-Carlo resamplings. A, B, are
factors
# and C is a stratefying factor.
library(coin)
mh_test(A~B|C, data=mydata,
distribution=approximate(B=9999))
# Linear by Linear Association Test based on 9999
#
Monte-Carlo resamplings.
A and B are ordered factors.
library(coin)
lbl_test(A~B, data=mydata,
distribution=approximate(B=9999))
De nombreux autres tests univariés et multivariés sont possibles à l'aide des fonctions du module coin . Pour plus de détails, voir Un système Lego pour l'inférence conditionnelle.
Pratiquer
Essayez les exercices de ce cours sur l'analyse de données et l'inférence statistique en R.