Réutilisation des résultats dans R
Dans SAS, vous pouvez enregistrer les résultats des analyses statistiques à l'aide de l'Output Delivery System (ODS). Bien que l'ODS soit une amélioration considérable par rapport à PROC PRINTO, sa sophistication peut rendre certaines fonctionnalités très difficiles à apprendre (essayez de maîtriser PROC TEMPLATE). Dans SPSS, vous pouvez faire la même chose avec l'Output Management System (OMS). Là encore, ce n'est pas l'un des sujets les plus faciles à apprendre.
L'une des caractéristiques les plus utiles de R est que les résultats des analyses peuvent être facilement sauvegardés et utilisés pour d'autres analyses.
# Example 1
lm(mpg~wt, data=mtcars)
Cette opération permet d'effectuer une régression linéaire simple des miles par gallon sur le poids de la voiture en utilisant le cadre de données mtcars. Les résultats sont envoyés à l'écran. Rien n'est sauvé.
# Example 2
fit <- lm(mpg~wt, data=mtcars)
Cette fois, la même régression est effectuée mais les résultats sont enregistrés sous le nom de fit. Aucune sortie n'est envoyée à l'écran. Cependant, vous pouvez désormais manipuler les résultats.
# Example 2 (continued...)
str(fit) # view the contents/structure of "fit"
L'affectation a en fait créé une liste appelée "fit" qui contient un large éventail d'informations (y compris les valeurs prédites, les résidus, les coefficients, etc.
# Example 2 (continued again)
# plot residuals by fitted values
plot(fit$residuals, fit$fitted.values)
Pour savoir ce qu'une fonction renvoie, consultez la section " Valeur" de l'aide en ligne de cette fonction. Dans ce cas, nous examinerons help(lm).
Les résultats peuvent également être utilisés pour un large éventail d'autres fonctions.
# Example 2 (one last time, I promise)
# produce diagnostic plots
plot(fit)
# predict mpg from wt in a new set of data
predict(fit, mynewdata)
# get and save influence statistics
cook <- cooks.distance(fit)
Pratiquer
Pour vous entraîner à réutiliser des résultats dans des variables, essayez ce cours interactif sur l'introduction à la programmation R de DataCamp.