R Tutoriel
Obtention de R
R est disponible pour Linux, MacOS et Windows. Le logiciel peut être téléchargé à partir du Comprehensive R Archive Network (CRAN).
Démarrage
Une fois R téléchargé et installé, il vous suffit de le rechercher et de le lancer à partir de votre dossier Applications.
Saisie des commandes
R est un programme en ligne de commande. L'utilisateur saisit les commandes à l'invite ( > par défaut) et chaque commande est exécutée une à la fois.
L'espace de travail
L'espace de travail est votre environnement de travail R actuel et comprend tous les objets définis par l'utilisateur (vecteurs, matrices, cadres de données, listes, fonctions). À la fin d'une session R, l'utilisateur peut enregistrer une image de l'espace de travail actuel qui sera automatiquement rechargée lors du prochain démarrage de R.
Interfaces utilisateur graphiques
Outre la console R intégrée, RStudio est l'éditeur de code R le plus populaire, et il s'interface avec R pour les plateformes Windows, MacOS et Linux.
Opérateurs dans R
Les opérateurs binaires et logiques de R sont très familiers aux programmeurs. Notez que les opérateurs binaires fonctionnent sur les vecteurs et les matrices ainsi que sur les scalaires.
Les opérateurs arithmétiques comprennent
Opérateur | Description |
+ | complément |
- | soustraction |
* | multiplication |
/ | division |
^ ou ** | exponentiation |
Les opérateurs logiques comprennent
Opérateur | Description |
> | supérieur à |
>= | supérieur ou égal à |
== | exactement égal à |
!= | n'est pas égal à |
Types de données
R dispose d'une grande variété de types de données, notamment les scalaires, les vecteurs (numériques, de caractères, logiques), les matrices, les cadres de données et les listes.
Création de nouvelles variables
Utilisez l'opérateur d'affectation <- pour créer de nouvelles variables.
# An example of computing the mean with variables
mydata$sum <- mydata$x1 + mydata$x2
mydata$mean <- (mydata$x1 + mydata$x2)/2
Fonctions
Presque tout dans R se fait par l'intermédiaire de fonctions. Une fonction est un morceau de code écrit pour effectuer une tâche spécifique ; elle peut accepter des arguments ou des paramètres (ou non) et elle peut renvoyer une ou plusieurs valeurs (ou non !). Dans R, une fonction est définie par la construction :
function ( arglist ) {body}
Le code entre les accolades est le corps de la fonction. Notez qu'en utilisant des fonctions intégrées, la seule chose dont vous devez vous préoccuper est de savoir comment communiquer efficacement les arguments d'entrée corrects (arglist) et gérer la/les valeur(s) de retour (le cas échéant).
Importation de données
L'importation de données dans R est assez simple. R offre des options pour importer de nombreux types de fichiers, des CSV aux bases de données.
Par exemple, voici comment importer un fichier CSV dans R.
# first row contains variable names, comma is separator
# assign the variable id to row names
# note the / instead of \ on mswindows systems
mydata <- read.table("c:/mydata.csv", header=TRUE,
sep=",", row.names="id")
Statistiques descriptives
R offre un large éventail de fonctions permettant d'obtenir des statistiques sommaires. Une façon d'obtenir des statistiques descriptives est d'utiliser la fonction sapply( ) avec une statistique récapitulative spécifiée.
Vous trouverez ci-dessous comment obtenir la moyenne à l'aide de la fonction sapply( ) :
# get means for variables in data frame mydata
# excluding missing values
sapply(mydata, mean, na.rm=TRUE)
Les fonctions possibles utilisées dans sapply comprennent mean, sd, var, min, max, median, range, et quantile.
Tracé dans R
En R, les graphiques sont généralement créés de manière interactive. En voici un exemple :
# Creating a Graph
attach(mtcars)
plot(wt, mpg)
abline(lm(mpg~wt))
title("Regression of MPG on Weight")
La fonction plot( ) ouvre une fenêtre graphique et trace le poids en fonction des miles par gallon. La ligne de code suivante ajoute une ligne de régression à ce graphique. La dernière ligne ajoute un titre.
Emballages
Les paquets sont des collections de fonctions R, de données et de code compilé dans un format bien défini. Le répertoire dans lequel les paquets sont stockés s'appelle la bibliothèque. Le R est livré avec un ensemble standard de paquets. D'autres sont disponibles pour le téléchargement et l'installation. Une fois installés, ils doivent être chargés dans la session pour être utilisés.
.libPaths() # get library location
library() # see all packages installed
search() # see packages currently loaded
Obtenir de l'aide
Une fois R installé, vous disposez d'un système d'aide intégré complet. À l'invite de commande du programme, vous pouvez utiliser l'une des options suivantes :
help.start() # general help
help(foo) # help about function foo
?foo # same thing
apropos("foo") # list all functions containing string foo
example(foo) # show an example of function foo
Aller plus loin
Si vous préférez un environnement interactif en ligne pour apprendre R, ce tutoriel R gratuit de DataCamp est un excellent moyen de commencer.