Accéder au contenu principal
Documents
Partager
LinkedIn
Facebook
Twitter
Copy
R DocumentationEntrée de données en RGestion des données en RGraphiques en RR InterfaceStatistiques en R

R Tutoriel

Obtention de R

R est disponible pour Linux, MacOS et Windows. Le logiciel peut être téléchargé à partir du Comprehensive R Archive Network (CRAN).

Démarrage

Une fois R téléchargé et installé, il vous suffit de le rechercher et de le lancer à partir de votre dossier Applications.

r programme

Saisie des commandes

R est un programme en ligne de commande. L'utilisateur saisit les commandes à l'invite ( > par défaut) et chaque commande est exécutée une à la fois.

r console

L'espace de travail

L'espace de travail est votre environnement de travail R actuel et comprend tous les objets définis par l'utilisateur (vecteurs, matrices, cadres de données, listes, fonctions). À la fin d'une session R, l'utilisateur peut enregistrer une image de l'espace de travail actuel qui sera automatiquement rechargée lors du prochain démarrage de R.

Interfaces utilisateur graphiques

Outre la console R intégrée, RStudio est l'éditeur de code R le plus populaire, et il s'interface avec R pour les plateformes Windows, MacOS et Linux.

Opérateurs dans R

Les opérateurs binaires et logiques de R sont très familiers aux programmeurs. Notez que les opérateurs binaires fonctionnent sur les vecteurs et les matrices ainsi que sur les scalaires.

Les opérateurs arithmétiques comprennent

   
Opérateur Description
+ complément
- soustraction
* multiplication
/ division
^ ou ** exponentiation

Les opérateurs logiques comprennent

   
Opérateur Description
> supérieur à
>= supérieur ou égal à
== exactement égal à
!= n'est pas égal à

Types de données

R dispose d'une grande variété de types de données, notamment les scalaires, les vecteurs (numériques, de caractères, logiques), les matrices, les cadres de données et les listes.

Création de nouvelles variables

Utilisez l'opérateur d'affectation <- pour créer de nouvelles variables.

# An example of computing the mean with variables

mydata$sum <- mydata$x1 + mydata$x2
mydata$mean <- (mydata$x1 + mydata$x2)/2

Fonctions

Presque tout dans R se fait par l'intermédiaire de fonctions. Une fonction est un morceau de code écrit pour effectuer une tâche spécifique ; elle peut accepter des arguments ou des paramètres (ou non) et elle peut renvoyer une ou plusieurs valeurs (ou non !). Dans R, une fonction est définie par la construction :

function ( arglist ) {body}

Le code entre les accolades est le corps de la fonction. Notez qu'en utilisant des fonctions intégrées, la seule chose dont vous devez vous préoccuper est de savoir comment communiquer efficacement les arguments d'entrée corrects (arglist) et gérer la/les valeur(s) de retour (le cas échéant).

Importation de données

L'importation de données dans R est assez simple. R offre des options pour importer de nombreux types de fichiers, des CSV aux bases de données.

Par exemple, voici comment importer un fichier CSV dans R.

# first row contains variable names, comma is separator
# assign the variable id to row names
# note the / instead of \ on mswindows systems

mydata <- read.table("c:/mydata.csv", header=TRUE,
  sep=",", row.names="id")

Statistiques descriptives

R offre un large éventail de fonctions permettant d'obtenir des statistiques sommaires. Une façon d'obtenir des statistiques descriptives est d'utiliser la fonction sapply( ) avec une statistique récapitulative spécifiée.

Vous trouverez ci-dessous comment obtenir la moyenne à l'aide de la fonction sapply( ) :

# get means for variables in data frame mydata
# excluding missing values
sapply(mydata, mean, na.rm=TRUE)

Les fonctions possibles utilisées dans sapply comprennent mean, sd, var, min, max, median, range, et quantile.

Tracé dans R

En R, les graphiques sont généralement créés de manière interactive. En voici un exemple :

# Creating a Graph
attach(mtcars)
plot(wt, mpg)
abline(lm(mpg~wt))
title("Regression of MPG on Weight")

La fonction plot( ) ouvre une fenêtre graphique et trace le poids en fonction des miles par gallon. La ligne de code suivante ajoute une ligne de régression à ce graphique. La dernière ligne ajoute un titre.

tracé en r

Emballages

Les paquets sont des collections de fonctions R, de données et de code compilé dans un format bien défini. Le répertoire dans lequel les paquets sont stockés s'appelle la bibliothèque. Le R est livré avec un ensemble standard de paquets. D'autres sont disponibles pour le téléchargement et l'installation. Une fois installés, ils doivent être chargés dans la session pour être utilisés.

.libPaths() # get library location
library()   # see all packages installed
search()    # see packages currently loaded

Obtenir de l'aide

Une fois R installé, vous disposez d'un système d'aide intégré complet. À l'invite de commande du programme, vous pouvez utiliser l'une des options suivantes :

help.start()   # general help
help(foo)      # help about function foo
?foo           # same thing
apropos("foo") # list all functions containing string foo
example(foo)   # show an example of function foo

Aller plus loin

Si vous préférez un environnement interactif en ligne pour apprendre R, ce tutoriel R gratuit de DataCamp est un excellent moyen de commencer.