Accéder au contenu principal
Documents
Partager
LinkedIn
Facebook
Twitter
Copy
R DocumentationEntrée de données en RGestion des données en RGraphiques en RR InterfaceStatistiques en R

Création de nouvelles variables dans R

Utilisez l'opérateur d'affectation <- pour créer de nouvelles variables. Un large éventail d'opérateurs et de fonctions est disponible ici.

# Three examples for doing the same computations

mydata$sum <- mydata$x1 + mydata$x2
mydata$mean <- (mydata$x1 + mydata$x2)/2

attach(mydata)
mydata$sum <- x1 + x2
mydata$mean <- (x1 + x2)/2
detach(mydata)

mydata <- transform( mydata,
sum = x1 + x2,
mean = (x1 + x2)/2
)

(Pour vous entraîner à travailler avec des variables dans R, essayez le premier chapitre de ce cours interactif gratuit).

Variables de recodage

Pour recoder des données, vous utiliserez probablement une ou plusieurs structures de contrôle de R.

# create 2 age categories

mydata$agecat <- ifelse(mydata$age > 70,
c("older"), c("younger"))

# another example: create 3 age categories

attach(mydata)
mydata$agecat[age > 75] <- "Elder"
mydata$agecat[age > 45 & age <= 75] <- "Middle Aged"
mydata$agecat[age <= 45] <- "Young"
detach(mydata)

Renommer des variables

Vous pouvez renommer les variables de manière programmatique ou interactive.

# rename interactively
fix(mydata) # results are saved on close

# rename programmatically
library(reshape)
mydata <- rename(mydata, c(oldname="newname"))

# you can re-enter all the variable names in order
# changing the ones you need to change.the limitation
#
is that you need to enter all of them!
names(mydata) <- c("x1","age","y", "ses")

Types de variables dans R

R prend en charge une gamme variée de types de variables, chacun d'entre eux étant conçu pour traiter des formes de données spécifiques :

  • Numérique : Ils représentent des nombres et peuvent être soit des nombres entiers, soit des nombres décimaux.
  • Personnage : Ce type est destiné aux données textuelles ou aux chaînes de caractères.
  • Logique : Elles sont binaires et peuvent prendre les valeurs VRAI ou FAUX.
  • Facteur : Idéaux pour les données catégorielles, les facteurs peuvent aider à représenter des catégories distinctes au sein d'un ensemble de données.
  • Date : Comme son nom l'indique, ce type est utilisé pour les valeurs de date.

Lorsque vous créez de nouvelles variables, il est essentiel de vous assurer qu'elles sont du type approprié pour votre analyse. En cas de doute, vous pouvez utiliser la fonction class() pour vérifier le type d'une variable.

Vérification et modification des types de variables

Il est essentiel de s'assurer que vos variables sont du bon type pour obtenir une analyse précise :

  • Vérification Type de variable : La fonction class() peut vous aider à déterminer le type d'une variable.
  • Changement de type de variable : Si vous devez convertir une variable d'un type à un autre, R fournit des fonctions telles que as.numeric(), as.character() et as.logical().

Champ d'application variable

Il est essentiel de comprendre la portée d'une variable :

  • Variables globales : Ils sont accessibles tout au long de votre script ou de votre session.
  • Variables locales : Ils sont limités à la fonction ou à l'environnement dans lequel ils sont créés et ne sont pas accessibles en dehors de celui-ci. Lorsque vous créez de nouvelles variables, en particulier dans les fonctions, soyez toujours attentif à leur portée afin d'éviter des comportements inattendus.

Utilisation de variables avec des fonctions

Les variables jouent un rôle central lorsque vous travaillez avec des fonctions :

  • Passage de variables : Vous pouvez fournir des variables comme arguments aux fonctions, ce qui permet d'effectuer des calculs dynamiques basés sur les valeurs des variables.
  • Mémorisation des sorties de fonction : Les fonctions peuvent renvoyer des valeurs et vous pouvez affecter ces valeurs à des variables nouvelles ou existantes en vue d'une analyse ultérieure.

Opérations variables

En fonction de leur type, vous pouvez effectuer différentes opérations sur les variables :

  • Opérations arithmétiques : Pour les variables numériques, vous pouvez effectuer des opérations mathématiques standard telles que l'addition, la soustraction, la multiplication et la division.
  • Opérations sur les chaînes de caractères : Pour les variables de type caractère, des opérations telles que la concaténation vous permettent de combiner plusieurs chaînes de caractères en une seule.

Variables de recodage

Le recodage consiste à modifier les valeurs d'une variable en fonction de certaines conditions. Par exemple, vous pouvez regrouper les âges dans des catégories telles que "jeune", "d'âge moyen" et "senior". R propose différentes structures de contrôle pour faciliter ce processus. Lors du recodage, assurez-vous toujours que les nouvelles catégories ou valeurs ont un sens logique et servent l'objectif de votre analyse.

Renommer des variables

Il peut arriver que vous souhaitiez renommer des variables pour des raisons de clarté ou de cohérence. R propose deux méthodes principales pour renommer les variables :

  • De manière interactive : Vous pouvez utiliser la fonction fix() pour ouvrir un éditeur de données dans lequel vous pouvez renommer directement les variables.
  • De manière programmatique : Il existe plusieurs packages et fonctions dans R qui vous permettent de renommer des variables dans votre script. Lorsque vous renommez des variables, assurez-vous que les nouveaux noms sont descriptifs et qu'ils respectent les conventions de dénomination des variables de R.

Foire aux questions (FAQ) sur les variables dans R

Q : Quelle est la différence entre <- et = pour l'affectation dans R ?

A : <- et = peuvent tous deux être utilisés pour l'affectation dans R. Cependant, <- est la méthode la plus traditionnelle et préférée, en particulier dans les scripts et les fonctions. L'opérateur = est souvent utilisé dans les appels de fonction pour spécifier des arguments nommés.

Q : Comment vérifier le type d'une variable dans R ?

A : Vous pouvez utiliser la fonction class() pour déterminer le type ou la classe d'une variable. Cette fonction renvoie des valeurs telles que "numeric", "character", "factor", etc., en fonction du type de la variable.

Q : J'ai attribué par erreur une valeur de caractère à une variable numérique. Comment puis-je y remédier ?

A : R fournit des fonctions de conversion de type comme as.numeric(), as.character() et as.logical(). Vous pouvez utiliser ces fonctions pour convertir une variable dans le type souhaité.

Q : Que signifie "recoder les variables" ?

A : Le recodage est le processus de modification ou de transformation des valeurs d'une variable sur la base de certains critères. Par exemple, la conversion d'une variable d'âge continue en catégories d'âge (par exemple, "jeune", "d'âge moyen", "senior") est un exemple de recodage.

Q : Comment renommer une variable dans mon ensemble de données ?

A : R propose plusieurs façons de renommer les variables. Vous pouvez le faire de manière interactive en utilisant la fonction fix(), qui ouvre un éditeur de données. Il existe également plusieurs packages et fonctions R qui permettent de renommer les variables par programme.

Q : Les noms de variables dans R sont-ils sensibles à la casse ?

A : Oui, les noms de variables dans R sont sensibles à la casse. Cela signifie que maVariable, maVariable et mavariable seront traitées comme trois variables distinctes.

Q : Puis-je utiliser des espaces dans les noms de variables ?

A : Il n'est pas recommandé d'utiliser des espaces dans les noms de variables dans R. À la place, vous pouvez utiliser des underscores (_) ou des points (.) pour séparer les mots dans les noms de variables, comme ma_variable ou mon.variable.

Q : Comment supprimer une variable de mon espace de travail ?

A : Vous pouvez utiliser la fonction rm() suivie du nom de la variable pour la supprimer de votre espace de travail. Il est conseillé d'effacer les variables inutiles pour libérer de la mémoire.

Q : Quelle est la différence entre les variables locales et globales ?

A : Les variables locales sont confinées à la fonction ou à l'environnement dans lequel elles ont été créées et ne sont pas accessibles en dehors de celui-ci. En revanche, les variables globales sont accessibles tout au long de votre script ou de votre session R.

Q : Comment puis-je visualiser toutes les variables présentes dans mon espace de travail ?

A : Vous pouvez utiliser la fonction ls() pour lister toutes les variables présentes dans votre espace de travail.