Gestion des données en R
Une fois que vous aurez accès à vos données, vous voudrez les transformer en une forme utile. Cela comprend la création de nouvelles variables (y compris le recodage et le renommage de variables existantes), le tri et la fusion d' ensembles de données, l'agrégation de données, le remodelage de données et le sous-ensemble d'ensembles de données (y compris la sélection d'observations répondant à des critères, l'échantillonnage aléatoire de l'observation et l'abandon ou la conservation de variables).
Chacune de ces activités implique généralement l'utilisation des opérateurs intégrés de R (arithmétiques et logiques) et des fonctions (numériques, de caractères et statistiques). En outre, vous devrez peut-être utiliser des structures de contrôle (if-then, for, while, switch) dans vos programmes et/ou créer vos propres fonctions. Enfin, vous pouvez avoir besoin de convertir des variables ou des ensembles de données d'un type à un autre (par exemple, de numérique à caractère ou de matrice à cadre de données).
Cette section décrit chaque tâche d'un point de vue R.
Pratiquer
Pour vous entraîner à gérer des données dans R, essayez le premier chapitre de ce cours interactif.