Accéder au contenu principal
AccueilR

Cours

Modéliser des données avec le Tidyverse

IntermédiaireNiveau de compétence
Actualisé 09/2022
Commencer le cours gratuitement
RProbability & Statistics
4 h
17 vidéos
49 Exercices
3,900 XP
27,298
Certificat de formation

Créez votre compte gratuitement

Continuer avec GoogleAfficher plus d’options

ou


En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprécié par des utilisateurs provenant de milliers d'entreprises

Group

Former une équipe ?

Essayez pour les entreprises

Description du cours

Dans ce cours, vous allez apprendre à modéliser des données. Les modèles cherchent à capturer la relation entre une variable d’intérêt (variable à expliquer) et une série de variables explicatives/prédictives. Ces modèles peuvent servir à des fins explicatives, par exemple « Savoir l’âge des professeurs aide-t-il à expliquer leurs notes d’évaluation pédagogique ? », ou à des fins prédictives, par exemple « Dans quelle mesure peut-on prédire le prix d’une maison à partir de sa taille et de son état ? ». Vous mettrez à profit vos compétences en tidyverse pour construire et interpréter de tels modèles. Ce cours est centré sur l’utilisation de la régression linéaire, l’une des approches de modélisation les plus courantes et faciles à comprendre. Ce type de modélisation et de raisonnement est utilisé dans de nombreux domaines, notamment les statistiques, l’inférence causale, le Machine Learning et l’intelligence artificielle.

Prérequis

Data Manipulation with dplyr
1

Introduction à la modélisation

Dans ce chapitre, vous découvrirez des notions de base et la terminologie de la modélisation : le cadre général de modélisation, la différence entre modéliser pour expliquer et modéliser pour prédire, ainsi que la problématique de modélisation. Vous commencerez aussi votre première analyse exploratoire des données, une étape essentielle avant toute modélisation formelle.
Commencer le chapitre
2

Modéliser avec une régression simple

Fort de votre compréhension du cadre général de modélisation, nous aborderons dans ce chapitre la régression linéaire simple, où vous modéliserez la variable de sortie y en fonction d’une seule variable explicative/prédictive x. Nous utiliserons des variables x numériques et catégorielles. La variable d’intérêt de ce chapitre sera la note d’évaluation pédagogique d’enseignants de l’Université du Texas, à Austin.
Commencer le chapitre
3

Modéliser avec une régression multiple

Au chapitre précédent, vous avez étudié la régression simple avec un seul prédicteur, numérique ou catégoriel. Mais pourquoi se limiter à une seule variable pour éclairer vos explications ou prédictions ? Vous allez maintenant étendre la régression simple à la régression multiple, qui permet d’intégrer plusieurs variables explicatives ou prédictives dans vos modèles. Vous modéliserez les prix des maisons à partir d’un jeu de données portant sur des logements de l’aire métropolitaine de Seattle (WA).
Commencer le chapitre
4

Évaluation et sélection de modèles

Dans les chapitres précédents, vous avez ajusté différents modèles pour expliquer ou prédire une variable d’intérêt. Mais comment savoir quels modèles choisir ? Les mesures d’évaluation de modèles permettent d’estimer la qualité de l’« ajustement » d’un modèle explicatif à des données, ou la précision d’un modèle prédictif. À partir de ces mesures, vous apprendrez des critères pour déterminer quels modèles sont « les meilleurs ».
Commencer le chapitre
Modéliser des données avec le Tidyverse
Cours
terminé

Obtenez un certificat de réussite

Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolio
Partagez-la sur les réseaux sociaux et dans votre évaluation de performance
S'inscrire maintenant

Rejoignez plus de 19 millions d'utilisateurs et commencez Modéliser des données avec le Tidyverse dès aujourd'hui !

Créez votre compte gratuitement

Continuer avec GoogleAfficher plus d’options

ou


En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.

Apprenez où que vous soyez avec l'application DataCamp

Progressez où que vous soyez grâce à nos cours conçus pour mobile et à nos défis quotidiens de 5 minutes.