Cours
Modéliser des données avec le Tidyverse
IntermédiaireNiveau de compétence
Actualisé 09/2022
RProbability & Statistics4 h17 vidéos49 Exercices3,900 XP27,298Certificat de formation
Créez votre compte gratuitement
Continuer avec GoogleAfficher plus d’optionsou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.
Apprécié par des utilisateurs provenant de milliers d'entreprises
Former une équipe ?
Essayez pour les entreprisesDescription du cours
Prérequis
Data Manipulation with dplyr1
Introduction à la modélisation
Dans ce chapitre, vous découvrirez des notions de base et la terminologie de la modélisation : le cadre général de modélisation, la différence entre modéliser pour expliquer et modéliser pour prédire, ainsi que la problématique de modélisation. Vous commencerez aussi votre première analyse exploratoire des données, une étape essentielle avant toute modélisation formelle.
2
Modéliser avec une régression simple
Fort de votre compréhension du cadre général de modélisation, nous aborderons dans ce chapitre la régression linéaire simple, où vous modéliserez la variable de sortie y en fonction d’une seule variable explicative/prédictive x. Nous utiliserons des variables x numériques et catégorielles. La variable d’intérêt de ce chapitre sera la note d’évaluation pédagogique d’enseignants de l’Université du Texas, à Austin.
3
Modéliser avec une régression multiple
Au chapitre précédent, vous avez étudié la régression simple avec un seul prédicteur, numérique ou catégoriel. Mais pourquoi se limiter à une seule variable pour éclairer vos explications ou prédictions ? Vous allez maintenant étendre la régression simple à la régression multiple, qui permet d’intégrer plusieurs variables explicatives ou prédictives dans vos modèles. Vous modéliserez les prix des maisons à partir d’un jeu de données portant sur des logements de l’aire métropolitaine de Seattle (WA).
4
Évaluation et sélection de modèles
Dans les chapitres précédents, vous avez ajusté différents modèles pour expliquer ou prédire une variable d’intérêt. Mais comment savoir quels modèles choisir ? Les mesures d’évaluation de modèles permettent d’estimer la qualité de l’« ajustement » d’un modèle explicatif à des données, ou la précision d’un modèle prédictif. À partir de ces mesures, vous apprendrez des critères pour déterminer quels modèles sont « les meilleurs ».
Modéliser des données avec le Tidyverse
Cours terminé
Obtenez un certificat de réussite
Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolioPartagez-la sur les réseaux sociaux et dans votre évaluation de performanceS'inscrire maintenant
Rejoignez plus de 19 millions d'utilisateurs et commencez Modéliser des données avec le Tidyverse dès aujourd'hui !
Créez votre compte gratuitement
Continuer avec GoogleAfficher plus d’optionsou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.
Apprenez où que vous soyez avec l'application DataCamp
Progressez où que vous soyez grâce à nos cours conçus pour mobile et à nos défis quotidiens de 5 minutes.