Cours
Analyse de clusters avec R
IntermédiaireNiveau de compétence
Actualisé 11/2024RMachine Learning4 h16 vidéos52 Exercices3,800 XP43,651Certificat de réussite.
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.Apprécié par des utilisateurs provenant de milliers d'entreprises
Former 2 personnes ou plus ?
Essayez DataCamp for BusinessDescription du cours
Apprenez à réaliser une analyse par grappes
L'analyse par grappes constitue un outil puissant dans le domaine de la science des données. Il est utilisé pour identifier des groupes d'observations (clusters) qui partagent des caractéristiques similaires. Ces similitudes peuvent éclairer toutes sortes de décisions commerciales ; par exemple, en marketing, elles sont utilisées pour identifier des groupes distincts de clients auxquels des publicités peuvent être adaptées.Découvrez les techniques de regroupement hiérarchique et par la méthode des k-moyennes
Dans ce cours, vous découvrirez deux méthodes de regroupement couramment utilisées : le regroupement hiérarchique et le regroupement par la méthode des k-moyennes. Vous n'apprendrez pas seulement à utiliser ces méthodes, vous développerez également une intuition solide quant à leur fonctionnement et à l'interprétation de leurs résultats. Vous développerez cette intuition en explorant trois ensembles de données différents : les positions des joueurs de football, les données sur les dépenses des clients grossistes et les données longitudinales sur les salaires professionnels.Perfectionnez vos compétences grâce à une étude de cas pratique
Vous terminerez le cours en mettant en pratique vos nouvelles compétences dans le cadre d'une étude de cas portant sur les salaires moyens et leur évolution au fil du temps. Cela combinera des techniques de regroupement hiérarchique telles que les arbres professionnels, la préparation à l'exploration et la création de graphiques de grappes professionnelles, avec des techniques k-means, notamment l'analyse du coude et les largeurs moyennes de silhouette.Les cours DataCamp comprennent une combinaison de vidéos, d'articles et d'exercices pratiques afin de vous permettre de tester et de consolider vos nouvelles compétences, de manière à ce que vous vous sentiez à l'aise pour les mettre en application en dehors du cadre du cours.
Prérequis
Intermediate R1
Calculating Distance Between Observations
Cluster analysis seeks to find groups of observations that are similar to one another, but the identified groups are different from each other. This similarity/difference is captured by the metric called distance. In this chapter, you will learn how to calculate the distance between observations for both continuous and categorical features. You will also develop an intuition for how the scales of your features can affect distance.
2
Hierarchical Clustering
This chapter will help you answer the last question from chapter 1—how do you find groups of similar observations (clusters) in your data using the distances that you have calculated? You will learn about the fundamental principles of hierarchical clustering - the linkage criteria and the dendrogram plot - and how both are used to build clusters. You will also explore data from a wholesale distributor in order to perform market segmentation of clients using their spending habits.
3
K-means Clustering
In this chapter, you will build an understanding of the principles behind the k-means algorithm, learn how to select the right k when it isn't previously known, and revisit the wholesale data from a different perspective.
4
Case Study: National Occupational Mean Wage
In this chapter, you will apply the skills you have learned to explore how the average salary amongst professions have changed over time.
Analyse de clusters avec R
Cours terminé
Obtenez un certificat de réussite
Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolioPartagez-la sur les réseaux sociaux et dans votre évaluation de performance
Inclus avecPremium or Teams
S'inscrire MaintenantRejoignez plus de 19 millions d'utilisateurs et commencez Analyse de clusters avec R dès aujourd'hui !
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.