Description du cours

Travaillez-vous parfois avec des ensembles de données comportant un nombre impressionnant de caractéristiques ? Avez-vous besoin de toutes ces fonctionnalités ? Quels sont les plus importants ? Dans ce cours, vous apprendrez des techniques de réduction de dimensionnalité qui vous aideront à simplifier vos données et les modèles que vous construisez à partir de celles-ci, tout en conservant les informations contenues dans les données d'origine et de bonnes performances prédictives.

Réduction de la dimensionnalité

Nous vivons à l'ère de l'information, une époque caractérisée par une surcharge d'informations. L'art d'extraire des informations essentielles à partir de données est une compétence très recherchée sur le marché du travail. Les modèles s'entraînent plus rapidement sur des données réduites. En production, des modèles plus petits signifient un temps de réponse plus rapide. Il est important de noter que les données et les modèles de plus petite taille sont souvent plus faciles à appréhender. La réduction de dimensionnalité est votre principe de simplicité dans le domaine de la science des données.

Quels sont les principaux thèmes abordés dans ce cours ?

La distinction entre la sélection des caractéristiques et l'extraction des caractéristiques ! À l'aide de R, vous apprendrez à identifier et à supprimer les caractéristiques contenant peu d'informations ou redondantes, tout en conservant celles qui contiennent le plus d'informations. Il s'agit de la sélection des caractéristiques. Vous apprendrez également à extraire des combinaisons de caractéristiques sous forme de composants condensés contenant un maximum d'informations. C'est ce qu'on appelle l'extraction de caractéristiques.

Cependant, le plus important est qu'en utilisant le nouveau package tidymodel de R, vous pourrez exploiter des données réelles pour construire des modèles avec moins de caractéristiques sans compromettre les performances de manière significative.

Prérequis

Modeling with tidymodels in R

Foundations of Dimensionality Reduction

Prepare to simplify large data sets! You will learn about information, how to assess feature importance, and practice identifying low-information features. By the end of the chapter, you will understand the difference between feature selection and feature extraction—the two approaches to dimensionality reduction.

Description du cours

Réduction de la dimensionnalité

Quels sont les principaux thèmes abordés dans ce cours ?

Obtenez un certificat de réussite

Rejoignez plus de .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 millions d'utilisateurs et commencez Réduction de dimension en R dès aujourd'hui !

Créez votre compte gratuitement

Apprenez où que vous soyez avec l'application DataCamp

Rejoignez plus de 19 millions d'utilisateurs et commencez Réduction de dimension en R dès aujourd'hui !