Réduction de la dimensionnalité
Nous vivons à l'ère de l'information, une époque caractérisée par une surcharge d'informations. L'art d'extraire des informations essentielles à partir de données est une compétence très recherchée sur le marché du travail. Les modèles s'entraînent plus rapidement sur des données réduites. En production, des modèles plus petits signifient un temps de réponse plus rapide. Il est important de noter que les données et les modèles de plus petite taille sont souvent plus faciles à appréhender. La réduction de dimensionnalité est votre principe de simplicité dans le domaine de la science des données.
Quels sont les principaux thèmes abordés dans ce cours ?
La distinction entre la sélection des caractéristiques et l'extraction des caractéristiques ! À l'aide de R, vous apprendrez à identifier et à supprimer les caractéristiques contenant peu d'informations ou redondantes, tout en conservant celles qui contiennent le plus d'informations. Il s'agit de la sélection des caractéristiques. Vous apprendrez également à extraire des combinaisons de caractéristiques sous forme de composants condensés contenant un maximum d'informations. C'est ce qu'on appelle l'extraction de caractéristiques.
Cependant, le plus important est qu'en utilisant le nouveau package tidymodel de R, vous pourrez exploiter des données réelles pour construire des modèles avec moins de caractéristiques sans compromettre les performances de manière significative.