Concepts de base de données

FondamentauxNiveau de compétence

Actualisé 02/2025

Découvrez la puissance de Databricks Lakehouse et aidez vous à développer vos compétences en ingénierie des données et en apprentissage automatique.

Créez votre compte gratuit

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.

Description du cours

Découvrez le pouvoir du Lakehouse Dans le monde actuel rempli de données, nous avons besoin d'outils qui nous permettent d'être aussi axés sur les données que possible. Ce cours vous guide du début à la fin sur la façon dont la plateforme Databricks Lakehouse offre une plateforme unique, évolutive et performante pour vos processus de données. En travaillant sur un jeu de données réel, vous apprendrez à accomplir diverses tâches au sein de la plateforme Databricks. Vous commencerez le cours en apprenant à administrer la plateforme Databricks et en vous assurant que votre environnement est configuré de manière sécurisée.

Pratiquez l'ingénierie des données évolutives Après avoir configuré votre espace de travail, vous apprendrez à créer de puissants pipelines de données à l'aide de Databricks. Vous appliquerez différentes transformations à l'ensemble de données, le faisant passer de la catégorie Bronze à la catégorie Argent, puis à la catégorie Or dans une architecture de type Médaillon. Vous apprendrez comment les clusters Databricks offrent une puissance de calcul et une évolutivité facilement disponibles. Vous mettrez en place un workflow Databricks de bout en bout pour automatiser l'ensemble de votre pipeline de données.

Utilisez le Lakehouse comme entrepôt de données Un élément clé de l'architecture Lakehouse est que vous pouvez interroger votre stockage de données comme un entrepôt de données traditionnel. Dans cette section, vous apprendrez comment Databricks SQL vous permet d'obtenir les performances d'entreposage de données que vous souhaitez en plus de votre lac de données. Vous apprendrez à créer des requêtes à l'aide du langage SQL ANSI standard et à utiliser ces résultats pour créer des tableaux de bord ad hoc sur l'ensemble de vos données.

Mettre en œuvre la science des données et l'apprentissage automatique gouvernés. Enfin, vous apprendrez comment Databricks fournit un ensemble complet d'outils pour la science des données et les cas d'utilisation de l'apprentissage automatique. Vous apprendrez à faire le cursus et à évaluer vos modèles en utilisant le cadre entièrement intégré de MLFlow pour les MLOps. Vous découvrirez comment le Feature Store et le Model Registry simplifient le processus de création de modèles d'apprentissage automatique de qualité professionnelle. Enfin, vous apprendrez à déployer et à contrôler vos modèles à l'aide des fonctionnalités intégrées de mise à disposition de modèles.

Conditions préalables

Intermediate SQL Understanding Data Engineering Understanding Machine Learning

Description du cours

Obtenez un certificat de réussite

Rejoignez plus de .css-nklxlk{color:var(--wf-brand--main, #03EF62);}17 millions d’apprenants et commencer Concepts de base de données dès aujourd'hui !

Créez votre compte gratuit

Rejoignez plus de 17 millions d’apprenants et commencer Concepts de base de données dès aujourd'hui !