Cours
Concepts Databricks
DébutantNiveau de compétence
Actualisé 02/2025
DatabricksData Engineering4 h19 vidéos60 Exercices3,900 XP22,120Certificat de formation
Créez votre compte gratuitement
Continuer avec GoogleAfficher plus d’optionsou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.
Apprécié par des utilisateurs provenant de milliers d'entreprises
Former une équipe ?
Essayez pour les entreprisesDescription du cours
Découvrez le pouvoir du Lakehouse Dans le monde actuel rempli de données, nous avons besoin d'outils qui nous permettent d'être aussi axés sur les données que possible. Ce cours vous guide du début à la fin sur la façon dont la plateforme Databricks Lakehouse offre une plateforme unique, évolutive et performante pour vos processus de données. En travaillant sur un jeu de données réel, vous apprendrez à accomplir diverses tâches au sein de la plateforme Databricks. Vous commencerez le cours en apprenant à administrer la plateforme Databricks et en vous assurant que votre environnement est configuré de manière sécurisée.
Pratiquez l'ingénierie des données évolutives Après avoir configuré votre espace de travail, vous apprendrez à créer de puissants pipelines de données à l'aide de Databricks. Vous appliquerez différentes transformations à l'ensemble de données, le faisant passer de la catégorie Bronze à la catégorie Argent, puis à la catégorie Or dans une architecture de type Médaillon. Vous apprendrez comment les clusters Databricks offrent une puissance de calcul et une évolutivité facilement disponibles. Vous mettrez en place un workflow Databricks de bout en bout pour automatiser l'ensemble de votre pipeline de données.
Utilisez le Lakehouse comme entrepôt de données Un élément clé de l'architecture Lakehouse est que vous pouvez interroger votre stockage de données comme un entrepôt de données traditionnel. Dans cette section, vous apprendrez comment Databricks SQL vous permet d'obtenir les performances d'entreposage de données que vous souhaitez en plus de votre lac de données. Vous apprendrez à créer des requêtes à l'aide du langage SQL ANSI standard et à utiliser ces résultats pour créer des tableaux de bord ad hoc sur l'ensemble de vos données.
Mettre en œuvre la science des données et l'apprentissage automatique gouvernés. Enfin, vous apprendrez comment Databricks fournit un ensemble complet d'outils pour la science des données et les cas d'utilisation de l'apprentissage automatique. Vous apprendrez à faire le cursus et à évaluer vos modèles en utilisant le cadre entièrement intégré de MLFlow pour les MLOps. Vous découvrirez comment le Feature Store et le Model Registry simplifient le processus de création de modèles d'apprentissage automatique de qualité professionnelle. Enfin, vous apprendrez à déployer et à contrôler vos modèles à l'aide des fonctionnalités intégrées de mise à disposition de modèles.
Prérequis
Intermediate SQLUnderstanding Data EngineeringUnderstanding Machine Learning1
Bienvenue sur Databricks
Découvrez le nouveau paradigme lakehouse pour votre stratégie de données cloud et comment la plateforme Databricks Lakehouse peut moderniser votre architecture de données. Comprenez les composants fondamentaux de la plateforme Databricks et la manière dont ils s’articulent.
2
Ingénierie des données
Apprenez à traiter, transformer et nettoyer vos données grâce aux fonctionnalités de Databricks. Entraînez-vous à utiliser, ensemble, des capacités comme le format de stockage Delta, Delta Live Tables et Workflows pour créer un pipeline de données de bout en bout.
3
Databricks SQL et Data Warehousing
Utilisez la plateforme Databricks Lakehouse comme solution de data warehousing pour vos cas d’usage de Business Intelligence (BI). Exploitez les fonctionnalités intégrées et optimisées pour SQL dans Databricks afin de créer des requêtes et des tableaux de bord sur vos données.
4
Databricks pour les applications à grande échelle et le Machine Learning
Utilisez Databricks pour gérer vos pipelines de Machine Learning avec MLFlow managé. Suivez le cycle de vie de développement du modèle de bout en bout avec le Feature Store, le Model Registry et les Model Serving Endpoints afin de créer une plateforme MLOps robuste dans le lakehouse.
Concepts Databricks
Cours terminé
Obtenez un certificat de réussite
Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolioPartagez-la sur les réseaux sociaux et dans votre évaluation de performanceS'inscrire maintenant
Rejoignez plus de 19 millions d'utilisateurs et commencez Concepts Databricks dès aujourd'hui !
Créez votre compte gratuitement
Continuer avec GoogleAfficher plus d’optionsou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.
Apprenez où que vous soyez avec l'application DataCamp
Progressez où que vous soyez grâce à nos cours conçus pour mobile et à nos défis quotidiens de 5 minutes.