cours
Concepts de base de données
Débutant
Actualisé 01/2025Commencer le cours gratuitement
Inclus gratuitementPremium or Teams
DatabricksData Engineering4 heures19 vidéos60 exercices3,900 XP12,823Déclaration de réalisation
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.Formation de 2 personnes ou plus ?
Essayer DataCamp for BusinessApprécié par les apprenants de milliers d’entreprises
Description du cours
Découvrez le pouvoir du Lakehouse Dans le monde actuel rempli de données, nous avons besoin d'outils qui nous permettent d'être aussi axés sur les données que possible. Ce cours vous guide du début à la fin sur la façon dont la plateforme Databricks Lakehouse offre une plateforme unique, évolutive et performante pour vos processus de données. En travaillant sur un jeu de données réel, vous apprendrez à accomplir diverses tâches au sein de la plateforme Databricks. Vous commencerez le cours en apprenant à administrer la plateforme Databricks et en vous assurant que votre environnement est configuré de manière sécurisée.
Pratiquez l'ingénierie des données évolutives Après avoir configuré votre espace de travail, vous apprendrez à créer de puissants pipelines de données à l'aide de Databricks. Vous appliquerez différentes transformations à l'ensemble de données, le faisant passer de la catégorie Bronze à la catégorie Argent, puis à la catégorie Or dans une architecture de type Médaillon. Vous apprendrez comment les clusters Databricks offrent une puissance de calcul et une évolutivité facilement disponibles. Vous mettrez en place un workflow Databricks de bout en bout pour automatiser l'ensemble de votre pipeline de données.
Utilisez le Lakehouse comme entrepôt de données Un élément clé de l'architecture Lakehouse est que vous pouvez interroger votre stockage de données comme un entrepôt de données traditionnel. Dans cette section, vous apprendrez comment Databricks SQL vous permet d'obtenir les performances d'entreposage de données que vous souhaitez en plus de votre lac de données. Vous apprendrez à créer des requêtes à l'aide du langage SQL ANSI standard et à utiliser ces résultats pour créer des tableaux de bord ad hoc sur l'ensemble de vos données.
Mettre en œuvre la science des données et l'apprentissage automatique gouvernés. Enfin, vous apprendrez comment Databricks fournit un ensemble complet d'outils pour la science des données et les cas d'utilisation de l'apprentissage automatique. Vous apprendrez à faire le cursus et à évaluer vos modèles en utilisant le cadre entièrement intégré de MLFlow pour les MLOps. Vous découvrirez comment le Feature Store et le Model Registry simplifient le processus de création de modèles d'apprentissage automatique de qualité professionnelle. Enfin, vous apprendrez à déployer et à contrôler vos modèles à l'aide des fonctionnalités intégrées de mise à disposition de modèles.
Conditions préalables
Intermediate SQLUnderstanding Data EngineeringUnderstanding Machine Learning1
Bienvenue à Databricks
2
Ingénierie des données
3
Databricks SQL et Data Warehousing
4
Les bases de données pour les applications à grande échelle et l'apprentissage automatique
Concepts de base de données
Cours terminé
Earn Déclaration de réalisation
Ajoutez ces informations d’identification à votre profil LinkedIn, à votre CV ou à votre CVPartagez-le sur les réseaux sociaux et dans votre évaluation de performance
Inclus avecPremium or Teams
S'inscrire maintenantInscrivez-vous 15 millions d’apprenants et commencer Concepts de base de données Aujourd’hui!
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.