Courses
Databricks の基本概念
基本スキルレベル
更新 2025/02無料でコースを始める
含まれるものプレミアム or チーム
DatabricksData Engineering4時間19 videos60 Exercises3,900 XP20,810達成証明書
数千社の学習者に愛用されています
2人以上をトレーニングしますか?
DataCamp for Businessを試すコースの説明
レイクハウスの力を学びましょう 現代のデータが溢れる世界において、私たちは可能な限りデータ駆動型でいられるようなツールを必要としています。本コースでは、Databricks Lakehouse Platformがデータ処理プロセス向けに単一でスケーラブルかつ高性能なプラットフォームを提供する仕組みを、最初から最後までご案内いたします。実際のデータセットを用いて作業することで、Databricksプラットフォーム内での様々なタスクの達成方法を学べます。コースの開始にあたり、Databricksプラットフォームの管理方法と、環境を安全に設定する方法について学んでいただきます。
スケーラブルなデータエンジニアリングを実践する ワークスペースの設定が完了しましたら、Databricksを使用した強力なデータパイプラインの作成方法について学んでいただきます。データセットに対して様々な変換を適用し、ブロンズからシルバー、そしてゴールドへと段階的に移行させます。これはメダル構造における処理の流れとなります。Databricksクラスターが、すぐに利用可能な計算能力とスケーラビリティを提供する方法について学んでいただけます。エンドツーエンドのDatabricksワークフローを設定し、データパイプライン全体を自動化していただきます。
レイクハウスをデータウェアハウスとしてご利用ください レイクハウスアーキテクチャの重要な特徴の一つは、従来のデータウェアハウスと同様にデータストレージに対してクエリを実行できる点です。このセクションでは、Databricks SQLがデータレイク上に、ご希望のデータウェアハウジング性能を実現する方法についてご説明いたします。標準的なANSI SQLを使用したクエリの作成方法を学び、その結果を用いて、データセット全体に対してアドホックなダッシュボードを作成する方法を習得いただけます。
ガバナンスされたデータサイエンスおよび機械学習を導入する 最後に、Databricksがデータサイエンスおよび機械学習のユースケース向けに、包括的なツール群を提供する方法についてご説明いたします。MLOps向けの完全に統合されたMLFlowフレームワークを使用して、モデルを追跡および評価する方法を学んでいただけます。フィーチャーストアとモデルレジストリが、本番環境向けの機械学習モデル作成プロセスをいかに簡素化するかを学んでいただけます。最後に、組み込みのモデル提供機能を使用して、モデルを展開および監視する方法について学んでいただきます。
前提条件
Intermediate SQLUnderstanding Data EngineeringUnderstanding Machine Learning1
Welcome to Databricks
Learn about the new lakehouse paradigm for your cloud data strategy and how the Databricks Lakehouse platform can modernize your data architecture. Understand the foundational components of the Databricks platform and how they all fit together.
2
Data Engineering
Learn how to process, transform, and clean your data using Databricks functionality. Practice using capabilities such as the Delta storage format, Delta Live Tables, and Workflows together to create an end-to-end data pipeline.
3
Databricks SQL and Data Warehousing
Use the Databricks Lakehouse platform as your data warehousing solution for your Business Intelligence (BI) use cases. Use the built-in SQL-optimized capabilities within Databricks to create queries and dashboards on your data.
4
Databricks for Large-scale Applications and Machine Learning
Use Databricks to manage your Machine Learning pipelines with managed MLFlow. Follow the model development lifecycle from end-to-end with the Feature Store, Model Registry, and Model Serving Endpoints to create a robust MLOps platform in the lakehouse.
Databricks の基本概念
コース完了