コース説明

分散トレーニングは、大規模な機械学習において不可欠なスキルであり、数兆のパラメータを持つ大規模言語モデルの学習に必要な時間を短縮するのに役立ちます。このコースでは、PyTorch、Accelerator、Trainerを使った効率的な分散トレーニングに不可欠なツール、手法、戦略を学びます。

分散トレーニングのためのデータ準備

まず、データセットを複数のデバイスに分割し、各デバイスにモデルのコピーを配置して、分散トレーニングのためのデータを準備することから始めます。分散環境向けのデータ前処理を、画像、音声、テキストを含めて実践的に学べます。

効率化手法の探求

データの準備が整ったら、複数のインターフェースにわたって、トレーニングとオプティマイザーの使用効率を向上させる方法を学びます。メモリ使用量、デバイス間通信、計算効率を改善することで、勾配蓄積、勾配チェックポイント、ローカル確率的勾配降下法、混合精度学習といった手法を使って、これらの課題にどう対処するかを学びます。さまざまな最適化手法のトレードオフを理解し、モデルのメモリ使用量を削減できるようになります。このコースの終了時には、分散型のAI搭載サービスを構築するための知識とツールを身につけているでしょう。

前提条件

Intermediate Deep Learning with PyTorch Working with Hugging Face

Accelerator を使ったデータ準備

複数のデバイスにデータを分割し、各デバイスにモデルをコピーすることで、分散トレーニングに向けたデータ準備を行います。Accelerator はデータ準備のための便利なインターフェースを提供しており、分散トレーニングの第一歩として、画像・音声・テキストの前処理方法を学びます。

AutoModel と Accelerator を使ったモデルの準備

コース説明

分散トレーニングのためのデータ準備

効率化手法の探求

修了証明書を取得

.css-nklxlk{color:var(--wf-brand--main, #03EF62);}19百万人を超える学習者と共にPyTorch による効率的な AI モデルトレーニングを始めましょう！

無料アカウントを作成

DataCamp for Mobileでデータスキルを磨きましょう

19百万人を超える学習者と共にPyTorch による効率的な AI モデルトレーニングを始めましょう！