Tutorial: Create, track, and use a dataset artifact
less than a minute
このチュートリアルでは、W&B Runsからデータセット Artifactsを作成、追跡、および使用する方法を示します。
1. W&Bにログイン
W&Bライブラリをインポートし、W&Bにログインします。まだお持ちでない場合は、無料のW&Bアカウントにサインアップする必要があります。
import wandb
wandb.login()
2. runを初期化
wandb.init()
APIを使用して、W&B Runとしてデータを同期および記録するためのバックグラウンド プロセスを生成します。 project名とジョブタイプを指定します。
# W&B Runを作成します。この例では、データセット Artifactsの作成方法を示すため、ジョブタイプとして「dataset」を指定します。
run = wandb.init(project="artifacts-example", job_type="upload-dataset")
3. artifact オブジェクトを作成
wandb.Artifact()
APIを使用して、artifact オブジェクトを作成します。 artifactの名前とファイルタイプの記述を、それぞれname
パラメータと type
パラメータに指定します。
たとえば、次のコードスニペットは、‘bicycle-dataset’
という名前で ‘dataset’
というラベルの artifact を作成する方法を示しています。
artifact = wandb.Artifact(name="bicycle-dataset", type="dataset")
artifact の構成方法の詳細については、Artifactsの構築を参照してください。
データセットを artifact に追加
artifact にファイルを追加します。一般的なファイルタイプには、Models や Datasets などがあります。次の例では、マシンにローカルに保存されている dataset.h5
という名前のデータセットを artifact に追加します。
# ファイルをartifactのコンテンツに追加します。
artifact.add_file(local_path="dataset.h5")
上記のコードスニペットのファイル名 dataset.h5
を、artifact に追加するファイルへのパスに置き換えます。
4. データセットをログに記録
W&B run オブジェクトの log_artifact()
メソッドを使用して、artifact のバージョンを保存し、artifact を run の出力として宣言します。
# artifact のバージョンを W&B に保存し、この run の出力としてマークします。
run.log_artifact(artifact)
artifact をログに記録すると、デフォルトで 'latest'
エイリアスが作成されます。 artifact のエイリアスとバージョンの詳細については、カスタムエイリアスを作成すると新しい artifact バージョンを作成するをそれぞれ参照してください。
5. artifact をダウンロードして使用する
次のコード例は、W&B サーバーにログして保存した artifact を使用するために実行できる手順を示しています。
- まず、
wandb.init()
を使用して新しい run オブジェクトを初期化します。 - 次に、run オブジェクトの
use_artifact()
メソッドを使用して、使用する artifact を W&B に指示します。 これにより、artifact オブジェクトが返されます。 - 3 番目に、artifact の
download()
メソッドを使用して、artifact のコンテンツをダウンロードします。
# W&B Runを作成します。ここでは、この run をトレーニングの追跡に使用するため、'type' に 'training' を指定します。
run = wandb.init(project="artifacts-example", job_type="training")
# W&B に artifact を照会し、この run への入力としてマークします。
artifact = run.use_artifact("bicycle-dataset:latest")
# artifact のコンテンツをダウンロードします
artifact_dir = artifact.download()
または、パブリック API(wandb.Api
)を使用して、Run の外部にある W&B にすでに保存されているデータをエクスポート(または更新)できます。 詳細については、外部ファイルを追跡するを参照してください。
[i18n] feedback_title
[i18n] feedback_question
Glad to hear it! Please tell us how we can improve.
Sorry to hear that. Please tell us how we can improve.