Artifacts

W&B Artifacts の概要、その仕組み、およびそれらの使用を開始する方法について説明します。

W&B Artifacts を使用して、W&B Runs の入力および出力としてデータを追跡およびバージョン管理します。たとえば、モデルトレーニング run は、データセットを入力として受け取り、トレーニング済みのモデルを出力として生成する場合があります。ハイパー パラメーター、メタデータ、およびメトリクスを run に記録できます。また、artifact を使用して、モデルのトレーニングに使用されるデータセットを入力として、結果のモデル チェックポイントを別の artifact として、ログ記録、追跡、およびバージョン管理できます。

ユースケース

Artifact は、runs の入力および出力として、ML ワークフロー全体で使用できます。データセット、モデル、またはその他の artifact を、処理の入力として使用できます。

ユースケース 入力 出力
モデルトレーニング データセット (トレーニングおよび検証データ) トレーニング済みモデル
データセットの前処理 データセット (未加工データ) データセット (前処理済みデータ)
モデルの評価 モデル + データセット (テストデータ) W&B Table
モデルの最適化 モデル 最適化されたモデル

artifact を作成する

4 行のコードで artifact を作成します。

  1. W&B run を作成します。
  2. wandb.Artifact API を使用して、artifact オブジェクトを作成します。
  3. モデル ファイルやデータセットなど、1 つ以上のファイルを artifact オブジェクトに追加します。
  4. artifact を W&B に記録します。

たとえば、次のコード スニペットは、dataset.h5 というファイルを example_artifact という artifact に記録する方法を示しています。

import wandb

run = wandb.init(project="artifacts-example", job_type="add-dataset")
artifact = wandb.Artifact(name="example_artifact", type="dataset")
artifact.add_file(local_path="./dataset.h5", name="training_dataset")
artifact.save()

# artifact バージョン "my_data" を dataset.h5 のデータを持つデータセットとして記録します

artifact をダウンロードする

use_artifact メソッドを使用して、run への入力としてマークする artifact を示します。

上記のコード スニペットに従って、次のコード ブロックは training_dataset artifact の使用方法を示しています。

artifact = run.use_artifact(
    "training_dataset:latest"
)  # "my_data" artifact を使用して run オブジェクトを返します

これにより、artifact オブジェクトが返されます。

次に、返されたオブジェクトを使用して、artifact のすべてのコンテンツをダウンロードします。

datadir = (
    artifact.download()
)  # `my_data` artifact 全体をデフォルトのディレクトリーにダウンロードします。

次のステップ

  • artifact をバージョン管理および更新する方法を学びます。
  • オートメーションを使用して、artifact の変更に応じてダウンストリーム ワークフローをトリガーしたり、Slack channel に通知したりする方法を学びます。
  • トレーニング済みモデルを格納するスペースであるレジストリについて学びます。
  • Python SDK および CLI リファレンス ガイドをご覧ください。

Create an artifact

W&B の Artifact を作成、構築します。1 つまたは複数のファイル、または URI 参照を Artifact に追加する方法を学びます。

Download and use artifacts

複数のプロジェクトから Artifacts をダウンロードして使用します。

Update an artifact

W&B Run の内外で既存の Artifact を更新します。

Create an artifact alias

W&B Artifacts のカスタムエイリアスを作成します。

Create an artifact version

単一の run 、または分散された プロセス から新しい アーティファクト の バージョン を作成します。

Track external files

W&B の外部に保存されたファイル (Amazon S3 バケット 、GCS バケット 、HTTP ファイル サーバー 、NFS 共有など) を追跡します。

Manage data

Explore artifact graphs

自動的に作成された有向非巡回 W&B Artifact グラフをトラバースします。

Artifact data privacy and compliance

W&B のファイルがデフォルトでどこに保存されるかについて学びましょう。機密情報の保存、保存方法について説明します。

Tutorial: Create, track, and use a dataset artifact

Artifacts クイックスタート では、W&B で データセット artifact を作成、追跡、使用する方法を紹介します。