# Start a run.
#
# When this block exits, it waits for logged data to finish uploading.
# If an exception is raised, the run is marked failed.
with wandb.init(entity="", project="my-project-name") as run:
  # Save mode inputs and hyperparameters.
  run.config.learning_rate = 0.01

  # Run your experiment code.
  for epoch in range(num_epochs):
    # Do some training...

    # Log metrics over time to visualize model performance.
    run.log({"loss": loss})

  # Upload model outputs as artifacts.
  run.log_artifact(model)

はじめに

ユースケースに応じて、次のリソースを調べて W&B Experiments を開始してください。

データセット Artifact を作成、追跡、および使用するために使用できる W&B Python SDK コマンドのステップごとの概要については、W&B クイックスタートをお読みください。
このチャプターを調べて、次の方法を学びます。
- 実験を作成する
- 実験を設定する
- 実験からデータをログに記録する
- 実験の結果を表示する
W&B API Reference Guide内の W&B Python Libraryを調べます。

ベストプラクティスとヒント

実験とログのベストプラクティスとヒントについては、Best Practices: Experiments and Loggingを参照してください。

1.1 - Create an experiment

W&B の実験を作成します。

W&B Python SDK を使用して、機械学習の実験を追跡します。次に、インタラクティブなダッシュボードで結果を確認するか、W&B Public API でプログラムからアクセスできるようにデータを Python にエクスポートできます。

このガイドでは、W&B の構成要素を使用して W&B の実験を作成する方法について説明します。

W&B の実験を作成する方法

W&B の実験は、次の 4 つのステップで作成します。

W&B Run の初期化
ハイパーパラメーターの辞書をキャプチャ
トレーニングループ内でメトリクスをログ記録
W&B にアーティファクトをログ記録

W&B run の初期化

wandb.init() を使用して、W&B Run を作成します。

次のコードスニペットは、この run を識別するために、説明が “My first experiment” である “cat-classification” という名前の W&B のプロジェクトで run を作成します。タグ “baseline” および “paper1” は、この run が将来の論文出版を目的としたベースライン実験であることを思い出させるために含まれています。

import wandb

with wandb.init(
    project="cat-classification",
    notes="My first experiment",
    tags=["baseline", "paper1"],
) as run:
    ...

wandb.init() は、Run オブジェクトを返します。

注意：run は、wandb.init() を呼び出すときにプロジェクトが既に存在する場合、既存のプロジェクトに追加されます。たとえば、“cat-classification” というプロジェクトが既にある場合、そのプロジェクトは引き続き存在し、削除されません。代わりに、新しい run がそのプロジェクトに追加されます。

ハイパーパラメーターの辞書をキャプチャ

学習率やモデルタイプなどのハイパーパラメーターの辞書を保存します。config でキャプチャするモデルの設定は、後で結果を整理してクエリするのに役立ちます。

with wandb.init(
    ...,
    config={"epochs": 100, "learning_rate": 0.001, "batch_size": 128},
) as run:
    ...

実験の構成方法の詳細については、実験の構成を参照してください。

トレーニングループ内でメトリクスをログ記録

run.log() を呼び出して、精度や損失など、各トレーニングステップに関するメトリクスをログ記録します。

model, dataloader = get_model(), get_data()

for epoch in range(run.config.epochs):
    for batch in dataloader:
        loss, accuracy = model.training_step()
        run.log({"accuracy": accuracy, "loss": loss})

W&B でログ記録できるさまざまなデータタイプの詳細については、実験中のデータのログ記録を参照してください。

W&B にアーティファクトをログ記録

オプションで、W&B Artifact をログ記録します。Artifacts を使用すると、データセットとモデルを簡単にバージョン管理できます。

# You can save any file or even a directory. In this example, we pretend
# the model has a save() method that outputs an ONNX file.
model.save("path_to_model.onnx")
run.log_artifact("path_to_model.onnx", name="trained-model", type="model")

Artifacts または Registry でのモデルのバージョン管理について詳しく学びましょう。

まとめ

上記のコードスニペットを使用した完全なスクリプトは、以下にあります。

import wandb

with wandb.init(
    project="cat-classification",
    notes="",
    tags=["baseline", "paper1"],
    # Record the run's hyperparameters.
    config={"epochs": 100, "learning_rate": 0.001, "batch_size": 128},
) as run:
    # Set up model and data.
    model, dataloader = get_model(), get_data()

    # Run your training while logging metrics to visualize model performance.
    for epoch in range(run.config["epochs"]):
        for batch in dataloader:
            loss, accuracy = model.training_step()
            run.log({"accuracy": accuracy, "loss": loss})

    # Upload the trained model as an artifact.
    model.save("path_to_model.onnx")
    run.log_artifact("path_to_model.onnx", name="trained-model", type="model")

次のステップ：実験を視覚化する

W&B ダッシュボードを、機械学習モデルからの結果を整理して視覚化するための一元的な場所として使用します。数回クリックするだけで、パラレル座標図、パラメータの重要性分析などの豊富なインタラクティブなグラフを構築できます。その他もあります。

実験と特定の run の表示方法の詳細については、実験からの結果の視覚化を参照してください。

ベストプラクティス

以下は、実験を作成する際に考慮すべき推奨ガイドラインです。

run を完了させる: wandb.init() を with ステートメントで使用して、コードが完了するか例外が発生したときに、run が自動的に完了としてマークされるようにします。
- Jupyter ノートブックでは、Run オブジェクトを自分で管理する方が便利な場合があります。この場合、Run オブジェクトで finish() を明示的に呼び出して、完了としてマークできます。
```
# In a notebook cell:
run = wandb.init()

# In a different cell:
run.finish()
```
Config: ハイパーパラメーター、 architecture 、データセット、モデルを再現するために使用したいその他のものを追跡します。これらは列に表示されます。 config 列を使用して、アプリで run を動的にグループ化、並べ替え、フィルター処理します。
Project: プロジェクトは、一緒に比較できる実験のセットです。各プロジェクトには専用のダッシュボードページがあり、さまざまなモデルバージョンを比較するために、さまざまな run のグループを簡単にオン/オフにできます。
Notes: スクリプトから直接クイックコミットメッセージを設定します。W&B App の run の概要セクションでノートを編集してアクセスします。
Tags: ベースライン run とお気に入りの run を識別します。タグを使用して run をフィルター処理できます。W&B App のプロジェクトのダッシュボードの概要セクションで、後でタグを編集できます。
複数の run セットを作成して実験を比較する: 実験を比較するときは、メトリクスを簡単に比較できるように複数の run セットを作成します。同じグラフまたはグラフのグループで run セットのオン/オフを切り替えることができます。

次のコードスニペットは、上記のベストプラクティスを使用して W&B の実験を定義する方法を示しています。

import wandb

config = {
    "learning_rate": 0.01,
    "momentum": 0.2,
    "architecture": "CNN",
    "dataset_id": "cats-0192",
}

with wandb.init(
    project="detect-cats",
    notes="tweak baseline",
    tags=["baseline", "paper1"],
    config=config,
) as run:
    ...

W&B の実験を定義する際に使用できるパラメータの詳細については、API Reference Guide の wandb.init API ドキュメントを参照してください。

1.2 - Configure experiments

実験の設定を保存するには、辞書のようなオブジェクトを使用します

Try in Colab

config プロパティを使用すると、トレーニングの設定を保存できます。

ハイパーパラメータ
データセット名やモデルタイプなどの入力設定
実験のその他の独立変数

run.config プロパティを使用すると、実験の分析や将来の作業の再現が容易になります。W&B App で設定値ごとにグループ化したり、異なる W&B の run の設定を比較したり、各トレーニング設定がアウトプットに与える影響を評価したりできます。config プロパティは、複数の辞書のようなオブジェクトから構成できる辞書のようなオブジェクトです。

損失や精度などの出力メトリクスや従属変数を保存するには、run.config の代わりに run.log を使用してください。

実験設定の構成

通常、設定はトレーニングスクリプトの最初に定義されます。ただし、機械学習のワークフローは異なる場合があるため、トレーニングスクリプトの最初に設定を定義する必要はありません。

config 変数名では、ピリオド（.）の代わりにダッシュ（-）またはアンダースコア（_）を使用してください。

スクリプトがルートより下の run.config キーにアクセスする場合は、属性アクセス構文 config.key.value の代わりに辞書アクセス構文 ["key"]["value"] を使用してください。

以下のセクションでは、実験設定を定義するさまざまな一般的なシナリオについて概説します。

初期化時に設定を構成する

W&B Run としてデータを同期およびログ記録するためのバックグラウンドプロセスを生成するために、wandb.init() API を呼び出すときに、スクリプトの先頭で辞書を渡します。

次のコードスニペットは、設定値を持つ Python 辞書を定義する方法と、W&B Run を初期化するときにその辞書を引数として渡す方法を示しています。

import wandb

# config 辞書オブジェクトを定義します
config = {
    "hidden_layer_sizes": [32, 64],
    "kernel_sizes": [3],
    "activation": "ReLU",
    "pool_sizes": [2],
    "dropout": 0.5,
    "num_classes": 10,
}

# W&B を初期化するときに config 辞書を渡します
with wandb.init(project="config_example", config=config) as run:
    ...

config としてネストされた辞書を渡すと、W&B はドットを使用して名前をフラット化します。

Python の他の辞書にアクセスするのと同じように、辞書から値にアクセスします。

# インデックス値としてキーを使用して値にアクセスします
hidden_layer_sizes = run.config["hidden_layer_sizes"]
kernel_sizes = run.config["kernel_sizes"]
activation = run.config["activation"]

# Python 辞書 get() メソッド
hidden_layer_sizes = run.config.get("hidden_layer_sizes")
kernel_sizes = run.config.get("kernel_sizes")
activation = run.config.get("activation")

開発者ガイドと例全体を通して、設定値を個別の変数にコピーしています。このステップはオプションです。これは、読みやすさのために行われています。

argparse で設定を構成する

argparse オブジェクトで設定を構成できます。argparse（引数パーサーの略）は、Python 3.2 以降の標準ライブラリモジュールであり、コマンドライン引数のすべての柔軟性と機能を活用するスクリプトを簡単に作成できます。

これは、コマンドラインから起動されたスクリプトの結果を追跡するのに役立ちます。

次の Python スクリプトは、パーサーオブジェクトを定義して実験設定を定義および設定する方法を示しています。関数 train_one_epoch および evaluate_one_epoch は、このデモンストレーションの目的でトレーニングループをシミュレートするために提供されています。

# config_experiment.py
import argparse
import random

import numpy as np
import wandb


# トレーニングと評価のデモコード
def train_one_epoch(epoch, lr, bs):
    acc = 0.25 + ((epoch / 30) + (random.random() / 10))
    loss = 0.2 + (1 - ((epoch - 1) / 10 + random.random() / 5))
    return acc, loss


def evaluate_one_epoch(epoch):
    acc = 0.1 + ((epoch / 20) + (random.random() / 10))
    loss = 0.25 + (1 - ((epoch - 1) / 10 + random.random() / 6))
    return acc, loss


def main(args):
    # W&B Run を開始します
    with wandb.init(project="config_example", config=args) as run:
        # config 辞書から値にアクセスし、読みやすくするために変数に格納します
        lr = run.config["learning_rate"]
        bs = run.config["batch_size"]
        epochs = run.config["epochs"]

        # トレーニングをシミュレートし、値を W&B に記録します
        for epoch in np.arange(1, epochs):
            train_acc, train_loss = train_one_epoch(epoch, lr, bs)
            val_acc, val_loss = evaluate_one_epoch(epoch)

            run.log(
                {
                    "epoch": epoch,
                    "train_acc": train_acc,
                    "train_loss": train_loss,
                    "val_acc": val_acc,
                    "val_loss": val_loss,
                }
            )


if __name__ == "__main__":
    parser = argparse.ArgumentParser(
        formatter_class=argparse.ArgumentDefaultsHelpFormatter
    )

    parser.add_argument("-b", "--batch_size", type=int, default=32, help="バッチサイズ")
    parser.add_argument(
        "-e", "--epochs", type=int, default=50, help="トレーニングエポック数"
    )
    parser.add_argument(
        "-lr", "--learning_rate", type=int, default=0.001, help="学習率"
    )

    args = parser.parse_args()
    main(args)

スクリプト全体で設定を構成する

スクリプト全体で config オブジェクトにパラメーターを追加できます。次のコードスニペットは、新しいキーと値のペアを config オブジェクトに追加する方法を示しています。

import wandb

# config 辞書オブジェクトを定義します
config = {
    "hidden_layer_sizes": [32, 64],
    "kernel_sizes": [3],
    "activation": "ReLU",
    "pool_sizes": [2],
    "dropout": 0.5,
    "num_classes": 10,
}

# W&B を初期化するときに config 辞書を渡します
with wandb.init(project="config_example", config=config) as run:
    # W&B を初期化した後に config を更新します
    run.config["dropout"] = 0.2
    run.config.epochs = 4
    run.config["batch_size"] = 32

一度に複数の値を更新できます。

run.config.update({"lr": 0.1, "channels": 16})

Run の完了後に設定を構成する

W&B Public API を使用して、完了した Run の config を更新します。

API には、エンティティ、プロジェクト名、および Run の ID を指定する必要があります。これらの詳細は、Run オブジェクトまたは W&B App UI で確認できます。

with wandb.init() as run:
    ...

# 現在のスクリプトまたはノートブックから開始された場合は、Run オブジェクトから次の値を見つけるか、W&B App UI からコピーできます。
username = run.entity
project = run.project
run_id = run.id

# api.run() は wandb.init() とは異なる型のオブジェクトを返すことに注意してください。
api = wandb.Api()
api_run = api.run(f"{username}/{project}/{run_id}")
api_run.config["bar"] = 32
api_run.update()

`absl.FLAGS`

absl フラグを渡すこともできます。

flags.DEFINE_string("model", None, "実行するモデル")  # name, default, help

run.config.update(flags.FLAGS)  # absl フラグを config に追加します

ファイルベースの Configs

config-defaults.yaml という名前のファイルを Run スクリプトと同じディレクトリーに配置すると、Run はファイルで定義されたキーと値のペアを自動的に取得し、run.config に渡します。

次のコードスニペットは、サンプルの config-defaults.yaml YAML ファイルを示しています。

batch_size:
  desc: 各ミニバッチのサイズ
  value: 32

config-defaults.yaml から自動的にロードされたデフォルト値をオーバーライドするには、wandb.init の config 引数で更新された値を設定します。次に例を示します。

import wandb

# カスタム値を渡して config-defaults.yaml をオーバーライドします
with wandb.init(config={"epochs": 200, "batch_size": 64}) as run:
    ...

config-defaults.yaml 以外の構成ファイルをロードするには、--configs コマンドライン 引数を使用し、ファイルへのパスを指定します。

python train.py --configs other-config.yaml

ファイルベースの Configs のユースケース例

Run のメタデータを含む YAML ファイルと、Python スクリプトにハイパーパラメーターの辞書があるとします。ネストされた config オブジェクトに両方を保存できます。

hyperparameter_defaults = dict(
    dropout=0.5,
    batch_size=100,
    learning_rate=0.001,
)

config_dictionary = dict(
    yaml=my_yaml_file,
    params=hyperparameter_defaults,
)

with wandb.init(config=config_dictionary) as run:
    ...

TensorFlow v1 フラグ

TensorFlow フラグを wandb.config オブジェクトに直接渡すことができます。

with wandb.init() as run:
    run.config.epochs = 4

    flags = tf.app.flags
    flags.DEFINE_string("data_dir", "/tmp/data")
    flags.DEFINE_integer("batch_size", 128, "バッチサイズ")
    run.config.update(flags.FLAGS)  # tensorflow フラグを config として追加します

1.3 - Projects

モデルのバージョンを比較し、スクラッチワークスペースで結果を調査し、学びをレポートにエクスポートして、メモと可視化を保存します。

project は、結果の可視化、実験の比較、Artifactsの表示とダウンロード、オートメーションの作成などを行う中心的な場所です。

各projectには、誰がそれにアクセスできるかを決定する可視性の設定があります。誰が project にアクセスできるかの詳細については、Project visibility を参照してください。

各 project には、サイドバーからアクセスできる次のものが含まれています。

Overview: project のスナップショット
Workspace: 個人的な可視化サンドボックス
Runs: project 内のすべての run をリストしたテーブル
Automations: project で構成されたオートメーション
Sweeps: 自動化された探索と最適化
Reports: ノート、run、グラフの保存されたスナップショット
Artifacts: すべての run とその run に関連付けられた Artifacts が含まれています

Overview タブ

Project name: project の名前。W&B は、project フィールドに指定した名前で run を初期化すると、project を作成します。project の名前は、右上隅にある Edit ボタンを選択すると、いつでも変更できます。
Description: project の説明。
Project visibility: project の可視性。誰がアクセスできるかを決定する可視性設定。詳細については、Project visibility を参照してください。
Last active: この project に最後にデータが記録されたときのタイムスタンプ
Owner: この project のエンティティ
Contributors: この project に貢献するユーザーの数
Total runs: この project 内の run の総数
Total compute: この合計を取得するために、project 内のすべての run 時間を合計します。
Undelete runs: ドロップダウンメニューをクリックし、[Undelete all runs] をクリックして、project 内で削除された run を復元します。
Delete project: 右隅にあるドットメニューをクリックして、project を削除します。

ライブの例を見る

Workspace タブ

project の workspace は、実験を比較するための個人的なサンドボックスを提供します。異なるアーキテクチャ、ハイパーパラメーター、データセット、プロセッシングなどで同じ問題に取り組んでいる、比較できる Models を整理するために project を使用します。

Runs Sidebar: project 内のすべての run のリスト。

Dot menu: サイドバーの行にカーソルを合わせると、左側にメニューが表示されます。このメニューを使用して、run の名前を変更したり、run を削除したり、アクティブな run を停止したりできます。
Visibility icon: グラフ上の run のオンとオフを切り替えるには、目のアイコンをクリックします。
Color: run の色をプリセットのいずれか、またはカスタムの色に変更します。
Search: 名前で run を検索します。これにより、プロットで表示される run もフィルター処理されます。
Filter: サイドバーフィルターを使用して、表示される run のセットを絞り込みます。
Group: 設定列を選択して、たとえばアーキテクチャごとに run を動的にグループ化します。グループ化すると、プロットには平均値に沿った線と、グラフ上のポイントの分散の影付き領域が表示されます。
Sort: 損失が最小または精度が最大の run など、run の並べ替えに使用する値を選択します。並べ替えは、グラフに表示される run に影響します。
Expand button: サイドバーをテーブル全体に展開します。
Run count: 上部のかっこ内の数値は、project 内の run の総数です。数値 (N visualized) は、目のアイコンがオンになっており、各プロットで可視化できる run の数です。以下の例では、グラフには 183 の run のうち最初の 10 個のみが表示されています。グラフを編集して、表示される run の最大数を増やします。

Runs tab で列をピン留め、非表示、または順序を変更すると、Runs サイドバーにこれらのカスタマイズが反映されます。

Panels layout: このスクラッチスペースを使用して、結果を調べたり、チャートを追加および削除したり、さまざまなメトリクスに基づいて Models のバージョンを比較したりできます。

ライブの例を見る

パネルのセクションを追加する

セクションドロップダウンメニューをクリックし、[Add section] をクリックして、パネルの新しいセクションを作成します。セクションの名前を変更したり、ドラッグして再編成したり、セクションを展開および折りたたんだりできます。

各セクションの右上隅にはオプションがあります。

Switch to custom layout: カスタムレイアウトでは、パネルのサイズを個別に変更できます。
Switch to standard layout: 標準レイアウトでは、セクション内のすべてのパネルのサイズを一度に変更でき、ページネーションが提供されます。
Add section: ドロップダウンメニューから上下にセクションを追加するか、ページの下部にあるボタンをクリックして新しいセクションを追加します。
Rename section: セクションのタイトルを変更します。
Export section to report: このパネルのセクションを新しい Report に保存します。
Delete section: セクション全体とすべてのチャートを削除します。これは、ワークスペースバーのページの下部にある元に戻すボタンで元に戻すことができます。
Add panel: プラスボタンをクリックして、セクションにパネルを追加します。

セクション間でパネルを移動する

パネルをドラッグアンドドロップして、セクションに再配置および整理します。パネルの右上隅にある [Move] ボタンをクリックして、パネルの移動先のセクションを選択することもできます。

パネルのサイズを変更する

Standard layout: すべてのパネルのサイズは同じに維持され、パネルのページがあります。右下隅をクリックしてドラッグすると、パネルのサイズを変更できます。セクションの右下隅をクリックしてドラッグすると、セクションのサイズを変更できます。
Custom layout: すべてのパネルのサイズは個別に設定され、ページはありません。

メトリクスを検索する

ワークスペースの検索ボックスを使用して、パネルを絞り込みます。この検索は、パネルのタイトル (デフォルトでは可視化されたメトリクスの名前) と一致します。

Runs タブ

Runs タブを使用して、run をフィルター処理、グループ化、および並べ替えます。

次のタブは、Runs タブで実行できる一般的なアクションを示しています。

Runs タブには、project 内の run に関する詳細が表示されます。デフォルトでは、多数の列が表示されます。

表示されているすべての列を表示するには、ページを水平方向にスクロールします。
列の順序を変更するには、列を左右にドラッグします。
列を固定するには、列名にカーソルを合わせ、表示されるアクションメニュー ... をクリックして、Pin column をクリックします。固定された列は、Name 列の後のページの左側に表示されます。固定された列を固定解除するには、Unpin column を選択します。
列を非表示にするには、列名にカーソルを合わせ、表示されるアクションメニュー ... をクリックして、Hide column をクリックします。現在非表示になっているすべての列を表示するには、Columns をクリックします。
- 複数の列を一度に表示、非表示、固定、および固定解除するには、Columns をクリックします。
- 非表示の列の名前をクリックして、非表示を解除します。
- 表示されている列の名前をクリックして、非表示にします。
- 表示されている列の横にあるピンアイコンをクリックして、固定します。

Runs タブをカスタマイズすると、カスタマイズは Workspace タブの Runs セレクターにも反映されます。

テーブル内のすべての行を、指定された列の値で並べ替えます。

マウスを列タイトルに合わせます。ケバブメニュー (3 つの縦のドキュメント) が表示されます。
ケバブメニュー (3 つの縦のドット) で選択します。
Sort Asc または Sort Desc を選択して、行をそれぞれ昇順または降順に並べ替えます。

See the digits for which the model most confidently guessed '0'.

上記の画像は、val_acc という名前のテーブル列の並べ替えオプションを表示する方法を示しています。

ダッシュボードの左上にある Filter ボタンを使用して、式で行全体をフィルター処理します。

See only examples which the model gets wrong.

Add filter を選択して、行に 1 つ以上のフィルターを追加します。3 つのドロップダウンメニューが表示されます。左から右へ、フィルタータイプは、列名、演算子、および値に基づいています。

	列名	二項関係	値
受け入れられる値	文字列	=, ≠, ≤, ≥, IN, NOT IN,	整数、浮動小数点数、文字列、タイムスタンプ、null

式エディターには、列名と論理述語構造のオートコンプリートを使用して、各項のオプションのリストが表示されます。「and」または「or」(および場合によっては括弧) を使用して、複数の論理述語を 1 つの式に接続できます。

上記の画像は、`val_loss` 列に基づいたフィルターを示しています。フィルターは、検証損失が 1 以下の run を表示します。

列ヘッダーの Group by ボタンを使用して、特定の列の値で行全体をグループ化します。

The truth distribution shows small errors: 8s and 2s are confused for 7s and 9s for 2s.

デフォルトでは、これにより、他の数値列が、グループ全体のその列の値の分布を示すヒストグラムに変わります。グループ化は、データ内のより高レベルのパターンを理解するのに役立ちます。

Reports タブ

1 か所で結果のすべてのスナップショットを確認し、チームと学びを共有します。

Sweeps タブ

project から新しい sweep を開始します。

Artifacts タブ

トレーニングデータセットや fine-tuned models から、メトリクスとメディアのテーブルまで、project に関連付けられているすべての Artifacts を表示します。

Overview パネル

Overview パネルには、Artifacts の名前とバージョン、変更を検出して重複を防ぐために使用されるハッシュダイジェスト、作成日、エイリアスなど、Artifacts に関するさまざまな高度な情報が表示されます。ここでエイリアスを追加または削除したり、バージョンと Artifacts 全体の両方に関するメモを取ることができます。

Metadata パネル

Metadata パネルは、Artifacts のメタデータへのアクセスを提供します。このメタデータは、Artifacts の構築時に提供されます。このメタデータには、Artifacts を再構築するために必要な構成引数、詳細情報が見つかる URL、または Artifacts を記録した run 中に生成されたメトリクスが含まれる場合があります。さらに、Artifacts を生成した run の構成と、Artifacts のロギング時の履歴メトリクスを確認できます。

Usage パネル

Usage パネルは、ウェブアプリの外 (たとえば、ローカルマシン上) で使用するために Artifacts をダウンロードするためのコードスニペットを提供します。このセクションでは、Artifacts を出力した run と、Artifacts を入力として使用する run も示し、リンクします。

Files パネル

Files パネルには、Artifacts に関連付けられているファイルとフォルダーがリストされます。W&B は、run の特定のファイルを自動的にアップロードします。たとえば、requirements.txt は run が使用した各ライブラリのバージョンを示し、wandb-metadata.json および wandb-summary.json には run に関する情報が含まれています。run の構成に応じて、Artifacts やメディアなど、他のファイルがアップロードされる場合があります。このファイルツリーをナビゲートして、W&B ウェブアプリでコンテンツを直接表示できます。

Artifacts に関連付けられた Tables は、このコンテキストで特に豊富でインタラクティブです。Artifacts で Tables を使用する方法について詳しくは、こちらをご覧ください。

Lineage パネル

Lineage パネルは、project に関連付けられているすべての Artifacts と、それらを相互に接続する run のビューを提供します。これは、run タイプをブロックとして、Artifacts を円として表示し、特定のタイプの run が特定のタイプの Artifacts を消費または生成するときを示す矢印を表示します。左側の列で選択された特定の Artifacts のタイプが強調表示されます。

[Explode] トグルをクリックすると、個々の Artifacts バージョンと、それらを接続する特定の run がすべて表示されます。

Action History Audit タブ

アクション履歴監査タブには、リソースの進化全体を監査できるように、Collection のすべてのエイリアスアクションとメンバーシップの変更が表示されます。

Versions タブ

Versions タブには、Artifacts のすべてのバージョンと、バージョンのロギング時の Run History の各数値の値の列が表示されます。これにより、パフォーマンスを比較し、関心のあるバージョンをすばやく特定できます。

project にスターを付ける

project にスターを追加して、その project を重要としてマークします。あなたとあなたのチームがスターで重要としてマークした project は、組織のホームページの上部に表示されます。

たとえば、次の画像は、重要としてマークされている 2 つの project、zoo_experiment と registry_demo を示しています。両方の project は、組織のホームページの Starred projects セクションの上部に表示されます。

project を重要としてマークするには、project の Overview タブ内またはチームのプロファイルページの 2 つの方法があります。

W&B アプリ ( https://wandb.ai/<team>/<project-name> ) で W&B project に移動します。
project サイドバーから Overview タブを選択します。
右上隅にある Edit ボタンの横にあるスターアイコンを選択します。

チームのプロファイルページ ( https://wandb.ai/<team>/projects ) に移動します。
Projects タブを選択します。
スターを付ける project の横にマウスを合わせます。表示されるスターアイコンをクリックします。

たとえば、次の画像は、“Compare_Zoo_Models” project の横にあるスターアイコンを示しています。

アプリの左上隅にある組織名をクリックして、project が組織のランディングページに表示されることを確認します。

project を削除する

Overview タブの右側にある 3 つのドットをクリックして、project を削除できます。

project が空の場合、右上にあるドロップダウンメニューをクリックし、Delete project を選択して削除できます。

project にメモを追加する

説明の概要として、またはワークスペース内のマークダウンパネルとして、project にメモを追加します。

説明の概要を project に追加する

ページに追加する説明は、プロファイルの Overview タブに表示されます。

W&B project に移動します。
project サイドバーから Overview タブを選択します。
右上隅にある [Edit] を選択します。
Description フィールドにメモを追加します。
Save ボタンを選択します。

Create reports to create descriptive notes comparing runs

W&B Report を作成して、プロットとマークダウンを並べて追加することもできます。異なるセクションを使用して異なる run を表示し、作業内容に関するストーリーを伝えます。

run ワークスペースにメモを追加する

W&B project に移動します。
project サイドバーから Workspace タブを選択します。
右上隅にある Add panels ボタンを選択します。
表示されるモーダルから TEXT AND CODE ドロップダウンを選択します。
Markdown を選択します。
ワークスペースに表示されるマークダウンパネルにメモを追加します。

1.4 - View experiments results

インタラクティブな可視化で run のデータを探索できるプレイグラウンド

W&B workspace は、チャートをカスタマイズし、モデルの結果を探索するための個人的なサンドボックスです。W&B workspace は、 Tables と Panel sections で構成されています。

Tables: あなたの project にログされたすべての run は、その project のテーブルにリストされます。run のオン/オフ、色の変更、テーブルの展開などを行い、各 run のノート、config、サマリー metrics を確認できます。
Panel sections: 1つまたは複数の panels を含むセクション。新しいパネルを作成し、それらを整理し、workspace のスナップショットを保存するために Reports にエクスポートします。

Workspace の種類

workspace には、主に Personal workspaces と Saved views の2つのカテゴリがあります。

Personal workspaces: model と data visualization を詳細に分析するための、カスタマイズ可能な workspace です。workspace のオーナーのみが編集して変更を保存できます。チームメイトは personal workspace を表示できますが、他のユーザーの personal workspace を変更することはできません。
Saved views: Saved views は、workspace のコラボレーティブなスナップショットです。あなたの team の誰でも、保存された workspace view を表示、編集、および変更を保存できます。実験管理、runs などをレビューおよび議論するために、保存された workspace view を使用します。

次の図は、Cécile-parker のチームメイトによって作成された複数の personal workspace を示しています。この project には、保存された view はありません。

保存された workspace view

カスタマイズされた workspace view で team のコラボレーションを改善します。保存された View を作成して、チャートと data の好みの設定を整理します。

新しい保存済み workspace view を作成する

personal workspace または保存された view に移動します。
workspace を編集します。
workspace の右上隅にあるミートボールメニュー（3つの水平ドット）をクリックします。Save as a new view をクリックします。

新しい保存された view は、workspace ナビゲーションメニューに表示されます。

保存された workspace view を更新する

保存された変更は、保存された view の以前の状態を上書きします。保存されていない変更は保持されません。W&B で保存された workspace view を更新するには：

保存された view に移動します。
workspace 内で、チャートと data に必要な変更を加えます。
Save ボタンをクリックして、変更を確定します。

workspace view への更新を保存すると、確認ダイアログが表示されます。今後このプロンプトを表示しない場合は、保存を確定する前に Do not show this modal next time オプションを選択してください。

保存された workspace view を削除する

不要になった保存された view を削除します。

削除する保存された view に移動します。
view の右上にある3つの水平線（…）を選択します。
Delete view を選択します。
削除を確定して、workspace メニューから view を削除します。

workspace view を共有する

workspace の URL を直接共有して、カスタマイズされた workspace を team と共有します。workspace project へのアクセス権を持つすべてのユーザーは、その workspace の保存された View を見ることができます。

プログラムで workspace を作成する

wandb-workspaces は、W&B workspace と Reports をプログラムで操作するための Python library です。

wandb-workspaces を使用して、プログラムで workspace を定義します。wandb-workspaces は、W&B workspace と Reports をプログラムで操作するための Python library です。

workspace のプロパティは、次のように定義できます。

panel のレイアウト、色、およびセクションの順序を設定します。
デフォルトのx軸、セクションの順序、およびコラプス状態など、workspace の設定を構成します。
セクション内にパネルを追加およびカスタマイズして、workspace view を整理します。
URL を使用して、既存の workspace をロードおよび変更します。
既存の workspace への変更を保存するか、新しい view として保存します。
簡単な式を使用して、runs をプログラムでフィルタリング、グループ化、およびソートします。
色や可視性などの設定で、run の外観をカスタマイズします。
統合と再利用のために、ある workspace から別の workspace に view をコピーします。

Workspace API をインストールする

wandb に加えて、wandb-workspaces をインストールしてください。

pip install wandb wandb-workspaces

プログラムで workspace view を定義して保存する

import wandb_workspaces.reports.v2 as wr

workspace = ws.Workspace(entity="your-entity", project="your-project", views=[...])
workspace.save()

既存の view を編集する

existing_workspace = ws.Workspace.from_url("workspace-url")
existing_workspace.views[0] = ws.View(name="my-new-view", sections=[...])
existing_workspace.save()

workspace の `saved view` を別の workspace にコピーする

old_workspace = ws.Workspace.from_url("old-workspace-url")
old_workspace_view = old_workspace.views[0]
new_workspace = ws.Workspace(entity="new-entity", project="new-project", views=[old_workspace_view])

new_workspace.save()

workspace API の包括的な例については、wandb-workspace examples を参照してください。エンドツーエンドのチュートリアルについては、Programmatic Workspaces チュートリアルを参照してください。

1.5 - What are runs?

W&B の基本的な構成要素である Runs について学びましょう。

run は、W&B によってログされる計算の単一の単位です。W&B の run は、プロジェクト全体の原子要素と考えることができます。つまり、各 run は、モデルのトレーニングと結果のログ、ハイパーパラメーターのスイープなど、特定の計算の記録です。

run を開始する一般的なパターンには、以下が含まれますが、これらに限定されません。

モデルのトレーニング
ハイパーパラメーターを変更して新しい実験を行う
異なるモデルで新しい機械学習実験を行う
W&B Artifact としてデータまたはモデルをログする
W&B Artifact をダウンロードする

W&B は、作成した run を プロジェクト に保存します。run とそのプロパティは、W&B App UI の run のプロジェクトワークスペース内で表示できます。また、wandb.Api.Run オブジェクトを使用して、プログラムで run のプロパティにアクセスすることもできます。

run.log でログするものはすべて、その run に記録されます。次のコードスニペットを検討してください。

import wandb

run = wandb.init(entity="nico", project="awesome-project")
run.log({"accuracy": 0.9, "loss": 0.1})

最初の行は、W&B Python SDK をインポートします。2 行目は、エンティティ nico の下のプロジェクト awesome-project で run を初期化します。3 行目は、モデルの精度と損失をその run にログします。

ターミナル内で、W&B は以下を返します。

wandb: Syncing run earnest-sunset-1
wandb: ⭐️ View project at https://wandb.ai/nico/awesome-project
wandb: 🚀 View run at https://wandb.ai/nico/awesome-project/runs/1jx1ud12
wandb:                                                                                
wandb: 
wandb: Run history:
wandb: accuracy  
wandb:     loss  
wandb: 
wandb: Run summary:
wandb: accuracy 0.9
wandb:     loss 0.5
wandb: 
wandb: 🚀 View run earnest-sunset-1 at: https://wandb.ai/nico/awesome-project/runs/1jx1ud12
wandb: ⭐️ View project at: https://wandb.ai/nico/awesome-project
wandb: Synced 6 W&B file(s), 0 media file(s), 0 artifact file(s) and 0 other file(s)
wandb: Find logs at: ./wandb/run-20241105_111006-1jx1ud12/logs

ターミナルで W&B が返す URL は、W&B App UI の run のワークスペースにリダイレクトします。ワークスペースで生成されるパネルは、単一のポイントに対応していることに注意してください。

単一の時点でのメトリクスのログは、それほど役に立たない場合があります。判別モデルのトレーニングの場合のより現実的な例は、一定の間隔でメトリクスをログすることです。たとえば、次のコードスニペットを検討してください。

epochs = 10
lr = 0.01

run = wandb.init(
    entity="nico",
    project="awesome-project",
    config={
        "learning_rate": lr,
        "epochs": epochs,
    },
)

offset = random.random() / 5

# simulating a training run
for epoch in range(epochs):
    acc = 1 - 2**-epoch - random.random() / (epoch + 1) - offset
    loss = 2**-epoch + random.random() / (epoch + 1) + offset
    print(f"epoch={epoch}, accuracy={acc}, loss={loss}")
    run.log({"accuracy": acc, "loss": loss})

これにより、次の出力が返されます。

wandb: Syncing run jolly-haze-4
wandb: ⭐️ View project at https://wandb.ai/nico/awesome-project
wandb: 🚀 View run at https://wandb.ai/nico/awesome-project/runs/pdo5110r
lr: 0.01
epoch=0, accuracy=-0.10070974957523078, loss=1.985328507123956
epoch=1, accuracy=0.2884687745057535, loss=0.7374362314407752
epoch=2, accuracy=0.7347387967382066, loss=0.4402409835486663
epoch=3, accuracy=0.7667969248039795, loss=0.26176963846423457
epoch=4, accuracy=0.7446848791003173, loss=0.24808611724405083
epoch=5, accuracy=0.8035095836268268, loss=0.16169791827329466
epoch=6, accuracy=0.861349032371624, loss=0.03432578493587426
epoch=7, accuracy=0.8794926436276016, loss=0.10331872172219471
epoch=8, accuracy=0.9424839917077272, loss=0.07767793473500445
epoch=9, accuracy=0.9584880427028566, loss=0.10531971149250456
wandb: 🚀 View run jolly-haze-4 at: https://wandb.ai/nico/awesome-project/runs/pdo5110r
wandb: Find logs at: wandb/run-20241105_111816-pdo5110r/logs

トレーニングスクリプトは run.log を 10 回呼び出します。スクリプトが run.log を呼び出すたびに、W&B はそのエポックの精度と損失をログします。W&B が前の出力から出力する URL を選択すると、W&B App UI の run のワークスペースに移動します。

スクリプトが wandb.init メソッドを 1 回だけ呼び出すため、W&B はシミュレートされたトレーニングループを jolly-haze-4 という単一の run 内でキャプチャすることに注意してください。

別の例として、sweep 中に、W&B は指定したハイパーパラメーター探索空間を探索します。W&B は、sweep が作成する新しいハイパーパラメーターの組み合わせを、一意の run として実装します。

run を初期化する

wandb.init() を使用して W&B run を初期化します。次のコードスニペットは、W&B Python SDK をインポートして run を初期化する方法を示しています。

山かっこ (< >) で囲まれた値を、自分の値に置き換えてください。

import wandb

run = wandb.init(entity="<entity>", project="<project>")

run を初期化すると、W&B はプロジェクトフィールドに指定したプロジェクト (wandb.init(project="<project>" に run をログします。W&B は、プロジェクトがまだ存在しない場合は、新しいプロジェクトを作成します。プロジェクトがすでに存在する場合は、W&B はそのプロジェクトに run を保存します。

プロジェクト名を指定しない場合、W&B は run を Uncategorized というプロジェクトに保存します。

W&B の各 run には、run ID と呼ばれる一意の識別子があります。一意の ID を指定するか、W&B に ID をランダムに生成させることができます。

各 run には、人間が読める run 名 としても知られる一意でない識別子もあります。run の名前を指定するか、W&B にランダムに生成させることができます。

たとえば、次のコードスニペットを考えてみましょう。

import wandb

run = wandb.init(entity="wandbee", project="awesome-project")

コードスニペットは、次の出力を生成します。

🚀 View run exalted-darkness-6 at: 
https://wandb.ai/nico/awesome-project/runs/pgbn9y21
Find logs at: wandb/run-20241106_090747-pgbn9y21/logs

上記のコードが id パラメータの引数を指定しなかったため、W&B は一意の run ID を作成します。nico は run をログしたエンティティ、awesome-project は run がログされるプロジェクトの名前、exalted-darkness-6 は run の名前、pgbn9y21 は run ID です。

Notebook users

run の最後に run.finish() を指定して、run が完了したことを示します。これにより、run がプロジェクトに適切にログされ、バックグラウンドで継続されないようになります。

import wandb

run = wandb.init(entity="<entity>", project="<project>")
# Training code, logging, and so forth
run.finish()

各 run には、run の現在のステータスを記述する状態があります。可能な run の状態の完全なリストについては、Run の状態を参照してください。

Run の状態

次のテーブルは、run がとりうる状態を記述しています。

状態	説明
Finished	run が終了し、完全にデータが同期されたか、`wandb.finish()` が呼び出されました
Failed	run が 0 以外の終了ステータスで終了しました
Crashed	run が内部プロセスでハートビートの送信を停止しました。これは、マシンがクラッシュした場合に発生する可能性があります
Running	run はまだ実行中で、最近ハートビートを送信しました

一意の run 識別子

Run ID は、run の一意の識別子です。デフォルトでは、新しい run を初期化すると、W&B がランダムで一意の run ID を生成します。run を初期化するときに、独自の一意の run ID を指定することもできます。

自動生成された run ID

run を初期化するときに run ID を指定しない場合、W&B はランダムな run ID を生成します。run の一意の ID は、W&B App UI で確認できます。

https://wandb.ai/home の W&B App UI に移動します。
run の初期化時に指定した W&B プロジェクトに移動します。
プロジェクトのワークスペース内で、[Runs] タブを選択します。
[Overview] タブを選択します。

W&B は、[Run パス] フィールドに一意の run ID を表示します。run パスは、チームの名前、プロジェクトの名前、run ID で構成されます。一意の ID は、run パスの最後の部分です。

たとえば、次の図では、一意の run ID は 9mxi1arc です。

カスタム run ID

wandb.init メソッドに id パラメータを渡すことで、独自の run ID を指定できます。

import wandb

run = wandb.init(entity="<project>", project="<project>", id="<run-id>")

run の一意の ID を使用して、W&B App UI で run の Overview ページに直接移動できます。次のセルは、特定の run の URL パスを示しています。

https://wandb.ai/<entity>/<project>/<run-id>

山かっこ (< >) で囲まれた値は、エンティティ、プロジェクト、run ID の実際の値のプレースホルダーです。

run に名前を付ける

run の名前は、人間が読める一意でない識別子です。

デフォルトでは、W&B は新しい run を初期化するときにランダムな run 名を生成します。run の名前は、プロジェクトのワークスペース内と、run の Overview ページの上部に表示されます。

run 名は、プロジェクトワークスペースで run をすばやく識別する方法として使用します。

wandb.init メソッドに name パラメータを渡すことで、run の名前を指定できます。

import wandb

run = wandb.init(entity="<project>", project="<project>", name="<run-name>")

run にメモを追加する

特定の run に追加するメモは、[Overview] タブの run ページと、プロジェクトページの run のテーブルに表示されます。

W&B プロジェクトに移動します
プロジェクトサイドバーから [Workspace] タブを選択します
run セレクターからメモを追加する run を選択します
[Overview] タブを選択します
[Description] フィールドの横にある鉛筆アイコンを選択し、メモを追加します

run を停止する

W&B App またはプログラムで run を停止します。

run を初期化したターミナルまたはコードエディタに移動します。
Ctrl+D を押して run を停止します。

たとえば、上記の手順に従うと、ターミナルは次のようになります。

KeyboardInterrupt
wandb: 🚀 View run legendary-meadow-2 at: https://wandb.ai/nico/history-blaster-4/runs/o8sdbztv
wandb: Synced 5 W&B file(s), 0 media file(s), 0 artifact file(s) and 1 other file(s)
wandb: Find logs at: ./wandb/run-20241106_095857-o8sdbztv/logs

W&B App UI に移動して、run がアクティブでなくなったことを確認します。

run がログされているプロジェクトに移動します。
run の名前を選択します。

停止する run の名前は、ターミナルまたはコードエディタの出力から確認できます。たとえば、上記の例では、run の名前は legendary-meadow-2 です。

3. プロジェクトサイドバーから [**Overview**] タブを選択します。

[State] フィールドの横で、run の状態が running から Killed に変わります。

run がログされているプロジェクトに移動します。
run セレクター内で停止する run を選択します。
プロジェクトサイドバーから [Overview] タブを選択します。
[State] フィールドの横にある上部のボタンを選択します。

[State] フィールドの横で、run の状態が running から Killed に変わります。

可能な run の状態の完全なリストについては、State フィールドを参照してください。

ログに記録された run を表示する

run の状態、run にログされた Artifacts、run 中に記録されたログファイルなど、特定の run に関する情報を表示します。

特定の run を表示するには:

https://wandb.ai/home の W&B App UI に移動します。
run の初期化時に指定した W&B プロジェクトに移動します。
プロジェクトサイドバー内で、[Workspace] タブを選択します。
run セレクター内で、表示する run をクリックするか、run 名の一部を入力して、一致する run をフィルターします。

デフォルトでは、長い run 名は読みやすくするために中央で切り捨てられます。代わりに、run 名を先頭または末尾で切り捨てるには、run のリストの上部にあるアクション ... メニューをクリックし、[Run 名のトリミング] を設定して、末尾、中央、または先頭をトリミングします。

特定の run の URL パスには、次の形式があることに注意してください。

https://wandb.ai/<team-name>/<project-name>/runs/<run-id>

山かっこ (< >) で囲まれた値は、チーム名、プロジェクト名、run ID の実際の値のプレースホルダーです。

Overviewタブ

[Overview] タブを使用して、プロジェクト内の特定の run 情報について学習します。次に例を示します。

Author: run を作成する W&B エンティティ。
Command: run を初期化するコマンド。
Description: 提供した run の説明。run の作成時に説明を指定しない場合、このフィールドは空です。W&B App UI を使用するか、Python SDK でプログラムで説明を run に追加できます。
Duration: run がアクティブに計算またはデータをログしている時間。一時停止または待機は除きます。
Git リポジトリ: run に関連付けられている git リポジトリ。git を有効にするして、このフィールドを表示する必要があります。
Host name: W&B が run を計算する場所。マシンでローカルに run を初期化する場合は、マシンの名前が表示されます。
Name: run の名前。
OS: run を初期化するオペレーティングシステム。
Python 実行可能ファイル: run を開始するコマンド。
Python バージョン: run を作成する Python バージョンを指定します。
Run パス: entity/project/run-ID の形式で一意の run 識別子を識別します。
Runtime: run の開始から終了までの合計時間を測定します。これは、run のウォールクロック時間です。Runtime には、run が一時停止している時間またはリソースを待機している時間が含まれますが、Duration は含まれません。
Start time: run を初期化するタイムスタンプ。
State: run の状態。
System hardware: W&B が run の計算に使用するハードウェア。
Tags: 文字列のリスト。タグは、関連する run をまとめて編成したり、baseline や production などの一時的なラベルを適用したりするのに役立ちます。
W&B CLI バージョン: run コマンドをホストしたマシンにインストールされている W&B CLI バージョン。

W&B は、概要セクションの下に次の情報を保存します。

Artifact Outputs: run によって生成された Artifacts 出力。
Config: wandb.config で保存された config パラメータのリスト。
Summary: wandb.log() で保存された summary パラメータのリスト。デフォルトでは、W&B はこの値を最後にログされた値に設定します。

プロジェクトの概要の例はこちらをご覧ください。

Workspaceタブ

[Workspace] タブを使用して、自動生成されたカスタムプロット、システムメトリクスなど、可視化を表示、検索、グループ化、および配置します。

プロジェクトワークスペースの例はこちらをご覧ください

Runsタブ

[Runs] タブを使用して、run をフィルター、グループ化、および並べ替えます。

次のタブは、[Runs] タブで実行できる一般的なアクションの一部を示しています。

[Runs] タブには、プロジェクト内の run に関する詳細が表示されます。デフォルトでは、多数の列が表示されます。

表示されているすべての列を表示するには、ページを水平方向にスクロールします。
列の順序を変更するには、列を左または右にドラッグします。
列をピン留めするには、列名の上にカーソルを置き、表示されるアクションメニュー ... をクリックし、[Pin column] をクリックします。ピン留めされた列は、[Name] 列の後、ページの左側の近くに表示されます。ピン留めされた列のピン留めを解除するには、[Unpin column] を選択します
列を非表示にするには、列名の上にカーソルを置き、表示されるアクションメニュー ... をクリックし、[Hide column] をクリックします。現在非表示になっているすべての列を表示するには、[Columns] をクリックします。
複数の列を一度に表示、非表示、ピン留め、およびピン留め解除するには、[Columns] をクリックします。
- 非表示の列の名前をクリックして、非表示を解除します。
- 表示されている列の名前をクリックして、非表示にします。
- 表示されている列の横にあるピンアイコンをクリックしてピン留めします。

[Runs] タブをカスタマイズすると、カスタマイズはWorkspace タブの [Runs] セレクターにも反映されます。

指定された列の値でテーブル内のすべての行を並べ替えます。

マウスを列タイトルの上に移動します。ケバブメニュー (3 つの垂直ドット) が表示されます。
ケバブメニュー (3 つの垂直ドット) を選択します。
[Sort Asc] または [Sort Desc] を選択して、行をそれぞれ昇順または降順に並べ替えます。

上の図は、val_acc という名前のテーブル列の並べ替えオプションを表示する方法を示しています。

ダッシュボードの上にある [Filter] ボタンを使用して、式ですべての行をフィルターします。

[Add filter] を選択して、1 つまたは複数のフィルターを行に追加します。3 つのドロップダウンメニューが表示されます。左から右へのフィルタータイプは、列名、オペレーター、および値に基づいています

	列名	二項関係	値
受け入れられる値	文字列	=, ≠, ≤, ≥, IN, NOT IN,	整数, float, 文字列, タイムスタンプ , null

式エディターには、列名のオートコンプリートと論理述語構造を使用して、各項のオプションのリストが表示されます。「and」または「or」(および場合によっては括弧 ) を使用して、複数の論理述語を 1 つの式に接続できます。

上の図は、`val_loss` 列に基づくフィルターを示しています。このフィルターは、検証損失が 1 以下の run を表示します。

ダッシュボードの上にある [Group by] ボタンを使用して、特定の列の値で行をグループ化します。

デフォルトでは、これにより、他の数値列が、そのグループ全体の列の値の分布を示すヒストグラムに変わります。グループ化は、データのより高レベルのパターンを理解するのに役立ちます。

Systemタブ

[System タブ] には、CPU 使用率、システムメモリ、ディスク I/O、ネットワークトラフィック、GPU 使用率など、特定の run に対して追跡されるシステムメトリクスが表示されます。

W&B が追跡するシステムメトリクスの完全なリストについては、System メトリクスを参照してください。

システムタブの例はこちらをご覧ください。

Logsタブ

[Log タブ] には、コマンドラインに出力された出力 (標準出力 (stdout) や標準エラー (stderr) など) が表示されます。

右上隅にある [Download] ボタンを選択して、ログファイルをダウンロードします。

ログタブの例はこちらをご覧ください。

Filesタブ

[Files タブ] を使用して、モデルチェックポイント、検証セットの例など、特定の run に関連付けられたファイルを表示します

ファイルタブの例はこちらをご覧ください。

Artifactsタブ

[Artifacts] タブには、指定された run の入力および出力アーティファクトが一覧表示されます。

アーティファクトタブの例はこちらをご覧ください。

run を削除する

W&B App を使用して、プロジェクトから 1 つまたは複数の run を削除します。

削除する run が含まれているプロジェクトに移動します。
プロジェクトサイドバーから [Runs] タブを選択します。
削除する run の横にあるチェックボックスをオンにします。
テーブルの上にある [Delete] ボタン ( ゴミ箱アイコン ) を選択します。
表示されるモーダルから、[Delete] を選択します。

特定の ID を持つ run が削除されると、その ID を再度使用できなくなる場合があります。以前に削除された ID で run を開始しようとすると、エラーが表示され、開始が防止されます。

多数の run を含むプロジェクトの場合、検索バーを使用して正規表現を使用して削除する run をフィルターするか、フィルターボタンを使用して、ステータス、タグ、またはその他のプロパティに基づいて run をフィルターできます。

run を整理する

このセクションでは、グループとジョブタイプを使用して run を整理する方法について説明します。run をグループ (たとえば、実験名) に割り当て、ジョブタイプ (たとえば、前処理、トレーニング、評価、デバッグ ) を指定することで、ワークフローを効率化し、モデルの比較を改善できます。

run にグループまたはジョブタイプを割り当てる

W&B の各 run は、[グループ] と [ジョブタイプ] で分類できます。

グループ: 実験の広範なカテゴリで、run の整理とフィルターに使用されます。
ジョブタイプ: preprocessing、training、evaluation など、run の機能。

次のワークスペースの例では、Fashion-MNIST データセットから増え続ける量のデータを使用してベースラインモデルをトレーニングします。ワークスペースでは、使用されるデータ量を色で表します。

黄色から濃い緑は、ベースラインモデルのデータ量が増加していることを示します。
水色からバイオレット、マゼンタは、追加のパラメータを持つ、より複雑な「double」モデルのデータ量を示します。

W&B のフィルターオプションと検索バーを使用して、特定の条件に基づいて run を比較します。次に例を示します。

同じデータセットでのトレーニング。
同じテストセットでの評価。

フィルターを適用すると、[Table] ビューが自動的に更新されます。これにより、モデル間のパフォーマンスの違いを特定できます。たとえば、一方のモデルで他方のモデルよりも大幅に困難なクラスを特定できます。

1.5.1 - Add labels to runs with tags

ログに記録されたメトリクスや Artifact データからは明らかでない、特定の機能を持つ run にラベルを付けるために、タグを追加します。

例えば、run の model が in_production であること、run が preemptible であること、この run が baseline を表していることなどを表すタグを、run に追加できます。

1つまたは複数の run にタグを追加する

プログラムで、またはインタラクティブに、run にタグを追加します。

ユースケースに応じて、ニーズに最も適した以下のタブを選択してください。

run の作成時にタグを追加できます。

import wandb

run = wandb.init(
  entity="entity",
  project="<project-name>",
  tags=["tag1", "tag2"]
)

run を初期化した後にタグを更新することもできます。例えば、以下のコードスニペットは、特定のメトリクスが事前定義された閾値を超えた場合にタグを更新する方法を示しています。

import wandb

run = wandb.init(
  entity="entity", 
  project="capsules", 
  tags=["debug"]
  )

# python logic to train model

if current_loss < threshold:
    run.tags = run.tags + ("release_candidate",)

run の作成後、Public API を使用してタグを更新できます。例：

run = wandb.Api().run("{entity}/{project}/{run-id}")
run.tags.append("tag1")  # you can choose tags based on run data here
run.update()

この方法は、多数の run に同じタグを付けるのに最適です。

プロジェクトの Workspace に移動します。
プロジェクトのサイドバーから Runs を選択します。
テーブルから1つまたは複数の run を選択します。
1つまたは複数の run を選択したら、テーブルの上の Tag ボタンを選択します。
追加するタグを入力し、Create new tag チェックボックスを選択してタグを追加します。

この方法は、1つの run に手動でタグを適用するのに最適です。

プロジェクトの Workspace に移動します。
プロジェクトの Workspace 内の run のリストから run を選択します。
プロジェクトのサイドバーから Overview を選択します。
Tags の横にある灰色のプラスアイコン（+）ボタンを選択します。
追加するタグを入力し、テキストボックスの下にある Add を選択して新しいタグを追加します。

1つまたは複数の run からタグを削除する

タグは、W&B App UI を使用して run から削除することもできます。

この方法は、多数の run からタグを削除するのに最適です。

プロジェクトの Run サイドバーで、右上にあるテーブルアイコンを選択します。これにより、サイドバーが展開されて Runs テーブル全体が表示されます。
テーブル内の run にカーソルを合わせると、左側にチェックボックスが表示されます。または、ヘッダー行にすべての run を選択するためのチェックボックスがあります。
チェックボックスを選択して、一括操作を有効にします。
タグを削除する run を選択します。
run の行の上にある Tag ボタンを選択します。
タグの横にあるチェックボックスを選択して、run からタグを削除します。

Run ページの左側のサイドバーで、一番上の Overview タブを選択します。run のタグがここに表示されます。
タグにカーソルを合わせ、“x” を選択して run から削除します。

1.5.2 - Filter and search runs

プロジェクトページでサイドバーとテーブルを使用する方法

WandB にログされた run からの洞察を得るには、プロジェクトページを使用してください。Workspace ページと Runs ページの両方から、run をフィルタリングおよび検索できます。

run をフィルタリングする

フィルターボタンを使用して、ステータス、タグ、またはその他のプロパティに基づいて run をフィルタリングします。

タグで run をフィルタリングする

フィルターボタンを使用して、タグに基づいて run をフィルタリングします。

正規表現で run をフィルタリングする

正規表現で目的の検索結果が得られない場合は、タグを使用して、Runs Table で run をフィルタリングできます。タグは、run の作成時または完了後に追加できます。タグが run に追加されると、以下の gif に示すようにタグフィルターを追加できます。

If regex doesn't provide you the desired results, you can make use of tags to filter out the runs in Runs Table

run を検索する

正規表現を使用して、指定した正規表現に一致する run を検索します。検索ボックスにクエリを入力すると、Workspace 上のグラフに表示される run が絞り込まれるとともに、テーブルの行もフィルタリングされます。

run をグループ化する

1 つまたは複数の列 (非表示の列を含む) で run をグループ化するには:

検索ボックスの下にある、罫線が引かれた用紙のような Group ボタンをクリックします。
結果をグループ化する 1 つまたは複数の列を選択します。
グループ化された run の各セットは、デフォルトで折りたたまれています。展開するには、グループ名の横にある矢印をクリックします。

最小値と最大値で run を並べ替える

ログに記録されたメトリクスの最小値または最大値で、run テーブルを並べ替えます。これは、記録された最高 (または最低) の値を表示する場合に特に役立ちます。

次のステップでは、記録された最小値または最大値に基づいて、特定のメトリクスで run テーブルを並べ替える方法について説明します。

並べ替えに使用するメトリクスを含む列にマウスを合わせます。
ケバブメニュー (縦の 3 本線) を選択します。
ドロップダウンから、Show min または Show max を選択します。
同じドロップダウンから、Sort by asc または Sort by desc を選択して、それぞれ昇順または降順で並べ替えます。

run の検索終了時間

クライアントプロセスからの最後のハートビートをログに記録する End Time という名前の列を提供します。このフィールドはデフォルトで非表示になっています。

Runs Table を CSV にエクスポート

ダウンロードボタンを使用して、すべての run、ハイパーパラメーター、およびサマリーメトリクスのテーブルを CSV にエクスポートします。

1.5.3 - Fork a run

W&B の run をフォークする

run をフォークする機能はプライベートプレビュー版です。この機能へのアクセスをご希望の場合は、W&B Support (support@wandb.com) までご連絡ください。

既存の W&B の run から「フォーク」するには、wandb.init() で run を初期化する際に fork_from を使用します。run からフォークすると、W&B はソース run の run ID と step を使用して新しい run を作成します。

run をフォークすると、元の run に影響を与えることなく、実験の特定の時点から異なるパラメータまたは model を調べることができます。

run をフォークするには、wandb SDK バージョン 0.16.5 以上が必要です。
run をフォークするには、単調増加する step が必要です。define_metric() で定義された非単調な step を使用してフォークポイントを設定することはできません。run の履歴とシステムメトリクスの本質的な時間順序が崩れるためです。

フォークされた run を開始する

run をフォークするには、wandb.init() で fork_from 引数を使用し、フォーク元のソース run ID とソース run からの step を指定します。

import wandb

# 後でフォークされる run を初期化する
original_run = wandb.init(project="your_project_name", entity="your_entity_name")
# ... トレーニングまたはログの記録を実行 ...
original_run.finish()

# 特定の step から run をフォークする
forked_run = wandb.init(
    project="your_project_name",
    entity="your_entity_name",
    fork_from=f"{original_run.id}?_step=200",
)

イミュータブルな run ID を使用する

イミュータブルな run ID を使用して、特定の run への一貫性があり、変更されない参照を確保します。ユーザーインターフェースからイミュータブルな run ID を取得するには、次の手順に従います。

Overviewタブにアクセスする: ソース run のページの Overviewタブ に移動します。
イミュータブルな Run ID をコピーする: Overview タブの右上隅にある ... メニュー (3 つのドット) をクリックします。ドロップダウンメニューから [イミュータブルな Run ID をコピー] オプションを選択します。

これらの手順に従うことで、run への安定した変更されない参照が得られ、run のフォークに使用できます。

フォークされた run から続行する

フォークされた run を初期化したら、新しい run へのログ記録を続行できます。継続性のために同じメトリクスをログに記録し、新しいメトリクスを導入できます。

たとえば、次のコード例は、最初に run をフォークし、次に 200 のトレーニング step から始まるフォークされた run にメトリクスをログに記録する方法を示しています。

import wandb
import math

# 最初の run を初期化し、いくつかのメトリクスをログに記録する
run1 = wandb.init("your_project_name", entity="your_entity_name")
for i in range(300):
    run1.log({"metric": i})
run1.finish()

# 特定の step で最初の run からフォークし、step 200 から始まるメトリクスをログに記録する
run2 = wandb.init(
    "your_project_name", entity="your_entity_name", fork_from=f"{run1.id}?_step=200"
)

# 新しい run でログ記録を続行する
# 最初のいくつかの step では、run1 からメトリクスをそのままログに記録する
# Step 250 以降は、スパイキーパターンをログに記録し始める
for i in range(200, 300):
    if i < 250:
        run2.log({"metric": i})  # スパイクなしで run1 からログ記録を続行する
    else:
        # Step 250 からスパイキーな振る舞いを導入する
        subtle_spike = i + (2 * math.sin(i / 3.0))  # 微妙なスパイキーパターンを適用する
        run2.log({"metric": subtle_spike})
    # さらに、すべての step で新しいメトリクスをログに記録する
    run2.log({"additional_metric": i * 1.1})
run2.finish()

巻き戻しとフォークの互換性

フォークは、run の管理と実験においてより柔軟性を提供することで、rewind を補完します。

run からフォークすると、W&B は特定のポイントで run から新しいブランチを作成し、異なるパラメータまたは model を試すことができます。

run を巻き戻すと、W&B は run の履歴自体を修正または変更できます。

1.5.4 - Group runs into experiments

トレーニングと評価の run を、より大規模な Experiments にグループ化します。

個々のジョブをグループ化して実験をまとめるには、一意の group 名を wandb.init() に渡します。

ユースケース

分散トレーニング: 実験が、より大きな全体の一部として捉えられるべき個別のトレーニングスクリプトや評価スクリプトに分割されている場合は、グループ化を使用します。
複数のプロセス: 複数のより小さなプロセスをグループ化して、1つの実験としてまとめます。
K-分割交差検証: 異なる乱数シードを持つrunをグループ化して、より大規模な実験を把握します。Sweepsとグループ化を用いたk-分割交差検証の例をご覧ください。

グループ化を設定するには、次の3つの方法があります。

1. スクリプトでグループを設定する

オプションの group と job_type を wandb.init() に渡します。これにより、個々のrunを含む実験ごとに専用のグループページが作成されます。例：wandb.init(group="experiment_1", job_type="eval")

2. グループ環境変数を設定する

WANDB_RUN_GROUP を使用して、runのグループを環境変数として指定します。詳細については、環境変数 に関するドキュメントをご覧ください。Group は、Project 内で一意であり、グループ内のすべてのrunで共有される必要があります。wandb.util.generate_id() を使用して、すべてのプロセスで使用する一意の8文字の文字列を生成できます。たとえば、os.environ["WANDB_RUN_GROUP"] = "experiment-" + wandb.util.generate_id() のようにします。

3. UIでグループ化を切り替える

任意の設定列で動的にグループ化できます。たとえば、wandb.config を使用してバッチサイズまたは学習率をログに記録する場合、Webアプリケーションでこれらのハイパーパラメーターを動的にグループ化できます。

グループ化による分散トレーニング

wandb.init() でグループ化を設定すると、UIでrunがデフォルトでグループ化されます。これは、テーブルの上部にある Group ボタンをクリックしてオン/オフを切り替えることができます。グループ化を設定したサンプルコードから生成されたプロジェクトの例を示します。サイドバーの各「Group」行をクリックすると、その実験専用のグループページに移動できます。

上記のプロジェクトページから、左側のサイドバーにある Group をクリックして、このページのような専用ページに移動できます。

UI での動的なグループ化

任意の列（例えば、ハイパーパラメーター）でrunをグループ化できます。その様子を以下に示します。

サイドバー: Runはエポック数でグループ化されています。
グラフ: 各線はグループの平均値を表し、網掛けは分散を示します。この振る舞いはグラフ設定で変更できます。

グループ化をオフにする

グループ化ボタンをクリックして、グループフィールドをいつでもクリアできます。これにより、テーブルとグラフはグループ化されていない状態に戻ります。

グラフ設定のグループ化

グラフの右上隅にある編集ボタンをクリックし、Advanced タブを選択して、線と網掛けを変更します。各グループの線の平均値、最小値、または最大値を選択できます。網掛けの場合、網掛けをオフにしたり、最小値と最大値、標準偏差、および標準誤差を表示したりできます。

1.5.5 - Move runs

このページでは、ある run を別の project へ、team の内外へ、またはある team から別の team へ移動する方法について説明します。現在の場所と新しい場所で run にアクセスできる必要があります。

run を移動しても、それに関連付けられた過去の Artifacts は移動されません。artifact を手動で移動するには、wandb artifact get SDK コマンドまたは Api.artifact API を使用して artifact をダウンロードし、wandb artifact put または Api.artifact API を使用して run の新しい場所にアップロードします。

Runs タブをカスタマイズするには、Project pageを参照してください。

project 間で run を移動する

ある project から別の project へ run を移動するには:

移動する run が含まれている project に移動します。
project のサイドバーから Runs タブを選択します。
移動する run の横にあるチェックボックスをオンにします。
テーブルの上にある Move ボタンを選択します。
ドロップダウンから移動先の project を選択します。

team へ run を移動する

自分がメンバーである team へ run を移動するには:

移動する run が含まれている project に移動します。
project のサイドバーから Runs タブを選択します。
移動する run の横にあるチェックボックスをオンにします。
テーブルの上にある Move ボタンを選択します。
ドロップダウンから移動先の team と project を選択します。

1.5.6 - Resume a run

一時停止または終了した W&B Run を再開する

run が停止またはクラッシュした場合に、run がどのように振る舞うかを指定します。run を再開するか、run が自動的に再開できるようにするには、id パラメータに対して、その run に関連付けられた一意の run ID を指定する必要があります。

run = wandb.init(entity="<entity>", \ 
        project="<project>", id="<run ID>", resume="<resume>")

W&B は、run を保存する W&B の Project 名を提供することを推奨します。

W&B がどのように応答するかを決定するために、次の引数のいずれかを resume パラメータに渡します。いずれの場合も、W&B は最初に run ID がすでに存在するかどうかを確認します。

引数	説明	Run ID が存在する場合	Run ID が存在しない場合	ユースケース
`"must"`	W&B は、run ID で指定された run を再開する必要があります。	W&B は同じ run ID で run を再開します。	W&B はエラーを発生させます。	同じ run ID を使用する必要がある run を再開します。
`"allow"`	W&B は、run ID が存在する場合に run を再開することを許可します。	W&B は同じ run ID で run を再開します。	W&B は、指定された run ID で新しい run を初期化します。	既存の run を上書きせずに run を再開します。
`"never"`	W&B は、run ID で指定された run を再開することを許可しません。	W&B はエラーを発生させます。	W&B は、指定された run ID で新しい run を初期化します。

resume="auto" を指定して、W&B が自動的に run の再起動を試みるようにすることもできます。ただし、同じディレクトリーから run を再起動する必要があります。run を自動的に再開できるようにするセクションを参照してください。

以下のすべての例で、<> で囲まれた値を独自の値に置き換えてください。

同じ run ID を使用する必要がある run を再開する

run が停止、クラッシュ、または失敗した場合、同じ run ID を使用して再開できます。これを行うには、run を初期化し、以下を指定します。

resume パラメータを "must" (resume="must") に設定します。
停止またはクラッシュした run の run ID を指定します。

次のコードスニペットは、W&B Python SDK でこれを実現する方法を示しています。

run = wandb.init(entity="<entity>", \ 
        project="<project>", id="<run ID>", resume="must")

複数のプロセスが同じ id を同時に使用すると、予期しない結果が発生します。

複数のプロセスを管理する方法の詳細については、分散トレーニング Experiments のログ記録を参照してください。

既存の run を上書きせずに run を再開する

既存の run を上書きせずに、停止またはクラッシュした run を再開します。これは、プロセスが正常に終了しない場合に特に役立ちます。次回 W&B を起動すると、W&B は最後のステップからログの記録を開始します。

W&B で run を初期化するときに、resume パラメータを "allow" (resume="allow") に設定します。停止またはクラッシュした run の run ID を指定します。次のコードスニペットは、W&B Python SDK でこれを実現する方法を示しています。

import wandb

run = wandb.init(entity="<entity>", \ 
        project="<project>", id="<run ID>", resume="allow")

run を自動的に再開できるようにする

次のコードスニペットは、Python SDK または環境変数を使用して、run を自動的に再開できるようにする方法を示しています。

次のコードスニペットは、Python SDK で W&B の run ID を指定する方法を示しています。

<> で囲まれた値を独自の値に置き換えてください。

run = wandb.init(entity="<entity>", \ 
        project="<project>", id="<run ID>", resume="<resume>")

次の例は、bash スクリプトで W&B の WANDB_RUN_ID 変数を指定する方法を示しています。

RUN_ID="$1"

WANDB_RESUME=allow WANDB_RUN_ID="$RUN_ID" python eval.py

ターミナル内で、W&B の run ID と共にシェルスクリプトを実行できます。次のコードスニペットは、run ID akj172 を渡します。

sh run_experiment.sh akj172

自動再開は、プロセスが失敗したプロセスと同じファイルシステム上で再起動された場合にのみ機能します。

たとえば、Users/AwesomeEmployee/Desktop/ImageClassify/training/ というディレクトリーで train.py という Python スクリプトを実行するとします。train.py 内で、スクリプトは自動再開を有効にする run を作成します。次に、トレーニングスクリプトが停止したとします。この run を再開するには、Users/AwesomeEmployee/Desktop/ImageClassify/training/ 内で train.py スクリプトを再起動する必要があります。

ファイルシステムを共有できない場合は、WANDB_RUN_ID 環境変数を指定するか、W&B Python SDK で run ID を渡します。run ID の詳細については、「run とは何ですか?」ページのカスタム run ID セクションを参照してください。

プリエンプティブ Sweeps run の再開

中断された sweep run を自動的に再キューします。これは、プリエンプティブキューの SLURM ジョブ、EC2 スポットインスタンス、または Google Cloud プリエンプティブ VM など、プリエンプションの影響を受けるコンピューティング環境で sweep agent を実行する場合に特に役立ちます。

mark_preempting 関数を使用して、W&B が中断された sweep run を自動的に再キューできるようにします。たとえば、次のコードスニペット

run = wandb.init()  # run を初期化します
run.mark_preempting()

次の表は、sweep run の終了ステータスに基づいて W&B が run をどのように処理するかを示しています。

ステータス	振る舞い
ステータスコード 0	Run は正常に終了したと見なされ、再キューされません。
ゼロ以外のステータス	W&B は、run を sweep に関連付けられた run キューに自動的に追加します。
ステータスなし	Run は sweep run キューに追加されます。Sweep agent は、キューが空になるまで run キューから run を消費します。キューが空になると、sweep キューは sweep 検索アルゴリズムに基づいて新しい run の生成を再開します。

1.5.7 - Rewind a run

巻き戻し

run の巻き戻し

run を巻き戻すオプションは、プライベートプレビュー版です。この機能へのアクセスをご希望の場合は、W&B Support（support@wandb.com）までご連絡ください。

W&B は現在、以下をサポートしていません。

ログの巻き戻し: ログは新しい run セグメントでリセットされます。
システムメトリクスの巻き戻し: W&B は、巻き戻しポイントより後の新しいシステムメトリクスのみを記録します。
Artifact の関連付け: W&B は、Artifact をそれを生成するソース run に関連付けます。

run を巻き戻すには、W&B Python SDK バージョン >= 0.17.1 が必要です。
単調増加するステップを使用する必要があります。define_metric() で定義された非単調なステップは、run の履歴とシステムメトリクスの必要な時系列順序を混乱させるため使用できません。

run を巻き戻して、元のデータを失うことなく、run の履歴を修正または変更します。さらに、run を巻き戻すと、その時点から新しいデータを記録できます。W&B は、新たに記録された履歴に基づいて、巻き戻した run のサマリーメトリクスを再計算します。これは、次の振る舞いを意味します。

履歴の切り捨て: W&B は履歴を巻き戻しポイントまで切り捨て、新しいデータロギングを可能にします。
サマリーメトリクス: 新たに記録された履歴に基づいて再計算されます。
設定の保持: W&B は元の設定を保持し、新しい設定をマージできます。

run を巻き戻すと、W&B は run の状態を指定されたステップにリセットし、元のデータを保持し、一貫した run ID を維持します。これは次のことを意味します。

run のアーカイブ: W&B は元の run をアーカイブします。アーカイブされた run は、Run Overview タブからアクセスできます。
Artifact の関連付け: Artifact をそれを生成する run に関連付けます。
不変の run ID: 正確な状態からのフォークの一貫性のために導入されました。
不変の run ID のコピー: run 管理を改善するために、不変の run ID をコピーするボタン。

巻き戻しとフォークの互換性

フォークは巻き戻しを補完します。

run からフォークすると、W&B は特定の時点で run から新しいブランチを作成し、さまざまなパラメータや Models を試すことができます。

run を巻き戻すと、W&B を使用して run の履歴自体を修正または変更できます。

run の巻き戻し

resume_from を使用して wandb.init() を使用して、run の履歴を特定のステップに「巻き戻し」ます。巻き戻す run の名前とステップを指定します。

import wandb
import math

# Initialize the first run and log some metrics
# Replace with your_project_name and your_entity_name!
run1 = wandb.init(project="your_project_name", entity="your_entity_name")
for i in range(300):
    run1.log({"metric": i})
run1.finish()

# Rewind from the first run at a specific step and log the metric starting from step 200
run2 = wandb.init(project="your_project_name", entity="your_entity_name", resume_from=f"{run1.id}?_step=200")

# Continue logging in the new run
# For the first few steps, log the metric as is from run1
# After step 250, start logging the spikey pattern
for i in range(200, 300):
    if i < 250:
        run2.log({"metric": i, "step": i})  # Continue logging from run1 without spikes
    else:
        # Introduce the spikey behavior starting from step 250
        subtle_spike = i + (2 * math.sin(i / 3.0))  # Apply a subtle spikey pattern
        run2.log({"metric": subtle_spike, "step": i})
    # Additionally log the new metric at all steps
    run2.log({"additional_metric": i * 1.1, "step": i})
run2.finish()

アーカイブされた run の表示

run を巻き戻した後、W&B App UI でアーカイブされた run を調べることができます。アーカイブされた run を表示するには、次の手順に従います。

Overview タブにアクセスする: run のページの Overview タブ に移動します。このタブには、run の詳細と履歴の包括的なビューが表示されます。
Forked From フィールドを見つける: Overview タブ内で、Forked From フィールドを見つけます。このフィールドは、再開の履歴をキャプチャします。Forked From フィールドには、ソース run へのリンクが含まれており、元の run にトレースバックして、巻き戻し履歴全体を理解できます。

Forked From フィールドを使用すると、アーカイブされた再開のツリーを簡単にナビゲートし、各巻き戻しのシーケンスとオリジンに関する洞察を得ることができます。

巻き戻した run からフォークする

巻き戻した run からフォークするには、wandb.init() の fork_from 引数を使用し、ソース run ID と、フォーク元のソース run からのステップを指定します。

import wandb

# Fork the run from a specific step
forked_run = wandb.init(
    project="your_project_name",
    entity="your_entity_name",
    fork_from=f"{rewind_run.id}?_step=500",
)

# Continue logging in the new run
for i in range(500, 1000):
    forked_run.log({"metric": i*3})
forked_run.finish()

1.5.8 - Send an alert

Python コードからトリガーされたアラートを Slack またはメールに送信します。

Try in Colab

run がクラッシュした場合、またはカスタムトリガーで Slack またはメールでアラートを作成します。たとえば、トレーニングループの勾配が爆発し始めた場合 (NaN を報告)、または ML パイプラインのステップが完了した場合にアラートを作成できます。アラートは、個人プロジェクトと Team プロジェクトの両方を含む、run を初期化するすべてのプロジェクトに適用されます。

次に、Slack (またはメール) で W&B Alerts メッセージを確認します。

アラートの作成方法

次のガイドは、マルチテナント cloud のアラートにのみ適用されます。

W&B Server を Private Cloud または W&B Dedicated Cloud で使用している場合は、このドキュメントを参照して、Slack アラートを設定してください。

アラートを設定するには、主に次の 2 つのステップがあります。

W&B のユーザー設定でアラートをオンにします
run.alert() を code に追加します
アラートが適切に設定されていることを確認します

1. W&B ユーザー設定でアラートをオンにする

ユーザー設定で:

アラート セクションまでスクロールします
スクリプト可能な run アラート をオンにして、run.alert() からアラートを受信します
Slack に接続 を使用して、アラートを投稿する Slack channel を選択します。アラートを非公開にするため、Slackbot channel をお勧めします。
メール は、W&B にサインアップしたときに使用したメールアドレスに送信されます。これらのアラートがすべてフォルダーに移動し、受信トレイがいっぱいにならないように、メールでフィルターを設定することをお勧めします。

W&B Alerts を初めて設定する場合、またはアラートの受信方法を変更する場合は、これを行う必要があります。

2. `run.alert()` を code に追加する

アラートをトリガーする場所に、run.alert() を code ( notebook または Python スクリプトのいずれか) に追加します

import wandb

run = wandb.init()
run.alert(title="High Loss", text="Loss is increasing rapidly")

3. Slack またはメールを確認する

Slack またはメールでアラートメッセージを確認します。何も受信しなかった場合は、ユーザー設定で スクリプト可能なアラート のメールまたは Slack がオンになっていることを確認してください。

例

このシンプルなアラートは、精度がしきい値を下回ると警告を送信します。この例では、少なくとも 5 分間隔でアラートを送信します。

import wandb
from wandb import AlertLevel

run = wandb.init()

if acc < threshold:
    run.alert(
        title="Low accuracy",
        text=f"Accuracy {acc} is below the acceptable threshold {threshold}",
        level=AlertLevel.WARN,
        wait_duration=300,
    )

ユーザーをタグ付けまたはメンションする方法

アラートのタイトルまたはテキストのいずれかで、@ 記号の後に Slack ユーザー ID を続けて入力して、自分自身または同僚をタグ付けします。Slack ユーザー ID は、Slack プロフィールページから確認できます。

run.alert(title="Loss is NaN", text=f"Hey <@U1234ABCD> loss has gone to NaN")

Team アラート

Team 管理者は、Team 設定ページ wandb.ai/teams/your-team で Team のアラートを設定できます。

Team アラートは、Team の全員に適用されます。W&B は、アラートを非公開にするため、Slackbot channel を使用することをお勧めします。

アラートの送信先 Slack channel の変更

アラートの送信先 channel を変更するには、Slack の接続を解除 をクリックしてから、再接続します。再接続後、別の Slack channel を選択します。

1.6 - Log objects and media

メトリクス、動画、カスタムプロットなどを追跡

W&B Python SDK を使用して、メトリクス、メディア、またはカスタムオブジェクトの辞書をステップと共にログに記録します。W&B は、各ステップ中にキーと値のペアを収集し、wandb.log() でデータをログに記録するたびに、それらを 1 つの統合された辞書に保存します。スクリプトからログに記録されたデータは、ローカルマシンの wandb というディレクトリーに保存され、W&B クラウドまたはプライベートサーバーに同期されます。

キーと値のペアは、各ステップで同じ値を渡す場合にのみ、1 つの統合された辞書に保存されます。step に対して異なる値をログに記録すると、W&B は収集されたすべてのキーと値をメモリーに書き込みます。

wandb.log の各呼び出しは、デフォルトで新しい step となります。W&B は、チャートとパネルを作成する際に、ステップをデフォルトの x 軸として使用します。オプションで、カスタム x 軸を作成して使用したり、カスタムの集計メトリクスをキャプチャしたりできます。詳細については、ログ軸のカスタマイズを参照してください。

wandb.log() を使用して、各 step に対して連続した値 (0、1、2 など) をログに記録します。特定の履歴ステップに書き込むことはできません。W&B は、「現在」および「次」のステップにのみ書き込みます。

自動的にログに記録されるデータ

W&B は、W&B の Experiments 中に次の情報を自動的にログに記録します。

システムメトリクス: CPU と GPU の使用率、ネットワークなど。これらは、run ページの [System] タブに表示されます。GPU の場合、これらは nvidia-smi で取得されます。
コマンドライン: stdout と stderr が取得され、run ページの [Logs] タブに表示されます。

アカウントの Settings page で Code Saving をオンにして、以下をログに記録します。

Git commit: 最新の git commit を取得し、run ページの Overview タブに表示します。また、コミットされていない変更がある場合は、diff.patch ファイルも表示します。
依存関係: requirements.txt ファイルがアップロードされ、run の files タブに表示されます。また、run の wandb ディレクトリーに保存したファイルも表示されます。

特定の W&B API 呼び出しでログに記録されるデータ

W&B を使用すると、ログに記録する内容を正確に決定できます。以下に、一般的にログに記録されるオブジェクトをいくつか示します。

Datasets: 画像またはその他の dataset サンプルを W&B にストリーミングするには、それらを具体的にログに記録する必要があります。
プロット: wandb.plot を wandb.log と共に使用して、チャートを追跡します。詳細については、プロットのログを参照してください。
Tables: wandb.Table を使用してデータをログに記録し、W&B で視覚化およびクエリを実行します。詳細については、Tables のログを参照してください。
PyTorch 勾配: wandb.watch(model) を追加して、UI で重みの勾配をヒストグラムとして表示します。
設定情報: ハイパーパラメータ、dataset へのリンク、または使用しているアーキテクチャーの名前を config パラメータとしてログに記録します。wandb.init(config=your_config_dictionary) のように渡されます。詳細については、PyTorch Integrations ページを参照してください。
メトリクス: wandb.log を使用して、model からのメトリクスを表示します。トレーニングループ内から精度や損失などのメトリクスをログに記録すると、UI でライブ更新グラフが表示されます。

一般的なワークフロー

最高精度を比較する: run 全体でメトリクスの最高値を比較するには、そのメトリクスの集計値を設定します。デフォルトでは、集計は各キーに対してログに記録した最後の値に設定されます。これは、UI のテーブルで役立ちます。UI では、集計メトリクスに基づいて run をソートおよびフィルター処理し、最終的な精度ではなく最高精度に基づいてテーブルまたは棒グラフで run を比較できます。例: wandb.run.summary["best_accuracy"] = best_accuracy
1 つのチャートで複数のメトリクスを表示する: wandb.log({"acc'": 0.9, "loss": 0.1}) のように、wandb.log への同じ呼び出しで複数のメトリクスをログに記録すると、それらは両方とも UI でプロットに使用できるようになります。
x 軸をカスタマイズする: 同じログ呼び出しにカスタム x 軸を追加して、W&B dashboard で別の軸に対してメトリクスを視覚化します。例: wandb.log({'acc': 0.9, 'epoch': 3, 'batch': 117})。特定のメトリクスのデフォルトの x 軸を設定するには、Run.define_metric() を使用します。
リッチメディアとチャートをログに記録する: wandb.log は、画像や動画などのメディアから Tables および Charts まで、さまざまなデータ型のログ記録をサポートしています。

ベストプラクティスとヒント

Experiments とログ記録のベストプラクティスとヒントについては、ベストプラクティス: Experiments とログ記録を参照してください。

1.6.1 - Create and track plots from experiments

機械学習の実験からプロットを作成および追跡します。

wandb.plot のメソッドを使用すると、トレーニング中に時間とともに変化するグラフを含め、wandb.log でグラフを追跡できます。カスタムグラフ作成フレームワークの詳細については、このガイドを確認してください。

基本的なグラフ

これらのシンプルなグラフを使用すると、メトリクスと結果の基本的な可視化を簡単に構築できます。

wandb.plot.line()

カスタム折れ線グラフ (任意の軸上の接続された順序付きポイントのリスト) を記録します。

data = [[x, y] for (x, y) in zip(x_values, y_values)]
table = wandb.Table(data=data, columns=["x", "y"])
wandb.log(
    {
        "my_custom_plot_id": wandb.plot.line(
            table, "x", "y", title="Custom Y vs X Line Plot"
        )
    }
)

これを使用して、任意の2つの次元で曲線を記録できます。2つの値のリストを互いにプロットする場合、リスト内の値の数は正確に一致する必要があります。たとえば、各ポイントにはxとyが必要です。

アプリで表示

コードを実行

wandb.plot.scatter()

カスタム散布図 (任意の軸xとyのペア上のポイント (x、y) のリスト) を記録します。

data = [[x, y] for (x, y) in zip(class_x_scores, class_y_scores)]
table = wandb.Table(data=data, columns=["class_x", "class_y"])
wandb.log({"my_custom_id": wandb.plot.scatter(table, "class_x", "class_y")})

これを使用して、任意の2つの次元で散布ポイントを記録できます。2つの値のリストを互いにプロットする場合、リスト内の値の数は正確に一致する必要があります。たとえば、各ポイントにはxとyが必要です。

アプリで表示

コードを実行

wandb.plot.bar()

カスタム棒グラフ (ラベル付きの値のリストを棒として表示) を数行でネイティブに記録します。

data = [[label, val] for (label, val) in zip(labels, values)]
table = wandb.Table(data=data, columns=["label", "value"])
wandb.log(
    {
        "my_bar_chart_id": wandb.plot.bar(
            table, "label", "value", title="Custom Bar Chart"
        )
    }
)

これを使用して、任意の棒グラフを記録できます。リスト内のラベルと値の数は正確に一致する必要があります。各データポイントには、ラベルと値の両方が必要です。

アプリで表示

コードを実行

wandb.plot.histogram()

カスタムヒストグラム (値のリストを、出現のカウント/頻度でビンにソート) を数行でネイティブに記録します。予測信頼度スコアのリスト (scores) があり、その分布を可視化するとします。

data = [[s] for s in scores]
table = wandb.Table(data=data, columns=["scores"])
wandb.log({"my_histogram": wandb.plot.histogram(table, "scores", title="Histogram")})

これを使用して、任意のヒストグラムを記録できます。data は、行と列の2D配列をサポートすることを目的としたリストのリストであることに注意してください。

アプリで表示

コードを実行

wandb.plot.line_series()

複数の線、または複数の異なるx-y座標ペアのリストを、1つの共有x-y軸セットにプロットします。

wandb.log(
    {
        "my_custom_id": wandb.plot.line_series(
            xs=[0, 1, 2, 3, 4],
            ys=[[10, 20, 30, 40, 50], [0.5, 11, 72, 3, 41]],
            keys=["metric Y", "metric Z"],
            title="Two Random Metrics",
            xname="x units",
        )
    }
)

xポイントとyポイントの数が正確に一致する必要があることに注意してください。複数のy値のリストに一致するx値のリストを1つ、またはy値のリストごとに個別のx値のリストを提供できます。

アプリで表示

モデル評価グラフ

これらのプリセットグラフには、wandb.plot メソッドが組み込まれており、スクリプトから直接グラフをすばやく簡単に記録し、UIで探している正確な情報を確認できます。

wandb.plot.pr_curve()

1行で PR曲線を作成します。

wandb.log({"pr": wandb.plot.pr_curve(ground_truth, predictions)})

コードが以下にアクセスできる場合は、いつでもこれを記録できます。

例のセットに対するモデルの予測スコア (predictions)
それらの例に対応する正解ラベル (ground_truth)
(オプション) ラベル/クラス名のリスト (labels=["cat", "dog", "bird"...] ラベルインデックス0がcat、1 = dog、2 = birdなどを意味する場合)
(オプション) プロットで可視化するラベルのサブセット (引き続きリスト形式)

アプリで表示

コードを実行

wandb.plot.roc_curve()

1行で ROC曲線を作成します。

wandb.log({"roc": wandb.plot.roc_curve(ground_truth, predictions)})

コードが以下にアクセスできる場合は、いつでもこれを記録できます。

例のセットに対するモデルの予測スコア (predictions)
それらの例に対応する正解ラベル (ground_truth)
(オプション) ラベル/クラス名のリスト (labels=["cat", "dog", "bird"...] ラベルインデックス0がcat、1 = dog、2 = birdなどを意味する場合)
(オプション) プロットで可視化するこれらのラベルのサブセット (引き続きリスト形式)

アプリで表示

コードを実行

wandb.plot.confusion_matrix()

1行で多クラス混同行列を作成します。

cm = wandb.plot.confusion_matrix(
    y_true=ground_truth, preds=predictions, class_names=class_names
)

wandb.log({"conf_mat": cm})

コードが以下にアクセスできる場合は、いつでもこれを記録できます。

例のセットに対するモデルの予測ラベル (preds) または正規化された確率スコア (probs)。確率は、(例の数、クラスの数) の形状である必要があります。確率または予測のいずれかを提供できますが、両方はできません。
それらの例に対応する正解ラベル (y_true)
class_names の文字列としてのラベル/クラス名の完全なリスト。例: インデックス0が cat、1が dog、2が bird の場合、class_names=["cat", "dog", "bird"]。

アプリで表示

コードを実行

インタラクティブなカスタムグラフ

完全にカスタマイズするには、組み込みのカスタムグラフプリセットを調整するか、新しいプリセットを作成し、グラフを保存します。グラフIDを使用して、スクリプトからそのカスタムプリセットに直接データを記録します。

# プロットする列を含むテーブルを作成します
table = wandb.Table(data=data, columns=["step", "height"])

# テーブルの列からグラフのフィールドへのマッピング
fields = {"x": "step", "value": "height"}

# テーブルを使用して、新しいカスタムグラフプリセットを設定します
# 独自の保存されたグラフプリセットを使用するには、vega_spec_nameを変更します
# タイトルを編集するには、string_fieldsを変更します
my_custom_chart = wandb.plot_table(
    vega_spec_name="carey/new_chart",
    data_table=table,
    fields=fields,
    string_fields={"title": "Height Histogram"},
)

コードを実行

Matplotlib および Plotly プロット

wandb.plot を使用した W&B カスタムグラフを使用する代わりに、matplotlib および Plotly で生成されたグラフを記録できます。

import matplotlib.pyplot as plt

plt.plot([1, 2, 3, 4])
plt.ylabel("some interesting numbers")
wandb.log({"chart": plt})

matplotlib プロットまたは figure オブジェクトを wandb.log() に渡すだけです。デフォルトでは、プロットを Plotly プロットに変換します。プロットを画像として記録する場合は、プロットを wandb.Image に渡すことができます。Plotly グラフも直接受け入れます。

「空のプロットを記録しようとしました」というエラーが表示される場合は、fig = plt.figure() を使用してプロットとは別に figure を保存し、wandb.log の呼び出しで fig を記録できます。

カスタム HTML を W&B Tables に記録する

W&B は、Plotly および Bokeh からのインタラクティブなグラフを HTML として記録し、それらを Tables に追加することをサポートしています。

Plotly figure を HTML として Tables に記録する

インタラクティブな Plotly グラフを HTML に変換して、wandb Tables に記録できます。

import wandb
import plotly.express as px

# 新しい run を初期化します
run = wandb.init(project="log-plotly-fig-tables", name="plotly_html")

# テーブルを作成します
table = wandb.Table(columns=["plotly_figure"])

# Plotly figure のパスを作成します
path_to_plotly_html = "./plotly_figure.html"

# Plotly figure の例
fig = px.scatter(x=[0, 1, 2, 3, 4], y=[0, 1, 4, 9, 16])

# Plotly figure を HTML に書き込みます
# auto_play を False に設定すると、アニメーション化された Plotly グラフが
# テーブル内で自動的に再生されるのを防ぎます
fig.write_html(path_to_plotly_html, auto_play=False)

# Plotly figure を HTML ファイルとして Table に追加します
table.add_data(wandb.Html(path_to_plotly_html))

# Table を記録します
run.log({"test_table": table})
wandb.finish()

Bokeh figure を HTML として Tables に記録する

インタラクティブな Bokeh グラフを HTML に変換して、wandb Tables に記録できます。

from scipy.signal import spectrogram
import holoviews as hv
import panel as pn
from scipy.io import wavfile
import numpy as np
from bokeh.resources import INLINE

hv.extension("bokeh", logo=False)
import wandb


def save_audio_with_bokeh_plot_to_html(audio_path, html_file_name):
    sr, wav_data = wavfile.read(audio_path)
    duration = len(wav_data) / sr
    f, t, sxx = spectrogram(wav_data, sr)
    spec_gram = hv.Image((t, f, np.log10(sxx)), ["Time (s)", "Frequency (hz)"]).opts(
        width=500, height=150, labelled=[]
    )
    audio = pn.pane.Audio(wav_data, sample_rate=sr, name="Audio", throttle=500)
    slider = pn.widgets.FloatSlider(end=duration, visible=False)
    line = hv.VLine(0).opts(color="white")
    slider.jslink(audio, value="time", bidirectional=True)
    slider.jslink(line, value="glyph.location")
    combined = pn.Row(audio, spec_gram * line, slider).save(html_file_name)


html_file_name = "audio_with_plot.html"
audio_path = "hello.wav"
save_audio_with_bokeh_plot_to_html(audio_path, html_file_name)

wandb_html = wandb.Html(html_file_name)
run = wandb.init(project="audio_test")
my_table = wandb.Table(columns=["audio_with_plot"], data=[[wandb_html], [wandb_html]])
run.log({"audio_table": my_table})
run.finish()

1.6.2 - Customize log axes

define_metric を使用して、カスタムのX軸を設定します。カスタムのX軸は、トレーニング中に過去の異なるタイムステップに非同期でログを記録する必要がある場合に役立ちます。たとえば、エピソードごとの報酬とステップごとの報酬を追跡する強化学習で役立ちます。

Google Colab で define_metric を実際に試してみる →

軸のカスタマイズ

デフォルトでは、すべてのメトリクスは同じX軸（W&Bの内部 step）に対してログが記録されます。場合によっては、前のステップにログを記録したり、別のX軸を使用したりすることがあります。

カスタムのX軸メトリクスを設定する例を次に示します（デフォルトのステップの代わりに）。

import wandb

wandb.init()
# カスタムのX軸メトリクスを定義
wandb.define_metric("custom_step")
# どのメトリクスをそれに対してプロットするかを定義
wandb.define_metric("validation_loss", step_metric="custom_step")

for i in range(10):
    log_dict = {
        "train_loss": 1 / (i + 1),
        "custom_step": i**2,
        "validation_loss": 1 / (i + 1),
    }
    wandb.log(log_dict)

X軸は、グロブを使用して設定することもできます。現在、文字列のプレフィックスを持つグロブのみが使用可能です。次の例では、プレフィックス "train/" を持つログに記録されたすべてのメトリクスをX軸 "train/step" にプロットします。

import wandb

wandb.init()
# カスタムのX軸メトリクスを定義
wandb.define_metric("train/step")
# 他のすべての train/ メトリクス がこのステップを使用するように設定
wandb.define_metric("train/*", step_metric="train/step")

for i in range(10):
    log_dict = {
        "train/step": 2**i,  # 内部W&Bステップによる指数関数的な増加
        "train/loss": 1 / (i + 1),  # X軸は train/step
        "train/accuracy": 1 - (1 / (1 + i)),  # X軸は train/step
        "val/loss": 1 / (1 + i),  # X軸は内部 wandb step
    }
    wandb.log(log_dict)

1.6.3 - Log distributed training experiments

W&B を使用して、複数の GPU を使用した分散型トレーニングの実験管理をログ記録します。

分散トレーニングでは、モデルは複数の GPU を並行して使用してトレーニングされます。W&B は、分散トレーニングの実験管理を追跡するための 2 つのパターンをサポートしています。

単一プロセス: W&B (wandb.init) を初期化し、単一のプロセスから実験 (wandb.log) をログ記録します。これは、PyTorch Distributed Data Parallel (DDP) クラスを使用した分散トレーニングの実験をログ記録するための一般的なソリューションです。場合によっては、マルチプロセッシングキュー (または別の通信プリミティブ) を使用して、他のプロセスからメインのログ記録プロセスにデータを送り込むユーザーもいます。
多数のプロセス: W&B (wandb.init) を初期化し、すべてのプロセスで実験 (wandb.log) をログ記録します。各プロセスは、事実上別の実験です。W&B を初期化する際に group パラメータ (wandb.init(group='group-name')) を使用して、共有実験を定義し、ログ記録された値を W&B App UI にまとめてグループ化します。

以下の例では、単一マシン上の 2 つの GPU で PyTorch DDP を使用して、W&B でメトリクスを追跡する方法を示します。PyTorch DDP (torch.nn の DistributedDataParallel) は、分散トレーニング用の一般的なライブラリです。基本的な原則は、あらゆる分散トレーニング設定に適用されますが、実装の詳細は異なる場合があります。

これらの例の背後にあるコードを W&B GitHub の examples リポジトリ (こちら) で確認してください。特に、単一プロセスおよび多数プロセスのメソッドを実装する方法については、log-dpp.py Python スクリプトを参照してください。

方法 1: 単一プロセス

この方法では、ランク 0 のプロセスのみを追跡します。この方法を実装するには、W&B (wandb.init) を初期化し、W&B Run を開始して、ランク 0 のプロセス内でメトリクス (wandb.log) をログ記録します。この方法はシンプルで堅牢ですが、他のプロセスからモデルのメトリクス (たとえば、バッチからの損失値または入力) をログ記録しません。使用量やメモリなどのシステムメトリクスは、その情報がすべてのプロセスで利用できるため、すべての GPU に対してログ記録されます。

この方法を使用して、単一のプロセスから利用可能なメトリクスのみを追跡します。一般的な例としては、GPU/CPU の使用率、共有検証セットでの振る舞い、勾配とパラメータ、および代表的なデータ例での損失値などがあります。

サンプル Python スクリプト (log-ddp.py) 内で、ランクが 0 かどうかを確認します。これを行うには、まず torch.distributed.launch で複数のプロセスを起動します。次に、--local_rank コマンドライン引数でランクを確認します。ランクが 0 に設定されている場合、train() 関数で wandb ログ記録を条件付きで設定します。Python スクリプト内で、次のチェックを使用します。

if __name__ == "__main__":
    # Get args
    args = parse_args()

    if args.local_rank == 0:  # only on main process
        # Initialize wandb run
        run = wandb.init(
            entity=args.entity,
            project=args.project,
        )
        # Train model with DDP
        train(args, run)
    else:
        train(args)

W&B App UI を調べて、単一のプロセスから追跡されたメトリクスのダッシュボード例を表示します。ダッシュボードには、両方の GPU で追跡された温度や使用率などのシステムメトリクスが表示されます。

ただし、エポックとバッチサイズの関数としての損失値は、単一の GPU からのみログ記録されました。

方法 2: 多数のプロセス

この方法では、ジョブ内の各プロセスを追跡し、各プロセスから wandb.init() と wandb.log() を個別に呼び出します。すべてのプロセスが適切に終了するように、トレーニングの最後に wandb.finish() を呼び出すことをお勧めします。これにより、run が完了したことを示します。

この方法により、より多くの情報がログ記録にアクセスできるようになります。ただし、複数の W&B Runs が W&B App UI に報告されることに注意してください。複数の実験にわたって W&B Runs を追跡することが難しい場合があります。これを軽減するには、W&B を初期化する際に group パラメータに値を指定して、どの W&B Run が特定の実験に属しているかを追跡します。トレーニングと評価の W&B Runs を実験で追跡する方法の詳細については、Run のグループ化を参照してください。

個々のプロセスからメトリクスを追跡する場合は、この方法を使用してください。一般的な例としては、各ノード上のデータと予測 (データ分布のデバッグ用) や、メインノード外の個々のバッチ上のメトリクスなどがあります。この方法は、すべてのノードからシステムメトリクスを取得したり、メインノードで利用可能な概要統計を取得したりするために必要ではありません。

次の Python コードスニペットは、W&B を初期化するときに group パラメータを設定する方法を示しています。

if __name__ == "__main__":
    # Get args
    args = parse_args()
    # Initialize run
    run = wandb.init(
        entity=args.entity,
        project=args.project,
        group="DDP",  # all runs for the experiment in one group
    )
    # Train model with DDP
    train(args, run)

W&B App UI を調べて、複数のプロセスから追跡されたメトリクスのダッシュボード例を表示します。左側のサイドバーに 2 つの W&B Runs がグループ化されていることに注意してください。グループをクリックして、実験専用のグループページを表示します。専用のグループページには、各プロセスからのメトリクスが個別に表示されます。

上記の画像は、W&B App UI ダッシュボードを示しています。サイドバーには、2 つの実験が表示されます。1 つは「null」というラベルが付いており、2 つ目 (黄色のボックスで囲まれています) は「DPP」と呼ばれています。グループを展開すると (グループドロップダウンを選択)、その実験に関連付けられている W&B Runs が表示されます。

W&B Service を使用して、一般的な分散トレーニングの問題を回避する

W&B と分散トレーニングを使用する際に発生する可能性のある一般的な問題が 2 つあります。

トレーニングの開始時にハングする - wandb マルチプロセッシングが分散トレーニングからのマルチプロセッシングに干渉すると、wandb プロセスがハングする可能性があります。
トレーニングの最後にハングする - wandb プロセスがいつ終了する必要があるかを認識していない場合、トレーニングジョブがハングする可能性があります。Python スクリプトの最後に wandb.finish() API を呼び出して、Run が完了したことを W&B に伝えます。wandb.finish() API は、データのアップロードを終了し、W&B を終了させます。

分散ジョブの信頼性を向上させるために、wandb service を使用することをお勧めします。上記のトレーニングの問題はどちらも、wandb service が利用できない W&B SDK のバージョンでよく見られます。

W&B Service を有効にする

W&B SDK のバージョンによっては、W&B Service がデフォルトで有効になっている場合があります。

W&B SDK 0.13.0 以降

W&B Service は、W&B SDK 0.13.0 以降のバージョンではデフォルトで有効になっています。

W&B SDK 0.12.5 以降

Python スクリプトを変更して、W&B SDK バージョン 0.12.5 以降で W&B Service を有効にします。wandb.require メソッドを使用し、メイン関数内で文字列 "service" を渡します。

if __name__ == "__main__":
    main()


def main():
    wandb.require("service")
    # rest-of-your-script-goes-here

最適なエクスペリエンスを得るには、最新バージョンにアップグレードすることをお勧めします。

W&B SDK 0.12.4 以前

W&B SDK バージョン 0.12.4 以前を使用している場合は、マルチスレッドを代わりに使用するために、WANDB_START_METHOD 環境変数を "thread" に設定します。

マルチプロセッシングのユースケース例

次のコードスニペットは、高度な分散ユースケースの一般的な方法を示しています。

プロセスのスポーン

スポーンされたプロセスで W&B Run を開始する場合は、メイン関数で wandb.setup() メソッドを使用します。

import multiprocessing as mp


def do_work(n):
    run = wandb.init(config=dict(n=n))
    run.log(dict(this=n * n))


def main():
    wandb.setup()
    pool = mp.Pool(processes=4)
    pool.map(do_work, range(4))


if __name__ == "__main__":
    main()

W&B Run を共有する

W&B Run オブジェクトを引数として渡して、プロセス間で W&B Runs を共有します。

def do_work(run):
    run.log(dict(this=1))


def main():
    run = wandb.init()
    p = mp.Process(target=do_work, kwargs=dict(run=run))
    p.start()
    p.join()


if __name__ == "__main__":
    main()

ログ記録の順序は保証されないことに注意してください。同期はスクリプトの作成者が行う必要があります。

1.6.4 - Log media and objects

3D ポイントクラウドや分子から、HTML やヒストグラムまで、リッチメディアをログに記録します。

Try in Colab

画像、動画、音声など、様々な形式のメディアに対応しています。リッチメディアをログに記録して、結果を調査し、 run 、 model 、 dataset を視覚的に比較できます。例やハウツーガイドについては、以下をお読みください。

メディアタイプのリファレンスドキュメントをお探しですか？こちらのページをご覧ください。

wandb.ai での結果の表示や、ビデオチュートリアルをご覧ください。

事前準備

W&B SDK でメディアオブジェクトをログに記録するには、追加の依存関係をインストールする必要がある場合があります。これらの依存関係をインストールするには、次のコマンドを実行します。

pip install wandb[media]

画像

画像をログに記録して、入力、出力、フィルターの重み、アクティベーションなどを追跡します。

Inputs and outputs of an autoencoder network performing in-painting.

画像は、NumPy 配列から、PIL 画像として、またはファイルシステムから直接ログに記録できます。

ステップから画像をログに記録するたびに、UI に表示するために保存されます。画像パネルを展開し、ステップスライダーを使用して、異なるステップの画像を確認します。これにより、 model の出力がトレーニング中にどのように変化するかを簡単に比較できます。

トレーニング中にログ記録がボトルネックになるのを防ぐため、また結果を表示する際に画像の読み込みがボトルネックになるのを防ぐため、ステップごとに 50 枚未満の画像をログに記録することをお勧めします。

torchvision の make_grid を使用するなどして、画像を手動で構築する場合は、配列を直接指定します。

配列は Pillow を使用して png に変換されます。

images = wandb.Image(image_array, caption="Top: Output, Bottom: Input")

wandb.log({"examples": images})

最後の次元が 1 の場合はグレースケール画像、3 の場合は RGB、4 の場合は RGBA であると想定されます。配列に float が含まれている場合は、0 から 255 までの整数に変換します。画像の正規化方法を変更する場合は、mode を手動で指定するか、このパネルの「PIL 画像のログ記録」タブで説明されているように、PIL.Image を指定します。

配列から画像への変換を完全に制御するには、PIL.Image を自分で構築し、直接指定します。

images = [PIL.Image.fromarray(image) for image in image_array]

wandb.log({"examples": [wandb.Image(image) for image in images]})

さらに細かく制御するには、好きな方法で画像を作成し、ディスクに保存して、ファイルパスを指定します。

im = PIL.fromarray(...)
rgb_im = im.convert("RGB")
rgb_im.save("myimage.jpg")

wandb.log({"example": wandb.Image("myimage.jpg")})

画像オーバーレイ

セマンティックセグメンテーションマスクをログに記録し、W&B UI で (不透明度を変更したり、経時的な変化を表示したりするなど) 操作します。

オーバーレイをログに記録するには、次のキーと値を持つ辞書を wandb.Image の masks キーワード引数に指定する必要があります。

画像マスクを表す 2 つのキーのいずれか 1 つ。
- "mask_data": 各ピクセルの整数クラスラベルを含む 2D NumPy 配列
- "path": (string) 保存された画像マスクファイルへのパス
"class_labels": (オプション) 画像マスク内の整数クラスラベルを読み取り可能なクラス名にマッピングする辞書

複数のマスクをログに記録するには、次のコードスニペットのように、複数のキーを持つマスク辞書をログに記録します。

ライブ例を見る

サンプルコード

mask_data = np.array([[1, 2, 2, ..., 2, 2, 1], ...])

class_labels = {1: "tree", 2: "car", 3: "road"}

mask_img = wandb.Image(
    image,
    masks={
        "predictions": {"mask_data": mask_data, "class_labels": class_labels},
        "ground_truth": {
            # ...
        },
        # ...
    },
)

画像と共にバウンディングボックスをログに記録し、フィルターとトグルを使用して、UI でさまざまなボックスセットを動的に可視化します。

ライブ例を見る

バウンディングボックスをログに記録するには、次のキーと値を持つ辞書を wandb.Image の boxes キーワード引数に指定する必要があります。

box_data: 各ボックスに対して 1 つの辞書のリスト。ボックス辞書の形式については、以下で説明します。
- position: 以下で説明するように、2 つの形式のいずれかでボックスの位置とサイズを表す辞書。ボックスはすべて同じ形式を使用する必要はありません。
  - オプション 1: {"minX", "maxX", "minY", "maxY"}。各ボックスの次元の上限と下限を定義する座標セットを指定します。
  - オプション 2: {"middle", "width", "height"}。[x,y] として middle 座標を指定する座標セットと、スカラーとして width と height を指定します。
- class_id: ボックスのクラス ID を表す整数。以下の class_labels キーを参照してください。
- scores: スコアの文字列ラベルと数値の値の辞書。UI でボックスをフィルタリングするために使用できます。
- domain: ボックス座標の単位/形式を指定します。ボックス座標が画像の次元の範囲内の整数など、ピクセル空間で表される場合は、これを「pixel」に設定します。デフォルトでは、 domain は画像の分数/パーセンテージであると見なされ、0 から 1 の間の浮動小数点数として表されます。
- box_caption: (オプション) このボックスのラベルテキストとして表示される文字列
class_labels: (オプション) class_id を文字列にマッピングする辞書。デフォルトでは、クラスラベル class_0、class_1 などを生成します。

この例をご覧ください。

class_id_to_label = {
    1: "car",
    2: "road",
    3: "building",
    # ...
}

img = wandb.Image(
    image,
    boxes={
        "predictions": {
            "box_data": [
                {
                    # one box expressed in the default relative/fractional domain
                    "position": {"minX": 0.1, "maxX": 0.2, "minY": 0.3, "maxY": 0.4},
                    "class_id": 2,
                    "box_caption": class_id_to_label[2],
                    "scores": {"acc": 0.1, "loss": 1.2},
                    # another box expressed in the pixel domain
                    # (for illustration purposes only, all boxes are likely
                    # to be in the same domain/format)
                    "position": {"middle": [150, 20], "width": 68, "height": 112},
                    "domain": "pixel",
                    "class_id": 3,
                    "box_caption": "a building",
                    "scores": {"acc": 0.5, "loss": 0.7},
                    # ...
                    # Log as many boxes an as needed
                }
            ],
            "class_labels": class_id_to_label,
        },
        # Log each meaningful group of boxes with a unique key name
        "ground_truth": {
            # ...
        },
    },
)

wandb.log({"driving_scene": img})

テーブルの画像オーバーレイ

Interactive Segmentation Masks in Tables

テーブルにセグメンテーションマスクをログ記録するには、テーブルの各行に wandb.Image オブジェクトを指定する必要があります。

コードスニペットに例を示します。

table = wandb.Table(columns=["ID", "Image"])

for id, img, label in zip(ids, images, labels):
    mask_img = wandb.Image(
        img,
        masks={
            "prediction": {"mask_data": label, "class_labels": class_labels}
            # ...
        },
    )

    table.add_data(id, img)

wandb.log({"Table": table})

テーブルにバウンディングボックスを持つ画像をログ記録するには、テーブルの各行に wandb.Image オブジェクトを指定する必要があります。

コードスニペットに例を示します。

table = wandb.Table(columns=["ID", "Image"])

for id, img, boxes in zip(ids, images, boxes_set):
    box_img = wandb.Image(
        img,
        boxes={
            "prediction": {
                "box_data": [
                    {
                        "position": {
                            "minX": box["minX"],
                            "minY": box["minY"],
                            "maxX": box["maxX"],
                            "maxY": box["maxY"],
                        },
                        "class_id": box["class_id"],
                        "box_caption": box["caption"],
                        "domain": "pixel",
                    }
                    for box in boxes
                ],
                "class_labels": class_labels,
            }
        },
    )

ヒストグラム

リスト、配列、テンソルなどの数値のシーケンスが最初の引数として指定された場合、np.histogram を呼び出すことでヒストグラムを自動的に構築します。すべての配列/ テンソルはフラット化されます。オプションの num_bins キーワード引数を使用して、デフォルトの 64 ビンをオーバーライドできます。サポートされているビンの最大数は 512 です。

UI では、ヒストグラムは x 軸にトレーニングステップ、y 軸にメトリック値、色で表されるカウントでプロットされ、トレーニング全体でログ記録されたヒストグラムの比較が容易になります。1 回限りのヒストグラムのログ記録の詳細については、このパネルの「概要のヒストグラム」タブを参照してください。

wandb.log({"gradients": wandb.Histogram(grads)})

Gradients for the discriminator in a GAN.

さらに詳細に制御する場合は、np.histogram を呼び出し、返されたタプルを np_histogram キーワード引数に渡します。

np_hist_grads = np.histogram(grads, density=True, range=(0.0, 1.0))
wandb.log({"gradients": wandb.Histogram(np_hist_grads)})

wandb.run.summary.update(  # if only in summary, only visible on overview tab
    {"final_logits": wandb.Histogram(logits)}
)

'obj'、'gltf'、'glb'、'babylon'、'stl'、'pts.json' 形式のファイルをログ記録すると、 run 終了時に UI でレンダリングされます。

wandb.log(
    {
        "generated_samples": [
            wandb.Object3D(open("sample.obj")),
            wandb.Object3D(open("sample.gltf")),
            wandb.Object3D(open("sample.glb")),
        ]
    }
)

Ground truth and prediction of a headphones point cloud

ライブ例を見る

ヒストグラムが概要にある場合、Run Page の Overviewタブに表示されます。履歴にある場合、Chartsタブに時間の経過に伴うビンのヒートマップをプロットします。

3D 可視化

バウンディングボックスを持つ 3D ポイントクラウドと Lidar シーンをログ記録します。レンダリングするポイントの座標と色を含む NumPy 配列を渡します。

point_cloud = np.array([[0, 0, 0, COLOR]])

wandb.log({"point_cloud": wandb.Object3D(point_cloud)})

:::info W&B UI はデータを 300,000 ポイントで切り捨てます。 :::

NumPy 配列形式

柔軟な配色に対応するため、3 つの異なる形式の NumPy 配列がサポートされています。

[[x, y, z], ...] nx3
[[x, y, z, c], ...] nx4 | c は[1, 14]` の範囲のカテゴリです (セグメンテーションに役立ちます)。
[[x, y, z, r, g, b], ...] nx6 | r,g,b は赤、緑、青のカラーチャンネルの [0,255] の範囲の値です。

Python オブジェクト

このスキーマを使用すると、Python オブジェクトを定義し、以下に示すように from_point_cloud メソッドに渡すことができます。

points は、上記の単純なポイントクラウドレンダラーと同じ形式を使用してレンダリングするポイントの座標と色を含む NumPy 配列です。
boxes は、3 つの属性を持つ Python 辞書の NumPy 配列です。
- corners- 8 つの角のリスト
- label- ボックスにレンダリングされるラベルを表す文字列 (オプション)
- color- ボックスの色を表す RGB 値
- score - バウンディングボックスに表示される数値。表示されるバウンディングボックスをフィルタリングするために使用できます (たとえば、score > 0.75 のバウンディングボックスのみを表示する場合)。(オプション)
type は、レンダリングするシーンタイプを表す文字列です。現在、サポートされている値は lidar/beta のみです。

point_list = [
    [
        2566.571924017235, # x
        746.7817289698219, # y
        -15.269245470863748,# z
        76.5, # red
        127.5, # green
        89.46617199365393 # blue
    ],
    [ 2566.592983606823, 746.6791987335685, -15.275803826279521, 76.5, 127.5, 89.45471117247024 ],
    [ 2566.616361739416, 746.4903185513501, -15.28628929674075, 76.5, 127.5, 89.41336375503832 ],
    [ 2561.706014951675, 744.5349468458361, -14.877496818222781, 76.5, 127.5, 82.21868245418283 ],
    [ 2561.5281847916694, 744.2546118233013, -14.867862032341005, 76.5, 127.5, 81.87824684536432 ],
    [ 2561.3693562897465, 744.1804761656741, -14.854129178142523, 76.5, 127.5, 81.64137897587152 ],
    [ 2561.6093071504515, 744.0287526628543, -14.882135189841177, 76.5, 127.5, 81.89871499537098 ],
    # ... and so on
]

run.log({"my_first_point_cloud": wandb.Object3D.from_point_cloud(
     points = point_list,
     boxes = [{
         "corners": [
                [ 2601.2765123137915, 767.5669506323393, -17.816764802288663 ],
                [ 2599.7259021588347, 769.0082337923552, -17.816764802288663 ],
                [ 2599.7259021588347, 769.0082337923552, -19.66876480228866 ],
                [ 2601.2765123137915, 767.5669506323393, -19.66876480228866 ],
                [ 2604.8684867834395, 771.4313904894723, -17.816764802288663 ],
                [ 2603.3178766284827, 772.8726736494882, -17.816764802288663 ],
                [ 2603.3178766284827, 772.8726736494882, -19.66876480228866 ],
                [ 2604.8684867834395, 771.4313904894723, -19.66876480228866 ]
        ],
         "color": [0, 0, 255], # color in RGB of the bounding box
         "label": "car", # string displayed on the bounding box
         "score": 0.6 # numeric displayed on the bounding box
     }],
     vectors = [
        {"start": [0, 0, 0], "end": [0.1, 0.2, 0.5], "color": [255, 0, 0]}, # color is optional
     ],
     point_cloud_type = "lidar/beta",
)})

ポイントクラウドを表示するときは、control キーを押しながらマウスを使用すると、スペース内を移動できます。

ポイントクラウドファイル

the from_file メソッドを使用して、ポイントクラウドデータがいっぱいの JSON ファイルをロードできます。

run.log({"my_cloud_from_file": wandb.Object3D.from_file(
     "./my_point_cloud.pts.json"
)})

ポイントクラウドデータの形式設定方法の例を以下に示します。

{
    "boxes": [
        {
            "color": [
                0,
                255,
                0
            ],
            "score": 0.35,
            "label": "My label",
            "corners": [
                [
                    2589.695869075582,
                    760.7400443552185,
                    -18.044831294622487
                ],
                [
                    2590.719039645323,
                    762.3871153874499,
                    -18.044831294622487
                ],
                [
                    2590.719039645323,
                    762.3871153874499,
                    -19.54083129462249
                ],
                [
                    2589.695869075582,
                    760.7400443552185,
                    -19.54083129462249
                ],
                [
                    2594.9666662674313,
                    757.4657929961453,
                    -18.044831294622487
                ],
                [
                    2595.9898368371723,
                    759.1128640283766,
                    -18.044831294622487
                ],
                [
                    2595.9898368371723,
                    759.1128640283766,
                    -19.54083129462249
                ],
                [
                    2594.9666662674313,
                    757.4657929961453,
                    -19.54083129462249
                ]
            ]
        }
    ],
    "points": [
        [
            2566.571924017235,
            746.7817289698219,
            -15.269245470863748,
            76.5,
            127.5,
            89.46617199365393
        ],
        [
            2566.592983606823,
            746.6791987335685,
            -15.275803826279521,
            76.5,
            127.5,
            89.45471117247024
        ],
        [
            2566.616361739416,
            746.4903185513501,
            -15.28628929674075,
            76.5,
            127.5,
            89.41336375503832
        ]
    ],
    "type": "lidar/beta"
}

NumPy 配列

上記で定義されている同じ配列形式を使用して、 from_numpy メソッドで numpy 配列を直接使用して、ポイントクラウドを定義できます。

run.log({"my_cloud_from_numpy_xyz": wandb.Object3D.from_numpy(
     np.array(
        [
            [0.4, 1, 1.3], # x, y, z
            [1, 1, 1],
            [1.2, 1, 1.2]
        ]
    )
)})

run.log({"my_cloud_from_numpy_cat": wandb.Object3D.from_numpy(
     np.array(
        [
            [0.4, 1, 1.3, 1], # x, y, z, category
            [1, 1, 1, 1],
            [1.2, 1, 1.2, 12],
            [1.2, 1, 1.3, 12],
            [1.2, 1, 1.4, 12],
            [1.2, 1, 1.5, 12],
            [1.2, 1, 1.6, 11],
            [1.2, 1, 1.7, 11],
        ]
    )
)})

run.log({"my_cloud_from_numpy_rgb": wandb.Object3D.from_numpy(
     np.array(
        [
            [0.4, 1, 1.3, 255, 0, 0], # x, y, z, r, g, b
            [1, 1, 1, 0, 255, 0],
            [1.2, 1, 1.3, 0, 255, 255],
            [1.2, 1, 1.4, 0, 255, 255],
            [1.2, 1, 1.5, 0, 0, 255],
            [1.2, 1, 1.1, 0, 0, 255],
            [1.2, 1, 0.9, 0, 0, 255],
        ]
    )
)})

wandb.log({"protein": wandb.Molecule("6lu7.pdb")})

10 個のファイルタイプ ( pdb、pqr、mmcif、mcif、cif、sdf、sd、gro、mol2、または mmtf) のいずれかで分子データをログ記録します。

W&B は、SMILES 文字列、rdkit mol ファイル、および rdkit.Chem.rdchem.Mol オブジェクトからの分子データのログ記録もサポートしています。

resveratrol = rdkit.Chem.MolFromSmiles("Oc1ccc(cc1)C=Cc1cc(O)cc(c1)O")

wandb.log(
    {
        "resveratrol": wandb.Molecule.from_rdkit(resveratrol),
        "green fluorescent protein": wandb.Molecule.from_rdkit("2b3p.mol"),
        "acetaminophen": wandb.Molecule.from_smiles("CC(=O)Nc1ccc(O)cc1"),
    }
)

run が終了すると、UI で分子の 3D 可視化を操作できるようになります。

AlphaFold を使用したライブ例を見る

PNG 画像

wandb.Image は、デフォルトで numpy 配列または PILImage のインスタンスを PNG に変換します。

wandb.log({"example": wandb.Image(...)})
# Or multiple images
wandb.log({"example": [wandb.Image(...) for img in images]})

動画

動画は、wandb.Video データ型を使用してログ記録されます。

wandb.log({"example": wandb.Video("myvideo.mp4")})

これで、メディアブラウザーで動画を表示できます。プロジェクトワークスペース、 run ワークスペース、またはレポートに移動し、[可視化を追加] をクリックして、リッチメディアパネルを追加します。

分子の 2D 表示

wandb.Image データ型と rdkit を使用して、分子の 2D 表示をログ記録できます。

molecule = rdkit.Chem.MolFromSmiles("CC(=O)O")
rdkit.Chem.AllChem.Compute2DCoords(molecule)
rdkit.Chem.AllChem.GenerateDepictionMatching2DStructure(molecule, molecule)
pil_image = rdkit.Chem.Draw.MolToImage(molecule, size=(300, 300))

wandb.log({"acetic_acid": wandb.Image(pil_image)})

その他のメディア

W&B は、さまざまなその他のメディアタイプのログ記録もサポートしています。

音声

wandb.log({"whale songs": wandb.Audio(np_array, caption="OooOoo", sample_rate=32)})

ステップごとに最大 100 個のオーディオクリップをログ記録できます。詳細な使用方法については、audio-fileを参照してください。

動画

wandb.log({"video": wandb.Video(numpy_array_or_path_to_video, fps=4, format="gif")})

numpy 配列が指定されている場合、次元は時間、チャンネル、幅、高さの順であると想定されます。デフォルトでは、4 fps の gif 画像を作成します (ffmpeg および moviepy python ライブラリは、numpy オブジェクトを渡す場合に必要です)。サポートされている形式は、"gif"、"mp4"、"webm"、および "ogg" です。文字列を wandb.Video に渡すと、ファイルが存在し、サポートされている形式であることをアサートしてから、wandb にアップロードします。BytesIO オブジェクトを渡すと、指定された形式を拡張子として持つ一時ファイルが作成されます。

W&B Run ページと Project ページでは、[メディア] セクションに動画が表示されます。

詳細な使用方法については、video-fileを参照してください。

テキスト

wandb.Table を使用して、UI に表示されるテーブルにテキストをログ記録します。デフォルトでは、列ヘッダーは ["Input", "Output", "Expected"] です。最適な UI パフォーマンスを確保するために、デフォルトの最大行数は 10,000 に設定されています。ただし、ユーザーは wandb.Table.MAX_ROWS = {DESIRED_MAX} を使用して、最大値を明示的にオーバーライドできます。

columns = ["Text", "Predicted Sentiment", "True Sentiment"]
# Method 1
data = [["I love my phone", "1", "1"], ["My phone sucks", "0", "-1"]]
table = wandb.Table(data=data, columns=columns)
wandb.log({"examples": table})

# Method 2
table = wandb.Table(columns=columns)
table.add_data("I love my phone", "1", "1")
table.add_data("My phone sucks", "0", "-1")
wandb.log({"examples": table})

pandas DataFrame オブジェクトを渡すこともできます。

table = wandb.Table(dataframe=my_dataframe)

詳細な使用方法については、stringを参照してください。

HTML

wandb.log({"custom_file": wandb.Html(open("some.html"))})
wandb.log({"custom_string": wandb.Html('<a href="https://mysite">Link</a>')})

カスタム HTML は任意のキーでログ記録でき、これにより、 run ページに HTML パネルが表示されます。デフォルトでは、デフォルトのスタイルが挿入されます。inject=False を渡すことで、デフォルトのスタイルをオフにすることができます。

wandb.log({"custom_file": wandb.Html(open("some.html"), inject=False)})

詳細な使用方法については、html-fileを参照してください。

1.6.5 - Log models

Try in Colab

モデルのログ

以下のガイドでは、モデルを W&B の run に記録し、それらを操作する方法について説明します。

以下の API は、実験管理のワークフローの一部としてモデルを追跡するのに役立ちます。このページに記載されている API を使用して、モデルを run に記録し、メトリクス、テーブル、メディア、その他のオブジェクトにアクセスします。

以下のことを行いたい場合は、W&B Artifacts を使用することをお勧めします。

モデル以外に、データセット、プロンプトなど、シリアル化されたデータのさまざまなバージョンを作成および追跡する。
W&B で追跡されるモデルまたはその他のオブジェクトのリネージグラフを調べる。
これらのメソッドで作成されたモデル artifacts を操作する（プロパティの更新 (メタデータ、エイリアス、および説明) など）。

W&B Artifacts および高度なバージョン管理のユースケースの詳細については、Artifacts のドキュメントを参照してください。

モデルを run に記録する

指定したディレクトリー内のコンテンツを含むモデル artifact を記録するには、log_model を使用します。log_model メソッドは、結果のモデル artifact を W&B run の出力としてもマークします。

モデルを W&B run の入力または出力としてマークすると、モデルの依存関係とモデルの関連付けを追跡できます。W&B App UI 内でモデルのリネージを表示します。詳細については、Artifacts チャプターのアーティファクトグラフの探索とトラバースページを参照してください。

モデルファイルが保存されているパスを path パラメーターに指定します。パスは、ローカルファイル、ディレクトリー、または s3://bucket/path などの外部バケットへの参照 URIにすることができます。

<> で囲まれた値は、独自の値に置き換えてください。

import wandb

# W&B の run を初期化します
run = wandb.init(project="<your-project>", entity="<your-entity>")

# モデルをログに記録します
run.log_model(path="<path-to-model>", name="<name>")

オプションで、name パラメーターにモデル artifact の名前を指定します。name が指定されていない場合、W&B は入力パスのベース名を run ID を先頭に付加したものを名前として使用します。

ユーザーまたは W&B がモデルに割り当てる name を記録しておいてください。use_model メソッドでモデルパスを取得するには、モデルの名前が必要です。

可能なパラメーターの詳細については、API Reference ガイドの log_model を参照してください。

例: モデルを run にログ記録する

import os
import wandb
from tensorflow import keras
from tensorflow.keras import layers

config = {"optimizer": "adam", "loss": "categorical_crossentropy"}

# W&B の run を初期化します
run = wandb.init(entity="charlie", project="mnist-experiments", config=config)

# ハイパーパラメーター
loss = run.config["loss"]
optimizer = run.config["optimizer"]
metrics = ["accuracy"]
num_classes = 10
input_shape = (28, 28, 1)

# トレーニングアルゴリズム
model = keras.Sequential(
    [
        layers.Input(shape=input_shape),
        layers.Conv2D(32, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Conv2D(64, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Flatten(),
        layers.Dropout(0.5),
        layers.Dense(num_classes, activation="softmax"),
    ]
)

# トレーニング用にモデルを構成する
model.compile(loss=loss, optimizer=optimizer, metrics=metrics)

# モデルを保存
model_filename = "model.h5"
local_filepath = "./"
full_path = os.path.join(local_filepath, model_filename)
model.save(filepath=full_path)

# モデルを W&B run にログ記録する
run.log_model(path=full_path, name="MNIST")
run.finish()

ユーザーが log_model を呼び出すと、MNIST という名前のモデル artifact が作成され、ファイル model.h5 がモデル artifact に追加されました。ターミナルまたはノートブックには、モデルがログに記録された run に関する情報を見つける場所の情報が表示されます。

View run different-surf-5 at: https://wandb.ai/charlie/mnist-experiments/runs/wlby6fuw
Synced 5 W&B file(s), 0 media file(s), 1 artifact file(s) and 0 other file(s)
Find logs at: ./wandb/run-20231206_103511-wlby6fuw/logs

ログに記録されたモデルをダウンロードして使用する

以前に W&B run に記録されたモデルファイルにアクセスしてダウンロードするには、use_model 関数を使用します。

取得するモデルファイルが保存されているモデル artifact の名前を指定します。指定する名前は、既存のログに記録されたモデル artifact の名前と一致する必要があります。

log_model でファイルを最初にログに記録したときに name を定義しなかった場合、割り当てられるデフォルトの名前は、入力パスのベース名に run ID が付加されたものです。

<> で囲まれた他の値は必ず置き換えてください。

import wandb

# run を初期化します
run = wandb.init(project="<your-project>", entity="<your-entity>")

# モデルにアクセスしてダウンロードします。ダウンロードされた artifact へのパスを返します
downloaded_model_path = run.use_model(name="<your-model-name>")

use_model 関数は、ダウンロードされたモデルファイルのパスを返します。このモデルを後でリンクする場合は、このパスを記録しておいてください。上記のコードスニペットでは、返されたパスは downloaded_model_path という名前の変数に格納されています。

例: ログに記録されたモデルをダウンロードして使用する

たとえば、上記のコードスニペットでは、ユーザーが use_model API を呼び出しました。取得するモデル artifact の名前と、バージョン/エイリアスを指定しました。次に、API から返されたパスを downloaded_model_path 変数に格納しました。

import wandb

entity = "luka"
project = "NLP_Experiments"
alias = "latest"  # モデルバージョンのセマンティックニックネームまたは識別子
model_artifact_name = "fine-tuned-model"

# run を初期化します
run = wandb.init(project=project, entity=entity)
# モデルにアクセスしてダウンロードします。ダウンロードされた artifact へのパスを返します
downloaded_model_path = run.use_model(name = f"{model_artifact_name}:{alias}")

可能なパラメーターと戻り値の型の詳細については、API Reference ガイドの use_model を参照してください。

モデルをログに記録して W&B Model Registry にリンクする

link_model メソッドは、現在、間もなく非推奨になる従来の W&B Model Registry とのみ互換性があります。新しいエディションのモデルレジストリにモデル artifact をリンクする方法については、Registry のドキュメントを参照してください。

link_model メソッドを使用して、モデルファイルを W&B run にログ記録し、W&B Model Registry にリンクします。登録済みモデルが存在しない場合、W&B は registered_model_name パラメーターに指定した名前で新しいモデルを作成します。

モデルをリンクすることは、チームの他のメンバーが表示および利用できるモデルの一元化されたチームリポジトリにモデルを「ブックマーク」または「公開」することに似ています。

モデルをリンクすると、そのモデルは Registry で複製されたり、project から移動してレジストリに移動したりすることはありません。リンクされたモデルは、project 内の元のモデルへのポインターです。

Registry を使用して、タスクごとに最適なモデルを整理し、モデルライフサイクルを管理し、ML ライフサイクル全体で簡単な追跡と監査を促進し、webhook またはジョブでダウンストリームアクションを自動化します。

Registered Model は、Model Registry 内のリンクされたモデルバージョンのコレクションまたはフォルダーです。登録済みモデルは通常、単一のモデリングユースケースまたはタスクの候補モデルを表します。

上記のコードスニペットは、link_model API でモデルをリンクする方法を示しています。<> で囲まれた他の値は必ず置き換えてください。

import wandb

run = wandb.init(entity="<your-entity>", project="<your-project>")
run.link_model(path="<path-to-model>", registered_model_name="<registered-model-name>")
run.finish()

オプションのパラメーターの詳細については、API Reference ガイドの link_model を参照してください。

registered-model-name が Model Registry 内に既に存在する登録済みモデルの名前と一致する場合、モデルはその登録済みモデルにリンクされます。そのような登録済みモデルが存在しない場合は、新しいモデルが作成され、モデルが最初にリンクされます。

たとえば、Model Registry に "Fine-Tuned-Review-Autocompletion" という名前の既存の登録済みモデルがあるとします (例はこちらを参照)。また、いくつかのモデルバージョンが既にリンクされているとします: v0、v1、v2。link_model を registered-model-name="Fine-Tuned-Review-Autocompletion" で呼び出すと、新しいモデルはこの既存の登録済みモデルに v3 としてリンクされます。この名前の登録済みモデルが存在しない場合は、新しいモデルが作成され、新しいモデルは v0 としてリンクされます。

例: モデルをログに記録して W&B Model Registry にリンクする

たとえば、上記のコードスニペットはモデルファイルをログに記録し、モデルを登録済みモデル名 "Fine-Tuned-Review-Autocompletion" にリンクします。

これを行うには、ユーザーは link_model API を呼び出します。API を呼び出すときに、モデルのコンテンツを指すローカルファイルパス (path) と、リンク先の登録済みモデルの名前 (registered_model_name) を指定します。

import wandb

path = "/local/dir/model.pt"
registered_model_name = "Fine-Tuned-Review-Autocompletion"

run = wandb.init(project="llm-evaluation", entity="noa")
run.link_model(path=path, registered_model_name=registered_model_name)
run.finish()

リマインダー: 登録済みモデルには、ブックマークされたモデルバージョンのコレクションが格納されています。

1.6.6 - Log summary metrics

トレーニング中に時間とともに変化する値に加えて、モデルや前処理ステップを要約する単一の値を追跡することも重要です。この情報を W&B の Run の summary 辞書に記録します。Run の summary 辞書は、numpy 配列、PyTorch テンソル、または TensorFlow テンソルを処理できます。値がこれらの型のいずれかである場合、バイナリファイルにテンソル全体を保持し、min、平均、分散、パーセンタイルなどの高度なメトリクスを summary オブジェクトに格納します。

wandb.log で最後に記録された値は、W&B Run の summary 辞書として自動的に設定されます。summary メトリクス辞書が変更されると、前の値は失われます。

次のコードスニペットは、カスタム summary メトリクスを W&B に提供する方法を示しています。

wandb.init(config=args)

best_accuracy = 0
for epoch in range(1, args.epochs + 1):
    test_loss, test_accuracy = test()
    if test_accuracy > best_accuracy:
        wandb.summary["best_accuracy"] = test_accuracy
        best_accuracy = test_accuracy

トレーニングが完了した後、既存の W&B Run の summary 属性を更新できます。W&B Public API を使用して、summary 属性を更新します。

api = wandb.Api()
run = api.run("username/project/run_id")
run.summary["tensor"] = np.random.random(1000)
run.summary.update()

summary メトリクスのカスタマイズ

カスタム summary メトリクスは、wandb.summary でトレーニングの最適なステップでモデルのパフォーマンスをキャプチャするのに役立ちます。たとえば、最終値の代わりに、最大精度または最小損失値をキャプチャしたい場合があります。

デフォルトでは、summary は履歴からの最終値を使用します。summary メトリクスをカスタマイズするには、define_metric で summary 引数に渡します。これは、次の値を受け入れます。

"min"
"max"
"mean"
"best"
"last"
"none"

"best" は、オプションの objective 引数を "minimize" または "maximize" に設定した場合にのみ使用できます。

次の例では、損失と精度の最小値と最大値を summary に追加します。

import wandb
import random

random.seed(1)
wandb.init()

# 損失の最小値と最大値のsummary値
wandb.define_metric("loss", summary="min")
wandb.define_metric("loss", summary="max")

# 精度に対する最小値と最大値のsummary値
wandb.define_metric("acc", summary="min")
wandb.define_metric("acc", summary="max")

for i in range(10):
    log_dict = {
        "loss": random.uniform(0, 1 / (i + 1)),
        "acc": random.uniform(1 / (i + 1), 1),
    }
    wandb.log(log_dict)

summary メトリクスの表示

run の Overview ページまたは project の runs テーブルで summary 値を表示します。

W&B App に移動します。
Workspace タブを選択します。
runs のリストから、summary 値を記録した run の名前をクリックします。
Overview タブを選択します。
Summary セクションで summary 値を表示します。

W&B に記録された run の Overview ページ。UI の右下隅には、Summary メトリクスセクション内の機械学習モデルの精度と損失の最小値と最大値が表示されます。

W&B App に移動します。
Runs タブを選択します。
runs テーブル内で、summary 値の名前に基づいて、列内の summary 値を表示できます。

W&B Public API を使用して、run の summary 値を取得できます。

次のコード例は、W&B Public API と pandas を使用して、特定の run に記録された summary 値を取得する方法の 1 つを示しています。

import wandb
import pandas

entity = "<your-entity>"
project = "<your-project>"
run_name = "<your-run-name>" # summary 値を持つ run の名前

all_runs = []

for run in api.runs(f"{entity}/{project_name}"):
  print("Fetching details for run: ", run.id, run.name)
  run_data = {
            "id": run.id,
            "name": run.name,
            "url": run.url,
            "state": run.state,
            "tags": run.tags,
            "config": run.config,
            "created_at": run.created_at,
            "system_metrics": run.system_metrics,
            "summary": run.summary,
            "project": run.project,
            "entity": run.entity,
            "user": run.user,
            "path": run.path,
            "notes": run.notes,
            "read_only": run.read_only,
            "history_keys": run.history_keys,
            "metadata": run.metadata,
        }
  all_runs.append(run_data)
  
# DataFrameに変換
df = pd.DataFrame(all_runs)

# カラム名 (run) に基づいて行を取得し、dictionary に変換します。
df[df['name']==run_name].summary.reset_index(drop=True).to_dict()

1.6.7 - Log tables

W&B でテーブルをログします。

Try in Colab

wandb.Table を使用してデータをログに記録し、Weights & Biases（W&B）で視覚化およびクエリを実行します。このガイドでは、次の方法について説明します。

テーブルの作成

Tableを定義するには、データの各行に表示する列を指定します。各行は、トレーニングデータセット内の単一のアイテム、トレーニング中の特定のステップまたはエポック、テストアイテムに対するモデルによる予測、モデルによって生成されたオブジェクトなどです。各列には、数値、テキスト、ブール値、画像、動画、音声などの固定タイプがあります。タイプを事前に指定する必要はありません。各列に名前を付け、その型のデータのみをその列インデックスに渡してください。詳細な例については、こちらのレポートをご覧ください。

wandb.Table コンストラクターは、次の2つの方法で使用します。

行のリスト: 名前付きの列とデータの行をログに記録します。たとえば、次のコードスニペットは、2行3列のテーブルを生成します。

wandb.Table(columns=["a", "b", "c"], data=[["1a", "1b", "1c"], ["2a", "2b", "2c"]])

Pandas DataFrame: wandb.Table(dataframe=my_df) を使用して DataFrame をログに記録します。列名は DataFrame から抽出されます。

既存の配列またはデータフレームから

# モデルが4つの画像に対する予測を返したと仮定します
# 次のフィールドが利用可能です：
# - 画像ID
# - wandb.Image() にラップされた画像ピクセル
# - モデルの予測ラベル
# - 正解ラベル
my_data = [
    [0, wandb.Image("img_0.jpg"), 0, 0],
    [1, wandb.Image("img_1.jpg"), 8, 0],
    [2, wandb.Image("img_2.jpg"), 7, 1],
    [3, wandb.Image("img_3.jpg"), 1, 1],
]

# 対応する列を持つ wandb.Table() を作成します
columns = ["id", "image", "prediction", "truth"]
test_table = wandb.Table(data=my_data, columns=columns)

データの追加

テーブルは変更可能です。スクリプトの実行中に、最大200,000行までテーブルにデータを追加できます。テーブルにデータを追加する方法は2つあります。

行の追加: table.add_data("3a", "3b", "3c")。新しい行はリストとして表されないことに注意してください。行がリスト形式の場合は、スター表記 * を使用して、リストを位置引数に展開します: table.add_data(*my_row_list)。行には、テーブルの列数と同じ数のエントリが含まれている必要があります。
列の追加: table.add_column(name="col_name", data=col_data)。col_data の長さは、テーブルの現在の行数と等しくなければならないことに注意してください。ここで、col_data はリストデータまたは NumPy NDArray にすることができます。

データの増分追加

このコードサンプルは、W&Bテーブルを段階的に作成および入力する方法を示しています。可能なすべてのラベルの信頼性スコアを含む、事前定義された列を持つテーブルを定義し、推論中にデータを1行ずつ追加します。runの再開時にテーブルにデータを段階的に追加することもできます。

# 各ラベルの信頼性スコアを含む、テーブルの列を定義します
columns = ["id", "image", "guess", "truth"]
for digit in range(10):  # 各桁 (0-9) の信頼性スコア列を追加します
    columns.append(f"score_{digit}")

# 定義された列でテーブルを初期化します
test_table = wandb.Table(columns=columns)

# テストデータセットを反復処理し、データをテーブルに行ごとに追加します
# 各行には、画像ID、画像、予測ラベル、正解ラベル、および信頼性スコアが含まれます
for img_id, img in enumerate(mnist_test_data):
    true_label = mnist_test_data_labels[img_id]  # 正解ラベル
    guess_label = my_model.predict(img)  # 予測ラベル
    test_table.add_data(
        img_id, wandb.Image(img), guess_label, true_label
    )  # 行データをテーブルに追加します

runの再開時にデータを追加する

Artifactから既存のテーブルをロードし、データの最後の行を取得して、更新されたメトリクスを追加することにより、再開されたrunでW&Bテーブルを段階的に更新できます。次に、互換性のためにテーブルを再初期化し、更新されたバージョンをW&Bに記録します。

# アーティファクトから既存のテーブルをロードします
best_checkpt_table = wandb.use_artifact(table_tag).get(table_name)

# 再開のためにテーブルからデータの最後の行を取得します
best_iter, best_metric_max, best_metric_min = best_checkpt_table.data[-1]

# 必要に応じて最適なメトリクスを更新します

# 更新されたデータをテーブルに追加します
best_checkpt_table.add_data(best_iter, best_metric_max, best_metric_min)

# 互換性を確保するために、更新されたデータでテーブルを再初期化します
best_checkpt_table = wandb.Table(
    columns=["col1", "col2", "col3"], data=best_checkpt_table.data
)

# 更新されたテーブルを Weights & Biases に記録します
wandb.log({table_name: best_checkpt_table})

データの取得

データがTableにある場合、列または行でアクセスします。

行イテレーター: ユーザーは、for ndx, row in table.iterrows(): ... などのTableの行イテレーターを使用して、データの行を効率的に反復処理できます。
列の取得: ユーザーは、table.get_column("col_name") を使用してデータの列を取得できます。便宜上、ユーザーは convert_to="numpy" を渡して、列をプリミティブの NumPy NDArray に変換できます。これは、列に wandb.Image などのメディアタイプが含まれている場合に、基になるデータに直接アクセスできるようにする場合に役立ちます。

テーブルの保存

スクリプトでデータのテーブル（たとえば、モデル予測のテーブル）を生成したら、結果をライブで視覚化するために、W&Bに保存します。

テーブルをrunに記録する

wandb.log() を使用して、次のようにテーブルをrunに保存します。

run = wandb.init()
my_table = wandb.Table(columns=["a", "b"], data=[["1a", "1b"], ["2a", "2b"]])
run.log({"table_key": my_table})

テーブルが同じキーに記録されるたびに、テーブルの新しいバージョンが作成され、バックエンドに保存されます。これは、モデルの予測が時間の経過とともにどのように改善されるかを確認したり、同じキーに記録されている限り、異なるrun間でテーブルを比較したりするために、複数のトレーニングステップで同じテーブルを記録できることを意味します。最大200,000行をログに記録できます。

200,000行を超える行をログに記録するには、次の制限をオーバーライドできます。

wandb.Table.MAX_ARTIFACT_ROWS = X

ただし、これにより、UIでのクエリの遅延など、パフォーマンスの問題が発生する可能性があります。

プログラムでテーブルにアクセスする

バックエンドでは、Tables は Artifacts として保持されます。特定のバージョンにアクセスする場合は、Artifact API を使用してアクセスできます。

with wandb.init() as run:
    my_table = run.use_artifact("run-<run-id>-<table-name>:<tag>").get("<table-name>")

Artifactsの詳細については、開発者ガイドのArtifactsチャプターを参照してください。

テーブルの視覚化

このように記録されたテーブルは、runページとプロジェクトページの両方の Workspace に表示されます。詳細については、テーブルの視覚化と分析を参照してください。

Artifact テーブル

artifact.add() を使用して、ワークスペースではなく、runの Artifacts セクションにテーブルをログに記録します。これは、一度ログに記録して、将来のrunで参照するデータセットがある場合に役立ちます。

run = wandb.init(project="my_project")
# 意味のあるステップごとに wandb Artifact を作成します
test_predictions = wandb.Artifact("mnist_test_preds", type="predictions")

# [上記のように予測データを構築します]
test_table = wandb.Table(data=data, columns=columns)
test_predictions.add(test_table, "my_test_key")
run.log_artifact(test_predictions)

画像データを使用した artifact.add() の詳細な例と、Artifacts と Tables を使用して表形式データのバージョン管理と重複排除を行う方法の例については、このレポートを参照してください。

Artifact テーブルの結合

ローカルで構築したテーブル、または他の Artifacts から取得したテーブルを wandb.JoinedTable(table_1, table_2, join_key) を使用して結合できます。

引数	説明
table_1	(str, `wandb.Table`, ArtifactEntry) Artifact 内の `wandb.Table` へのパス、テーブルオブジェクト、または ArtifactEntry
table_2	(str, `wandb.Table`, ArtifactEntry) Artifact 内の `wandb.Table` へのパス、テーブルオブジェクト、または ArtifactEntry
join_key	(str, [str, str]) 結合を実行するキー

Artifact コンテキストで以前に記録した2つの Tables を結合するには、Artifact からそれらを取得し、結果を新しい Table に結合します。

たとえば、'original_songs' という元の曲の Table と、同じ曲の合成バージョンの別の Table 'synth_songs' を読み取る方法を示します。次のコード例では、2つのテーブルを "song_id" で結合し、結果のテーブルを新しい W&B Table としてアップロードします。

import wandb

run = wandb.init(project="my_project")

# 元の曲のテーブルを取得します
orig_songs = run.use_artifact("original_songs:latest")
orig_table = orig_songs.get("original_samples")

# 合成された曲のテーブルを取得します
synth_songs = run.use_artifact("synth_songs:latest")
synth_table = synth_songs.get("synth_samples")

# テーブルを "song_id" で結合します
join_table = wandb.JoinedTable(orig_table, synth_table, "song_id")
join_at = wandb.Artifact("synth_summary", "analysis")

# テーブルを Artifact に追加し、W&B に記録します
join_at.add(join_table, "synth_explore")
run.log_artifact(join_at)

異なる Artifact オブジェクトに保存されている2つの以前に保存されたテーブルを結合する方法の例については、このチュートリアルを参照してください。

1.6.8 - Track CSV files with experiments

W&B へのデータのインポートとログ記録

W&B Python Library を使用して CSV ファイルをログに記録し、W&B Dashboard で可視化します。 W&B Dashboard は、機械学習モデルの結果を整理して可視化するための中央の場所です。これは、W&B にログ記録されていない以前の機械学習実験の情報を含む CSV ファイルがある場合、またはデータセットを含む CSV ファイルがある場合に特に役立ちます。

データセットのCSVファイルをインポートしてログに記録する

CSV ファイルの内容を再利用しやすくするために、W&B Artifacts を利用することをお勧めします。

まず、CSV ファイルをインポートします。次のコードスニペットで、iris.csv ファイル名を CSV ファイルの名前に置き換えます。

import wandb
import pandas as pd

# Read our CSV into a new DataFrame
new_iris_dataframe = pd.read_csv("iris.csv")

CSV ファイルを W&B テーブルに変換して、W&B Dashboards を利用します。

# Convert the DataFrame into a W&B Table
iris_table = wandb.Table(dataframe=new_iris_dataframe)

次に、W&B Artifact を作成し、テーブルを Artifact に追加します。

# Add the table to an Artifact to increase the row
# limit to 200000 and make it easier to reuse
iris_table_artifact = wandb.Artifact("iris_artifact", type="dataset")
iris_table_artifact.add(iris_table, "iris_table")

# Log the raw csv file within an artifact to preserve our data
iris_table_artifact.add_file("iris.csv")

W&B Artifacts の詳細については、Artifacts のチャプターを参照してください。

最後に、wandb.init で W&B Run を開始し、W&B に追跡およびログを記録します。

# Start a W&B run to log data
run = wandb.init(project="tables-walkthrough")

# Log the table to visualize with a run...
run.log({"iris": iris_table})

# and Log as an Artifact to increase the available row limit!
run.log_artifact(iris_table_artifact)

wandb.init() API は、Run にデータをログ記録するための新しいバックグラウンドプロセスを生成し、(デフォルトで) データを wandb.ai に同期します。 W&B Workspace Dashboard でライブ可視化を表示します。次の画像は、コードスニペットのデモの出力を示しています。

上記のコードスニペットを含む完全なスクリプトは、以下にあります。

import wandb
import pandas as pd

# Read our CSV into a new DataFrame
new_iris_dataframe = pd.read_csv("iris.csv")

# Convert the DataFrame into a W&B Table
iris_table = wandb.Table(dataframe=new_iris_dataframe)

# Add the table to an Artifact to increase the row
# limit to 200000 and make it easier to reuse
iris_table_artifact = wandb.Artifact("iris_artifact", type="dataset")
iris_table_artifact.add(iris_table, "iris_table")

# log the raw csv file within an artifact to preserve our data
iris_table_artifact.add_file("iris.csv")

# Start a W&B run to log data
run = wandb.init(project="tables-walkthrough")

# Log the table to visualize with a run...
run.log({"iris": iris_table})

# and Log as an Artifact to increase the available row limit!
run.log_artifact(iris_table_artifact)

# Finish the run (useful in notebooks)
run.finish()

Experiments の CSV ファイルをインポートしてログに記録する

場合によっては、CSV ファイルに experiment の詳細が含まれている場合があります。このような CSV ファイルにある一般的な詳細は次のとおりです。

experiment run の名前
最初のノート
experiment を区別するためのタグ
experiment に必要な設定 (当社の Sweeps Hyperparameter Tuningを利用できるという追加の利点があります)。

Experiment	Model Name	Notes	Tags	Num Layers	Final Train Acc	Final Val Acc	Training Losses
Experiment 1	mnist-300-layers	Overfit way too much on training data	[latest]	300	0.99	0.90	[0.55, 0.45, 0.44, 0.42, 0.40, 0.39]
Experiment 2	mnist-250-layers	Current best model	[prod, best]	250	0.95	0.96	[0.55, 0.45, 0.44, 0.42, 0.40, 0.39]
Experiment 3	mnist-200-layers	Did worse than the baseline model. Need to debug	[debug]	200	0.76	0.70	[0.55, 0.45, 0.44, 0.42, 0.40, 0.39]
…	…	…	…	…	…	…
Experiment N	mnist-X-layers	NOTES	…	…	…	…	[…, …]

W&B は、experiments の CSV ファイルを取得し、W&B Experiment Run に変換できます。次のコードスニペットとコードスクリプトは、experiments の CSV ファイルをインポートしてログに記録する方法を示しています。

まず、CSV ファイルを読み込み、Pandas DataFrame に変換します。 experiments.csv を CSV ファイルの名前に置き換えます。

import wandb
import pandas as pd

FILENAME = "experiments.csv"
loaded_experiment_df = pd.read_csv(FILENAME)

PROJECT_NAME = "Converted Experiments"

EXPERIMENT_NAME_COL = "Experiment"
NOTES_COL = "Notes"
TAGS_COL = "Tags"
CONFIG_COLS = ["Num Layers"]
SUMMARY_COLS = ["Final Train Acc", "Final Val Acc"]
METRIC_COLS = ["Training Losses"]

# Format Pandas DataFrame to make it easier to work with
for i, row in loaded_experiment_df.iterrows():
    run_name = row[EXPERIMENT_NAME_COL]
    notes = row[NOTES_COL]
    tags = row[TAGS_COL]

    config = {}
    for config_col in CONFIG_COLS:
        config[config_col] = row[config_col]

    metrics = {}
    for metric_col in METRIC_COLS:
        metrics[metric_col] = row[metric_col]

    summaries = {}
    for summary_col in SUMMARY_COLS:
        summaries[summary_col] = row[summary_col]

次に、wandb.init() で W&B Run を開始し、W&B に追跡およびログを記録します。

run = wandb.init(
    project=PROJECT_NAME, name=run_name, tags=tags, notes=notes, config=config
)

experiment の実行中に、W&B で表示、クエリ、および分析できるように、メトリクスのすべてのインスタンスをログに記録することができます。これを行うには、run.log() コマンドを使用します。

run.log({key: val})

オプションで、run の結果を定義するために、最終的なサマリーメトリクスをログに記録できます。これを行うには、W&B define_metric API を使用します。この例では、run.summary.update() を使用して、サマリーメトリクスを run に追加します。

run.summary.update(summaries)

サマリーメトリクスの詳細については、サマリーメトリクスのログ記録を参照してください。

以下は、上記のサンプルテーブルを W&B Dashboard に変換する完全なスクリプトの例です。

FILENAME = "experiments.csv"
loaded_experiment_df = pd.read_csv(FILENAME)

PROJECT_NAME = "Converted Experiments"

EXPERIMENT_NAME_COL = "Experiment"
NOTES_COL = "Notes"
TAGS_COL = "Tags"
CONFIG_COLS = ["Num Layers"]
SUMMARY_COLS = ["Final Train Acc", "Final Val Acc"]
METRIC_COLS = ["Training Losses"]

for i, row in loaded_experiment_df.iterrows():
    run_name = row[EXPERIMENT_NAME_COL]
    notes = row[NOTES_COL]
    tags = row[TAGS_COL]

    config = {}
    for config_col in CONFIG_COLS:
        config[config_col] = row[config_col]

    metrics = {}
    for metric_col in METRIC_COLS:
        metrics[metric_col] = row[metric_col]

    summaries = {}
    for summary_col in SUMMARY_COLS:
        summaries[summary_col] = row[summary_col]

    run = wandb.init(
        project=PROJECT_NAME, name=run_name, tags=tags, notes=notes, config=config
    )

    for key, val in metrics.items():
        if isinstance(val, list):
            for _val in val:
                run.log({key: _val})
        else:
            run.log({key: val})

    run.summary.update(summaries)
    run.finish()

1.7 - Track Jupyter notebooks

Jupyter で W&B を使用して、ノートブックから離れることなくインタラクティブな可視化を取得できます。

Jupyter で W&B を使用すると、ノートブックから離れることなくインタラクティブな可視化を得ることができます。カスタムの分析、実験、プロトタイプを組み合わせて、すべて完全にログに記録します。

Jupyter ノートブックで W&B を使用するユースケース

**反復的な実験 **: パラメータを調整しながら実験を実行および再実行すると、手動でメモを取らなくても、実行したすべての run が W&B に自動的に保存されます。
コードの保存: モデルを再現する際、ノートブックのどのセルがどの順序で実行されたかを知ることは困難です。設定ページでコードの保存をオンにすると、各実験のセル実行の記録が保存されます。
**カスタム分析 **: run が W&B にログされると、API からデータフレームを取得してカスタム分析を実行し、それらの結果を W&B にログしてレポートで保存および共有することが簡単になります。

ノートブックでの始め方

次のコードでノートブックを開始して W&B をインストールし、アカウントをリンクします。

!pip install wandb -qqq
import wandb
wandb.login()

次に、実験を設定し、ハイパーパラメータを保存します。

wandb.init(
    project="jupyter-projo",
    config={
        "batch_size": 128,
        "learning_rate": 0.01,
        "dataset": "CIFAR-100",
    },
)

wandb.init() を実行した後、%%wandb を使用して新しいセルを開始すると、ノートブックにライブグラフが表示されます。このセルを複数回実行すると、データが run に追加されます。

%%wandb

# Your training loop here
# ここにトレーニングループを記述します

このサンプルノートブックでお試しください。

ノートブックでライブ W&B インターフェースを直接レンダリングする

%wandb マジックを使用して、既存のダッシュボード、 Sweeps 、または Reports をノートブックで直接表示することもできます。

# Display a project workspace
# プロジェクトワークスペースを表示する
%wandb USERNAME/PROJECT
# Display a single run
# 単一のrunを表示する
%wandb USERNAME/PROJECT/runs/RUN_ID
# Display a sweep
# sweepを表示する
%wandb USERNAME/PROJECT/sweeps/SWEEP_ID
# Display a report
# reportを表示する
%wandb USERNAME/PROJECT/reports/REPORT_ID
# Specify the height of embedded iframe
# 埋め込みiframeの高さを指定する
%wandb USERNAME/PROJECT -h 2048

%%wandb または %wandb マジックの代わりに、wandb.init() を実行した後、wandb.run で任意のセルを終了してインライングラフを表示するか、API から返された report 、 sweep 、または run オブジェクトで ipython.display(...) を呼び出すことができます。

# Initialize wandb.run first
# 最初にwandb.runを初期化します
wandb.init()

# If cell outputs wandb.run, you'll see live graphs
# セルがwandb.runを出力する場合、ライブグラフが表示されます
wandb.run

W&B で何ができるかについてもっと知りたいですか？データとメディアのログに関するガイドを確認するか、お気に入りの ML ツールキットとの統合方法を学ぶか、リファレンスドキュメントまたは例のレポジトリに直接飛び込んでください。

W&B の追加の Jupyter 機能

Colab での簡単な認証: Colab で wandb.init を初めて呼び出すと、ブラウザで W&B に現在ログインしている場合、ランタイムが自動的に認証されます。run ページの Overviewタブに、Colab へのリンクが表示されます。
Jupyter Magic: ダッシュボード、 Sweeps 、および Reports をノートブックで直接表示します。%wandb マジックは、プロジェクト、 Sweeps 、または Reports へのパスを受け入れ、W&B インターフェースをノートブックで直接レンダリングします。
docker コンテナ化された Jupyter の Launch: wandb docker --jupyter を呼び出して dockerコンテナを起動し、コードをマウントし、Jupyter がインストールされていることを確認して、ポート 8888 で起動します。
恐れることなく任意の順序でセルを実行する: デフォルトでは、run を finished としてマークするために、次に wandb.init が呼び出されるまで待機します。これにより、複数のセル（たとえば、データをセットアップするセル、トレーニングするセル、テストするセル）を好きな順序で実行し、すべて同じ run にログできます。設定でコードの保存をオンにすると、実行されたセルも、実行された順序と実行された状態でログに記録され、最も非線形のパイプラインでも再現できます。Jupyter ノートブックで run を手動で完了としてマークするには、run.finish を呼び出します。

import wandb

run = wandb.init()

# training script and logging goes here
# ここにトレーニングスクリプトとロギングを記述します

run.finish()

1.8 - Experiments limits and performance

推奨される範囲内でログを記録することで、W&B のページをより速く、より応答性の高い状態に保つことができます。

以下の推奨範囲内でログを記録することで、W&B 内のページをより高速かつ応答性の高い状態に保つことができます。

ログ記録に関する考慮事項

wandb.log を使用して実験メトリクスを追跡します。記録されたメトリクスは、グラフを生成し、テーブルに表示されます。ログに記録するデータが多すぎると、アプリケーションの動作が遅くなる可能性があります。

個別のメトリクス数

パフォーマンスを向上させるには、プロジェクト内の個別のメトリクスの合計数を 10,000 未満に抑えてください。

import wandb

wandb.log(
    {
        "a": 1,  # "a" は個別のメトリクス
        "b": {
            "c": "hello",  # "b.c" は個別のメトリクス
            "d": [1, 2, 3],  # "b.d" は個別のメトリクス
        },
    }
)

W&B は、ネストされた値を自動的にフラット化します。つまり、辞書を渡すと、W&B はそれをドットで区切られた名前に変換します。 config 値の場合、W&B は名前に 3 つのドットをサポートします。 summary 値の場合、W&B は 4 つのドットをサポートします。

ワークスペースの動作が突然遅くなった場合は、最近の runs が意図せずに数千もの新しいメトリクスを記録していないか確認してください。（これは、数千ものプロットがあるセクションで、表示されている run が 1 つまたは 2 つしかないことで簡単に見つけることができます。）記録されている場合は、それらの runs を削除し、目的のメトリクスで再作成することを検討してください。

値の幅

ログに記録する単一の値のサイズを 1 MB 未満に、単一の wandb.log 呼び出しの合計サイズを 25 MB 未満に制限します。この制限は、wandb.Image、wandb.Audio などの wandb.Media タイプには適用されません。

# ❌ 推奨されません
wandb.log({"wide_key": range(10000000)})

# ❌ 推奨されません
with f as open("large_file.json", "r"):
    large_data = json.load(f)
    wandb.log(large_data)

幅の広い値は、幅の広い値を持つメトリクスだけでなく、run 内のすべてのメトリクスのプロットの読み込み時間に影響を与える可能性があります。

推奨量よりも幅の広い値をログに記録した場合でも、データは保存および追跡されます。ただし、プロットの読み込みが遅くなる可能性があります。

メトリクスの頻度

ログに記録するメトリクスに適切なログ記録頻度を選択してください。一般的な経験則として、メトリクスの幅が広いほど、ログに記録する頻度を低くする必要があります。W&B は以下を推奨します。

スカラー: メトリクスごとに <100,000 ログポイント
メディア: メトリクスごとに <50,000 ログポイント
ヒストグラム: メトリクスごとに <10,000 ログポイント

# 合計 100 万ステップのトレーニングループ
for step in range(1000000):
    # ❌ 推奨されません
    wandb.log(
        {
            "scalar": step,  # 100,000 スカラー
            "media": wandb.Image(...),  # 100,000 画像
            "histogram": wandb.Histogram(...),  # 100,000 ヒストグラム
        }
    )

    # ✅ 推奨
    if step % 1000 == 0:
        wandb.log(
            {
                "histogram": wandb.Histogram(...),  # 10,000 ヒストグラム
            },
            commit=False,
        )
    if step % 200 == 0:
        wandb.log(
            {
                "media": wandb.Image(...),  # 50,000 画像
            },
            commit=False,
        )
    if step % 100 == 0:
        wandb.log(
            {
                "scalar": step,  # 100,000 スカラー
            },
            commit=True,
        )  # バッチ処理されたステップごとのメトリクスをまとめてコミット

ガイドラインを超えても、W&B はログに記録されたデータを受け入れ続けますが、ページの読み込みが遅くなる場合があります。

Config サイズ

run config の合計サイズを 10 MB 未満に制限します。大きい値をログに記録すると、プロジェクトワークスペースと runs テーブルの操作が遅くなる可能性があります。

# ✅ 推奨
wandb.init(
    config={
        "lr": 0.1,
        "batch_size": 32,
        "epochs": 4,
    }
)

# ❌ 推奨されません
wandb.init(
    config={
        "steps": range(10000000),
    }
)

# ❌ 推奨されません
with f as open("large_config.json", "r"):
    large_config = json.load(f)
    wandb.init(config=large_config)

ワークスペースに関する考慮事項

Run count

読み込み時間を短縮するには、単一のプロジェクト内の runs の合計数を以下に抑えてください。

SaaS Cloud で 100,000
専用クラウドまたは自己管理で 10,000

これらのしきい値を超える run カウントは、プロジェクトワークスペースまたは runs テーブルを含む操作、特に runs のグルーピング時、または runs 中に多数の個別のメトリクスを収集する場合に、速度が低下する可能性があります。メトリクス数セクションも参照してください。

チームが頻繁に同じ runs のセット（最近の runs のセットなど）にアクセスする場合は、あまり頻繁に使用されない runs をまとめて移動することを検討して、新しい「アーカイブ」プロジェクトに移動し、作業プロジェクトにはより少ない runs のセットを残します。

ワークスペースのパフォーマンス

このセクションでは、ワークスペースのパフォーマンスを最適化するためのヒントを紹介します。

パネル数

デフォルトでは、ワークスペースは自動であり、ログに記録されたキーごとに標準パネルを生成します。大規模なプロジェクトのワークスペースに、ログに記録された多くのキーのパネルが含まれている場合、ワークスペースの読み込みと使用に時間がかかる場合があります。パフォーマンスを向上させるには、次のことができます。

ワークスペースを手動モードにリセットします。これには、デフォルトでパネルが含まれていません。
クイック追加を使用して、視覚化する必要があるログに記録されたキーのパネルを選択的に追加します。

未使用のパネルを 1 つずつ削除しても、パフォーマンスへの影響はほとんどありません。代わりに、ワークスペースをリセットし、必要なパネルのみを選択的に追加し直します。

ワークスペースの構成の詳細については、パネルを参照してください。

セクション数

ワークスペース内に数百ものセクションがあると、パフォーマンスが低下する可能性があります。メトリクスの高レベルのグルーピングに基づいてセクションを作成し、メトリクスごとに 1 つのセクションというアンチパターンを避けることを検討してください。

セクションが多すぎてパフォーマンスが低下している場合は、サフィックスではなくプレフィックスでセクションを作成するようにワークスペース設定を検討してください。これにより、セクションの数が減り、パフォーマンスが向上する可能性があります。

メトリクス数

run あたり 5000 ～ 100,000 個のメトリクスをログに記録する場合は、W&B は手動ワークスペースを使用することをお勧めします。手動モードでは、さまざまなメトリクスのセットを探索するために、必要に応じてパネルを簡単に追加および削除できます。より集中的なプロットのセットを使用すると、ワークスペースの読み込みが速くなります。プロットされていないメトリクスは、通常どおり収集および保存されます。

ワークスペースを手動モードにリセットするには、ワークスペースのアクション ... メニューをクリックし、ワークスペースのリセット をクリックします。ワークスペースをリセットしても、runs の保存されたメトリクスには影響しません。ワークスペースの管理の詳細をご覧ください。

ファイル数

単一の run でアップロードされるファイルの総数を 1,000 未満に抑えてください。多数のファイルをログに記録する必要がある場合は、W&B Artifacts を使用できます。単一の run で 1,000 個を超えるファイルがあると、run ページの速度が低下する可能性があります。

Reports とワークスペース

レポートは、パネル、テキスト、メディアの任意の配置を自由に構成できるため、同僚と洞察を簡単に共有できます。

対照的に、ワークスペースでは、数百から数十万もの runs にわたって、数十から数千ものメトリクスを高密度かつ高性能に分析できます。ワークスペースには、 Reports と比較して、最適化されたキャッシュ、クエリ、および読み込み機能があります。ワークスペースは、主にプレゼンテーションではなく分析に使用されるプロジェクト、または 20 個以上のプロットをまとめて表示する必要がある場合にお勧めです。

Python スクリプトのパフォーマンス

Python スクリプトのパフォーマンスが低下する原因はいくつかあります。

データのサイズが大きすぎる。データサイズが大きいと、トレーニングループに 1 ミリ秒を超えるオーバーヘッドが発生する可能性があります。
ネットワークの速度と、W&B バックエンドの構成方法
wandb.log を 1 秒間に数回以上呼び出す。これは、wandb.log が呼び出されるたびに、トレーニングループにわずかな遅延が追加されるためです。

頻繁なログ記録により、トレーニング runs が遅くなっていませんか？ログ記録戦略を変更してパフォーマンスを向上させる方法については、この Colab を参照してください。

W&B は、レート制限を超える制限は一切主張しません。W&B Python SDK は、制限を超える要求に対して、指数関数的な「バックオフ」および「再試行」要求を自動的に完了します。W&B Python SDK は、コマンドラインで「ネットワーク障害」で応答します。無償アカウントの場合、W&B は、使用量が合理的なしきい値を超える極端な場合に連絡する場合があります。

レート制限

W&B SaaS Cloud API は、システムの整合性を維持し、可用性を確保するために、レート制限を実装しています。この対策により、単一のユーザーが共有インフラストラクチャーで利用可能なリソースを独占することを防ぎ、すべてのユーザーがサービスにアクセスできる状態を維持します。さまざまな理由で、より低いレート制限が発生する可能性があります。

レート制限は変更される可能性があります。

レート制限 HTTP ヘッダー

上記のテーブルは、レート制限 HTTP ヘッダーを示しています。

ヘッダー名	説明
RateLimit-Limit	1 つの時間枠で使用可能なクォータ量。0 ～ 1000 の範囲でスケーリングされます。
RateLimit-Remaining	現在のレート制限ウィンドウのクォータ量。0 ～ 1000 の範囲でスケーリングされます。
RateLimit-Reset	現在のクォータがリセットされるまでの秒数

メトリクスログ記録 API のレート制限

スクリプト内の wandb.log 呼び出しは、メトリクスログ記録 API を利用して、トレーニングデータを W&B にログ記録します。この API は、オンラインまたはオフライン同期のいずれかを通じて実行されます。いずれの場合も、ローリングタイムウィンドウでレート制限クォータ制限が課されます。これには、合計リクエストサイズとリクエストレートの制限が含まれます。後者は、ある時間の長さにおけるリクエスト数を示します。

W&B は、W&B プロジェクトごとにレート制限を適用します。したがって、チームに 3 つのプロジェクトがある場合、各プロジェクトには独自のレート制限クォータがあります。チームおよびエンタープライズプランのユーザーは、無料プランのユーザーよりも高いレート制限があります。

メトリクスログ記録 API の使用中にレート制限に達すると、標準出力にエラーを示す関連メッセージが表示されます。

メトリクスログ記録 API レート制限を下回るための推奨事項

レート制限を超えると、レート制限がリセットされるまで run.finish() が遅延する可能性があります。これを回避するには、次の戦略を検討してください。

W&B Python SDK バージョンを更新する: 最新バージョンの W&B Python SDK を使用していることを確認します。W&B Python SDK は定期的に更新され、要求を正常に再試行し、クォータの使用を最適化するための拡張メカニズムが含まれています。
メトリクスログ記録頻度を下げる: クォータを節約するために、メトリクスのログ記録頻度を最小限に抑えます。たとえば、epoch ごとにメトリクスをログ記録するのではなく、5 epoch ごとにログ記録するようにコードを変更できます。

if epoch % 5 == 0:  # 5 epoch ごとにメトリクスをログ記録する
    wandb.log({"acc": accuracy, "loss": loss})

手動データ同期: レート制限されている場合、W&B は run データをローカルに保存します。コマンド wandb sync <run-file-path> を使用して、データを手動で同期できます。詳細については、wandb sync リファレンスを参照してください。

GraphQL API のレート制限

W&B Models UI および SDK のパブリック API は、GraphQL リクエストをサーバーに送信して、データのクエリと変更を行います。SaaS Cloud 内のすべての GraphQL リクエストについて、W&B は、承認されていないリクエストの場合は IP アドレスごとに、承認されているリクエストの場合はユーザーごとにレート制限を適用します。制限は、固定された時間枠内のリクエストレート（1 秒あたりのリクエスト数）に基づいており、料金プランによってデフォルトの制限が決定されます。プロジェクトパス（たとえば、 Reports 、 runs 、 Artifacts ）を指定する関連 SDK リクエストの場合、W&B はプロジェクトごとにレート制限を適用します。これは、データベースのクエリ時間によって測定されます。

チームおよびエンタープライズプランのユーザーは、無料プランのユーザーよりも高いレート制限を受け取ります。 W&B Models SDK のパブリック API の使用中にレート制限に達すると、標準出力にエラーを示す関連メッセージが表示されます。

GraphQL API レート制限を下回るための推奨事項

W&B Models SDK のパブリック API を使用して大量のデータをフェッチする場合は、リクエストの間に少なくとも 1 秒待機することを検討してください。429 ステータスコードを受信した場合、または応答ヘッダーに RateLimit-Remaining=0 が表示された場合は、再試行する前に RateLimit-Reset で指定された秒数待機します。

ブラウザに関する考慮事項

W&B アプリはメモリを大量に消費する可能性があり、Chrome で最高のパフォーマンスを発揮します。コンピューターのメモリに応じて、W&B を 3 つ以上のタブで同時にアクティブにすると、パフォーマンスが低下する可能性があります。予期しないパフォーマンスの低下が発生した場合は、他のタブまたはアプリケーションを閉じることを検討してください。

W&B へのパフォーマンス問題の報告

W&B はパフォーマンスを重視しており、遅延のすべてのレポートを調査します。調査を迅速化するために、読み込み時間が遅いことを報告する場合は、主要なメトリクスとパフォーマンスイベントをキャプチャする W&B の組み込みパフォーマンスロガーの呼び出しを検討してください。読み込みが遅いページに URL パラメータ &PERF_LOGGING を追加し、コンソールの出力をアカウントチームまたはサポートと共有します。

1.9 - Reproduce experiments

チームメンバーが作成した実験を再現して、その結果を検証します。

実験を再現する前に、以下をメモする必要があります。

run が記録された project の名前
再現したい run の名前

実験を再現するには:

run が記録されている project に移動します。
左側のサイドバーで [Workspace] タブを選択します。
run のリストから、再現する run を選択します。
[概要] をクリックします。

次に、特定のハッシュで実験のコードをダウンロードするか、実験のリポジトリ全体をクローンします。

実験の Python スクリプトまたは notebook をダウンロードします。

[Command] フィールドで、実験を作成したスクリプトの名前をメモします。
左側のナビゲーションバーで [Code] タブを選択します。
スクリプトまたは notebook に対応するファイルの横にある [ダウンロード] をクリックします。

チームメイトが実験の作成に使用した GitHub リポジトリをクローンします。これを行うには:

必要に応じて、チームメイトが実験の作成に使用した GitHub リポジトリへのアクセス権を取得します。
[Git リポジトリ] フィールドをコピーします。ここには GitHub リポジトリの URL が含まれています。

リポジトリをクローンします。

git clone https://github.com/your-repo.git && cd your-repo

[Git state] フィールドをコピーしてターミナルに貼り付けます。Git state は、チームメイトが実験の作成に使用した正確なコミットをチェックアウトする一連の Git コマンドです。上記のコードスニペットで指定された値を独自の値に置き換えます。
```
git checkout -b "<run-name>" 0123456789012345678901234567890123456789
```

左側のナビゲーションバーで [ファイル] を選択します。
requirements.txt ファイルをダウンロードして、作業ディレクトリーに保存します。このディレクトリーには、クローンされた GitHub リポジトリ、またはダウンロードされた Python スクリプトまたは notebook のいずれかが含まれている必要があります。
（推奨）Python 仮想環境を作成します。
requirements.txt ファイルで指定された要件をインストールします。
```
pip install -r requirements.txt
```
コードと依存関係が揃ったので、スクリプトまたは notebook を実行して実験を再現できます。リポジトリをクローンした場合は、スクリプトまたは notebook があるディレクトリーに移動する必要がある場合があります。それ以外の場合は、作業ディレクトリーからスクリプトまたは notebook を実行できます。

Python notebook をダウンロードした場合は、notebook をダウンロードしたディレクトリーに移動し、ターミナルで次のコマンドを実行します。

jupyter notebook

Python スクリプトをダウンロードした場合は、スクリプトをダウンロードしたディレクトリーに移動し、ターミナルで次のコマンドを実行します。<> で囲まれた値は独自の値に置き換えてください。

python <your-script-name>.py

1.10 - Import and export data

MLFlow から<について>データをインポートしたり、W&B に保存した<について>データをエクスポートまたは更新したりします。

W&B Public API を使用して、データのエクスポートまたはデータのインポートを行います。

この機能には python>=3.8 が必要です。

MLFlow からのデータのインポート

W&B は、実験、run、Artifacts、メトリクス、その他のメタデータなど、MLFlow からのデータのインポートをサポートしています。

依存関係をインストールします。

# 注：これには py38+ が必要です
pip install wandb[importers]

W&B にログインします。以前にログインしていない場合は、プロンプトに従ってください。

wandb login

既存の MLFlow サーバーからすべての run をインポートします。

from wandb.apis.importers.mlflow import MlflowImporter

importer = MlflowImporter(mlflow_tracking_uri="...")

runs = importer.collect_runs()
importer.import_runs(runs)

デフォルトでは、importer.collect_runs() は MLFlow サーバーからすべての run を収集します。特定のサブセットをアップロードする場合は、独自の run イテラブルを作成してインポーターに渡すことができます。

import mlflow
from wandb.apis.importers.mlflow import MlflowRun

client = mlflow.tracking.MlflowClient(mlflow_tracking_uri)

runs: Iterable[MlflowRun] = []
for run in mlflow_client.search_runs(...):
    runs.append(MlflowRun(run, client))

importer.import_runs(runs)

Databricks MLFlow からインポートする場合は、最初にDatabricks CLI を構成する必要がある場合があります。

前のステップで mlflow-tracking-uri="databricks" を設定します。

Artifacts のインポートをスキップするには、artifacts=False を渡します。

importer.import_runs(runs, artifacts=False)

特定の W&B entity と project にインポートするには、Namespace を渡します。

from wandb.apis.importers import Namespace

importer.import_runs(runs, namespace=Namespace(entity, project))

データのエクスポート

Public API を使用して、W&B に保存したデータをエクスポートまたは更新します。この API を使用する前に、スクリプトからデータをログに記録します。詳細については、クイックスタートを確認してください。

Public API のユースケース

データのエクスポート: Jupyter Notebook でカスタム分析を行うためのデータフレームをプルダウンします。データを調べたら、新しい分析 run を作成して結果をログに記録することで、調査結果を同期できます。例：wandb.init(job_type="analysis")
既存の Runs の更新: W&B run に関連してログに記録されたデータを更新できます。たとえば、アーキテクチャや最初にログに記録されなかったハイパーパラメーターなど、追加情報を含めるように一連の run の config を更新したい場合があります。

利用可能な機能の詳細については、生成されたリファレンスドキュメントを参照してください。

APIキーの作成

APIキーは、W&B に対するマシンの認証を行います。APIキーは、ユーザープロファイルから生成できます。

より合理的なアプローチとして、https://wandb.ai/authorizeに直接アクセスして APIキーを生成できます。表示された APIキーをコピーして、パスワードマネージャーなどの安全な場所に保存します。

右上隅にあるユーザープロファイルアイコンをクリックします。
ユーザー設定を選択し、APIキーセクションまでスクロールします。
表示をクリックします。表示された APIキーをコピーします。APIキーを非表示にするには、ページをリロードします。

run パスの検索

Public API を使用するには、run パス <entity>/<project>/<run_id> が必要になることがよくあります。アプリ UI で、run ページを開き、Overviewタブをクリックして、run パスを取得します。

Run データのエクスポート

完了した run またはアクティブな run からデータをダウンロードします。一般的な使用法としては、Jupyter ノートブックでカスタム分析を行うためのデータフレームのダウンロードや、自動化された環境でのカスタムロジックの使用などがあります。

import wandb

api = wandb.Api()
run = api.run("<entity>/<project>/<run_id>")

run オブジェクトの最も一般的に使用される属性は次のとおりです。

属性	意味
`run.config`	トレーニング run のハイパーパラメーターや、データセット Artifact を作成する run の前処理メソッドなど、run の設定情報の辞書。これらを実行の入力と考えてください。
`run.history()`	損失など、モデルのトレーニング中に変化する値を格納するための辞書のリスト。コマンド `wandb.log()` はこのオブジェクトに追加されます。
`run.summary`	run の結果をまとめた情報の辞書。これには、精度や損失などのスカラーや、大きなファイルを含めることができます。デフォルトでは、`wandb.log()` は summary をログに記録された時系列の最終値に設定します。summary の内容は直接設定することもできます。summary を run の出力と考えてください。

過去の run のデータを変更または更新することもできます。デフォルトでは、api オブジェクトの単一インスタンスがすべてのネットワークリクエストをキャッシュします。ユースケースで実行中のスクリプトでリアルタイムの情報が必要な場合は、api.flush() を呼び出して更新された値を取得します。

さまざまな属性について

以下の run について

n_epochs = 5
config = {"n_epochs": n_epochs}
run = wandb.init(project=project, config=config)
for n in range(run.config.get("n_epochs")):
    run.log(
        {"val": random.randint(0, 1000), "loss": (random.randint(0, 1000) / 1000.00)}
    )
run.finish()

これらは、上記の run オブジェクト属性のさまざまな出力です。

`run.config`

{"n_epochs": 5}

`run.history()`

   _step  val   loss  _runtime  _timestamp
0      0  500  0.244         4  1644345412
1      1   45  0.521         4  1644345412
2      2  240  0.785         4  1644345412
3      3   31  0.305         4  1644345412
4      4  525  0.041         4  1644345412

`run.summary`

{
    "_runtime": 4,
    "_step": 4,
    "_timestamp": 1644345412,
    "_wandb": {"runtime": 3},
    "loss": 0.041,
    "val": 525,
}

サンプリング

デフォルトの履歴メソッドは、メトリクスを固定数のサンプルにサンプリングします（デフォルトは 500 です。これは samples __ 引数で変更できます）。大規模な run ですべてのデータをエクスポートする場合は、run.scan_history() メソッドを使用できます。詳細については、APIリファレンスを参照してください。

複数の Run のクエリ

このサンプルスクリプトは project を検索し、名前、config、summary 統計を含む Runs の CSV を出力します。<entity> と <project> を、それぞれ W&B entity と project の名前に置き換えます。

import pandas as pd
import wandb

api = wandb.Api()
entity, project = "<entity>", "<project>"
runs = api.runs(entity + "/" + project)

summary_list, config_list, name_list = [], [], []
for run in runs:
    # .summary には、精度などの
    # メトリクスの出力キー/値が含まれています。
    #  大きなファイルを省略するために ._json_dict を呼び出します
    summary_list.append(run.summary._json_dict)

    # .config にはハイパーパラメーターが含まれています。
    #  _ で始まる特殊な値を削除します。
    config_list.append({k: v for k, v in run.config.items() if not k.startswith("_")})

    # .name は run の人間が読める名前です。
    name_list.append(run.name)

runs_df = pd.DataFrame(
    {"summary": summary_list, "config": config_list, "name": name_list}
)

runs_df.to_csv("project.csv")

W&B API は、api.runs() を使用して project 内の Runs をクエリする方法も提供します。最も一般的なユースケースは、カスタム分析のために Runs データをエクスポートすることです。クエリインターフェイスは、MongoDB が使用するものと同じです。

runs = api.runs(
    "username/project",
    {"$or": [{"config.experiment_name": "foo"}, {"config.experiment_name": "bar"}]},
)
print(f"Found {len(runs)} runs")

api.runs を呼び出すと、反復可能でリストのように動作する Runs オブジェクトが返されます。デフォルトでは、オブジェクトは必要に応じて一度に 50 個の Runs を順番にロードしますが、per_page キーワード引数を使用して、ページごとにロードされる数を変更できます。

api.runs は order キーワード引数も受け入れます。デフォルトの順序は -created_at です。結果を昇順で並べ替えるには、+created_at を指定します。config または summary の値でソートすることもできます。たとえば、summary.val_acc や config.experiment_name などです。

エラー処理

W&B サーバーとの通信中にエラーが発生すると、wandb.CommError が発生します。元の例外は、exc 属性を介して調べることができます。

API 経由で最新の git コミットを取得する

UI で、run をクリックし、run ページの Overview タブをクリックして、最新の git コミットを確認します。これはファイル wandb-metadata.json にもあります。Public API を使用して、run.commit で git ハッシュを取得できます。

run の実行中に run の名前と ID を取得する

wandb.init() を呼び出した後、スクリプトからランダムな run ID または人間が読める run 名に次のようにアクセスできます。

一意の run ID (8 文字のハッシュ): wandb.run.id
ランダムな run 名 (人間が読める): wandb.run.name

Runs に役立つ識別子を設定する方法について検討している場合は、次のことをお勧めします。

Run ID: 生成されたハッシュのままにします。これは、project 内の Runs 間で一意である必要があります。
Run 名: これは、チャート上の異なる行を区別できるように、短く、読みやすく、できれば一意である必要があります。
Run ノート: これは、run で何をしているかを簡単に説明するのに最適な場所です。これは、wandb.init(notes="ここにノート") で設定できます。
Run タグ: Run タグで動的に追跡し、UI のフィルターを使用して、関心のある Runs のみにテーブルを絞り込みます。スクリプトからタグを設定し、UI の Runs テーブルと run ページの Overview タブの両方で編集できます。詳細な手順については、こちらを参照してください。

Public API の例

matplotlib または seaborn で視覚化するためにデータをエクスポートする

一般的なエクスポートパターンのいくつかの例については、API 例を確認してください。カスタムプロットまたは展開された Runs テーブルのダウンロードボタンをクリックして、ブラウザーから CSV をダウンロードすることもできます。

run からメトリクスを読み取る

この例では、"<entity>/<project>/<run_id>" に保存された run の wandb.log({"accuracy": acc}) で保存されたタイムスタンプと精度を出力します。

import wandb

api = wandb.Api()

run = api.run("<entity>/<project>/<run_id>")
if run.state == "finished":
    for i, row in run.history().iterrows():
        print(row["_timestamp"], row["accuracy"])

Runs のフィルター

MongoDB Query Language を使用してフィルターできます。

日付

runs = api.runs(
    "<entity>/<project>",
    {"$and": [{"created_at": {"$lt": "YYYY-MM-DDT##", "$gt": "YYYY-MM-DDT##"}}]},
)

run から特定のメトリクスを読み取る

run から特定のメトリクスをプルするには、keys 引数を使用します。run.history() を使用する場合のデフォルトのサンプル数は 500 です。特定のメトリクスを含まないログに記録されたステップは、出力データフレームに NaN として表示されます。keys 引数を指定すると、API はリストされたメトリクスキーを含むステップをより頻繁にサンプリングします。

import wandb

api = wandb.Api()

run = api.run("<entity>/<project>/<run_id>")
if run.state == "finished":
    for i, row in run.history(keys=["accuracy"]).iterrows():
        print(row["_timestamp"], row["accuracy"])

2 つの Run の比較

これにより、run1 と run2 で異なる config パラメーターが出力されます。

import pandas as pd
import wandb

api = wandb.Api()

# <entity>、<project>、<run_id> に置き換えます
run1 = api.run("<entity>/<project>/<run_id>")
run2 = api.run("<entity>/<project>/<run_id>")


df = pd.DataFrame([run1.config, run2.config]).transpose()

df.columns = [run1.name, run2.name]
print(df[df[run1.name] != df[run2.name]])

出力：

              c_10_sgd_0.025_0.01_long_switch base_adam_4_conv_2fc
batch_size                                 32                   16
n_conv_layers                               5                    4
Optimizer                             rmsprop                 adam

run のメトリクスを、run の完了後に更新する

この例では、以前の run の精度を 0.9 に設定します。また、以前の run の精度ヒストグラムを numpy_array のヒストグラムになるように変更します。

import wandb

api = wandb.Api()

run = api.run("<entity>/<project>/<run_id>")
run.summary["accuracy"] = 0.9
run.summary["accuracy_histogram"] = wandb.Histogram(numpy_array)
run.summary.update()

完了した run でメトリクスの名前を変更する

この例では、テーブルの summary 列の名前を変更します。

import wandb

api = wandb.Api()

run = api.run("<entity>/<project>/<run_id>")
run.summary["new_name"] = run.summary["old_name"]
del run.summary["old_name"]
run.summary.update()

列の名前の変更は、テーブルにのみ適用されます。チャートは引き続き元の名前でメトリクスを参照します。

既存の Run の config を更新する

この例では、config 設定の 1 つを更新します。

import wandb

api = wandb.Api()

run = api.run("<entity>/<project>/<run_id>")
run.config["key"] = updated_value
run.update()

システムリソースの消費量を CSV ファイルにエクスポートする

以下のスニペットは、システムリソースの消費量を検索し、CSV に保存します。

import wandb

run = wandb.Api().run("<entity>/<project>/<run_id>")

system_metrics = run.history(stream="events")
system_metrics.to_csv("sys_metrics.csv")

サンプリングされていないメトリクスデータを取得する

履歴からデータをプルすると、デフォルトで 500 ポイントにサンプリングされます。run.scan_history() を使用して、ログに記録されたすべてのデータポイントを取得します。次に、履歴に記録されたすべての loss データポイントをダウンロードする例を示します。

import wandb

api = wandb.Api()

run = api.run("<entity>/<project>/<run_id>")
history = run.scan_history()
losses = [row["loss"] for row in history]

履歴からページネーションされたデータを取得する

メトリクスがバックエンドでゆっくりとフェッチされている場合、または API リクエストがタイムアウトしている場合は、個々のリクエストがタイムアウトしないように、scan_history のページサイズを小さくしてみてください。デフォルトのページサイズは 500 なので、さまざまなサイズを試して最適なものを確認できます。

import wandb

api = wandb.Api()

run = api.run("<entity>/<project>/<run_id>")
run.scan_history(keys=sorted(cols), page_size=100)

project 内のすべての Runs からメトリクスを CSV ファイルにエクスポートする

このスクリプトは、project 内の Runs をプルダウンし、名前、config、summary 統計を含む Runs のデータフレームと CSV を生成します。<entity> と <project> を、それぞれ W&B entity と project の名前に置き換えます。

import pandas as pd
import wandb

api = wandb.Api()
entity, project = "<entity>", "<project>"
runs = api.runs(entity + "/" + project)

summary_list, config_list, name_list = [], [], []
for run in runs:
    # .summary には、精度などの
    # メトリクスの出力キー/値が含まれています。
    #  大きなファイルを省略するために ._json_dict を呼び出します
    summary_list.append(run.summary._json_dict)

    # .config にはハイパーパラメーターが含まれています。
    #  _ で始まる特殊な値を削除します。
    config_list.append({k: v for k, v in run.config.items() if not k.startswith("_")})

    # .name は run の人間が読める名前です。
    name_list.append(run.name)

runs_df = pd.DataFrame(
    {"summary": summary_list, "config": config_list, "name": name_list}
)

runs_df.to_csv("project.csv")

Run の開始時刻を取得する

このコードスニペットは、run が作成された時刻を取得します。

import wandb

api = wandb.Api()

run = api.run("entity/project/run_id")
start_time = run.created_at

完了した run にファイルをアップロードする

以下のコードスニペットは、選択したファイルを完了した run にアップロードします。

import wandb

api = wandb.Api()

run = api.run("entity/project/run_id")
run.upload_file("file_name.extension")

Run からファイルをダウンロードする

これは、cifar project の run ID uxte44z7 に関連付けられたファイル “model-best.h5” を検索し、ローカルに保存します。

import wandb

api = wandb.Api()

run = api.run("<entity>/<project>/<run_id>")
run.file("model-best.h5").download()

Run からすべてのファイルをダウンロードする

これは、run に関連付けられたすべてのファイルを検索し、ローカルに保存します。

import wandb

api = wandb.Api()

run = api.run("<entity>/<project>/<run_id>")
for file in run.files():
    file.download()

特定の sweep から Runs を取得する

このスニペットは、特定の sweep に関連付けられたすべての Runs をダウンロードします。

import wandb

api = wandb.Api()

sweep = api.sweep("<entity>/<project>/<sweep_id>")
sweep_runs = sweep.runs

Sweep から最適な Run を取得する

次のスニペットは、指定された sweep から最適な Run を取得します。

import wandb

api = wandb.Api()

sweep = api.sweep("<entity>/<project>/<sweep_id>")
best_run = sweep.best_run()

best_run は、sweep config の metric パラメータによって定義された最適なメトリクスを持つ Run です。

Sweep から最適なモデルファイルをダウンロードする

このスニペットは、モデルファイルを model.h5 に保存した Runs を使用して、検証精度が最も高いモデルファイルを sweep からダウンロードします。

import wandb

api = wandb.Api()

sweep = api.sweep("<entity>/<project>/<sweep_id>")
runs = sorted(sweep.runs, key=lambda run: run.summary.get("val_acc", 0), reverse=True)
val_acc = runs[0].summary.get("val_acc", 0)
print(f"Best run {runs[0].name} with {val_acc}% val accuracy")

runs[0].file("model.h5").download(replace=True)
print("Best model saved to model-best.h5")

指定された拡張子を持つすべてのファイルを Run から削除する

このスニペットは、指定された拡張子を持つファイルを Run から削除します。

import wandb

api = wandb.Api()

run = api.run("<entity>/<project>/<run_id>")

extension = ".png"
files = run.files()
for file in files:
    if file.name.endswith(extension):
        file.delete()

システムメトリクスデータをダウンロードする

このスニペットは、run のすべてのシステムリソース消費量メトリクスを含むデータフレームを生成し、CSV に保存します。

import wandb

api = wandb.Api()

run = api.run("<entity>/<project>/<run_id>")
system_metrics = run.history(stream="events")
system_metrics.to_csv("sys_metrics.csv")

Summary メトリクスの更新

辞書を渡して summary メトリクスを更新できます。

summary.update({"key": val})

Run を実行したコマンドを取得する

各 Run は、Run の概要ページで Run を起動したコマンドをキャプチャします。このコマンドを API からプルダウンするには、次を実行します。

import wandb

api = wandb.Api()

run = api.run("<entity>/<project>/<run_id>")

meta = json.load(run.file("wandb-metadata.json").download())
program = ["python"] + [meta["program"]] + meta["args"]

1.11 - Environment variables

W&B の環境変数を設定します。

自動化された環境でスクリプトを実行する場合、スクリプトの実行前またはスクリプト内で設定された環境変数で wandb を制御できます。

# これは秘密であり、バージョン管理にチェックインすべきではありません
WANDB_API_KEY=$YOUR_API_KEY
# 名前とメモはオプション
WANDB_NAME="My first run"
WANDB_NOTES="Smaller learning rate, more regularization."

# wandb/settings ファイルをチェックインしない場合にのみ必要
WANDB_ENTITY=$username
WANDB_PROJECT=$project

# スクリプトをクラウドに同期させたくない場合
os.environ["WANDB_MODE"] = "offline"

# sweep ID トラッキングを Run オブジェクトと関連クラスに追加
os.environ["WANDB_SWEEP_ID"] = "b05fq58z"

オプションの環境変数

これらのオプションの環境変数を使用して、リモートマシンでの認証の設定などを行います。

変数名	使用法
WANDB_ANONYMOUS	これを `allow`、`never`、または `must` に設定して、ユーザーが秘密の URL で匿名の run を作成できるようにします。
WANDB_API_KEY	アカウントに関連付けられた認証 key を設定します。設定ページで key を確認できます。リモートマシンで `wandb login` が実行されていない場合は、これを設定する必要があります。
WANDB_BASE_URL	wandb/local を使用している場合は、この環境変数を `http://YOUR_IP:YOUR_PORT` に設定する必要があります
WANDB_CACHE_DIR	これはデフォルトで ~/.cache/wandb になっています。この場所をこの環境変数で上書きできます
WANDB_CONFIG_DIR	これはデフォルトで ~/.config/wandb になっています。この場所をこの環境変数で上書きできます
WANDB_CONFIG_PATHS	wandb.config にロードする yaml ファイルのコンマ区切りリスト。config を参照してください。
WANDB_CONSOLE	stdout / stderr ログを無効にするには、これを “off” に設定します。これは、サポートする環境ではデフォルトで “on” になっています。
WANDB_DATA_DIR	ステージング Artifacts がアップロードされる場所。デフォルトの場所はプラットフォームによって異なります。これは、`platformdirs` Python パッケージの `user_data_dir` の値を使用するためです。
WANDB_DIR	トレーニングスクリプトからの wandb ディレクトリーの相対位置ではなく、生成されたすべてのファイルをここに保存するには、これを絶対パスに設定します。このディレクトリーが存在し、プロセスを実行するユーザーが書き込むことができることを確認してください。これは、ダウンロードされた Artifacts の場所には影響しないことに注意してください。代わりに WANDB_ARTIFACT_DIR を使用して設定できます
WANDB_ARTIFACT_DIR	トレーニングスクリプトからの artifacts ディレクトリーの相対位置ではなく、ダウンロードされたすべての Artifacts をここに保存するには、これを絶対パスに設定します。このディレクトリーが存在し、プロセスを実行するユーザーが書き込むことができることを確認してください。これは、生成されたメタデータファイルの場所には影響しないことに注意してください。代わりに WANDB_DIR を使用して設定できます
WANDB_DISABLE_GIT	wandb が git リポジトリをプローブして最新のコミット/差分をキャプチャするのを防ぎます。
WANDB_DISABLE_CODE	wandb がノートブックまたは git の差分を保存しないようにするには、これを true に設定します。git リポジトリにいる場合は、現在のコミットを保存します。
WANDB_DOCKER	run の復元を有効にするには、これを docker イメージのダイジェストに設定します。これは、wandb docker コマンドで自動的に設定されます。`wandb docker my/image/name:tag --digest` を実行して、イメージのダイジェストを取得できます
WANDB_ENTITY	run に関連付けられたエンティティ。トレーニングスクリプトのディレクトリーで `wandb init` を実行した場合、wandb という名前のディレクトリーが作成され、ソース管理にチェックインできるデフォルトのエンティティが保存されます。そのファイルを作成したくない場合、またはファイルを上書きしたい場合は、環境変数を使用できます。
WANDB_ERROR_REPORTING	wandb が致命的なエラーをそのエラー追跡システムにログ記録しないようにするには、これを false に設定します。
WANDB_HOST	システムが提供するホスト名を使用したくない場合に、wandb インターフェイスに表示するホスト名を設定します
WANDB_IGNORE_GLOBS	無視するファイル glob のコンマ区切りリストにこれを設定します。これらのファイルはクラウドに同期されません。
WANDB_JOB_NAME	`wandb` によって作成されたジョブの名前を指定します。
WANDB_JOB_TYPE	run のさまざまなタイプを示すために、“トレーニング” や “評価” などのジョブタイプを指定します。詳細については、グループ化を参照してください。
WANDB_MODE	これを “offline” に設定すると、wandb は run のメタデータをローカルに保存し、サーバーに同期しません。これを `disabled` に設定すると、wandb は完全にオフになります。
WANDB_NAME	run の人間が読める名前。設定されていない場合は、ランダムに生成されます
WANDB_NOTEBOOK_NAME	jupyter で実行している場合は、この変数でノートブックの名前を設定できます。これを自動的に検出しようとします。
WANDB_NOTES	run に関するより長いメモ。マークダウンは許可されており、UI で後で編集できます。
WANDB_PROJECT	run に関連付けられたプロジェクト。これは `wandb init` で設定することもできますが、環境変数が値を上書きします。
WANDB_RESUME	デフォルトでは、これは never に設定されています。auto に設定すると、wandb は失敗した run を自動的に再開します。must に設定すると、起動時に run が強制的に存在します。常に独自のユニークな ID を生成する場合は、これを allow に設定し、常に WANDB_RUN_ID を設定します。
WANDB_RUN_GROUP	run を自動的にグループ化するための実験名を指定します。詳細については、グループ化を参照してください。
WANDB_RUN_ID	スクリプトの単一の run に対応するグローバルに一意の文字列（プロジェクトごと）にこれを設定します。64 文字以下である必要があります。単語以外の文字はすべてダッシュに変換されます。これは、障害が発生した場合に既存の run を再開するために使用できます。
WANDB_SILENT	wandb ログステートメントを非表示にするには、これを true に設定します。これが設定されている場合、すべてのログは WANDB_DIR/debug.log に書き込まれます
WANDB_SHOW_RUN	オペレーティングシステムがサポートしている場合、run URL でブラウザーを自動的に開くには、これを true に設定します。
WANDB_SWEEP_ID	sweep ID トラッキングを `Run` オブジェクトと関連クラスに追加し、UI に表示します。
WANDB_TAGS	run に適用されるタグのコンマ区切りリスト。
WANDB_USERNAME	run に関連付けられたチームのメンバーのユーザー名。これは、サービスアカウント API key とともに使用して、自動 run のチームのメンバーへの属性を有効にすることができます。
WANDB_USER_EMAIL	run に関連付けられたチームのメンバーのメール。これは、サービスアカウント API key とともに使用して、自動 run のチームのメンバーへの属性を有効にすることができます。

Singularity 環境

Singularity でコンテナーを実行している場合は、上記の変数の前に SINGULARITYENV_ を付けることで環境変数を渡すことができます。Singularity 環境変数の詳細については、こちらを参照してください。

AWS での実行

AWS でバッチジョブを実行している場合は、W&B 認証情報でマシンを簡単に認証できます。設定ページから API key を取得し、AWS バッチジョブ仕様で WANDB_API_KEY 環境変数を設定します。

2 - Sweeps

W&B Sweeps を使用したハイパーパラメータ探索とモデルの最適化

Try in Colab Try in W&B

W&B Sweeps を使用して、ハイパーパラメータの検索を自動化し、豊富なインタラクティブな実験管理を視覚化します。ベイズ、グリッド検索、ランダムなどの一般的な検索メソッドから選択して、ハイパーパラメータ空間を検索します。1つまたは複数のマシンにスイープをスケールおよび並列化します。

インタラクティブなダッシュボードで、大規模なハイパーパラメータチューニング実験から洞察を引き出します。

仕組み

2つの W&B CLI コマンドでスイープを作成します。

スイープを初期化する

wandb sweep --project <propject-name> <path-to-config file>

sweep agent を起動する

wandb agent <sweep-ID>

上記のコードスニペットと、このページにリンクされている Colab は、W&B CLI でスイープを初期化および作成する方法を示しています。スイープ設定を定義し、スイープを初期化し、スイープを開始するために使用する W&B Python SDK コマンドのステップごとの概要については、Sweeps の Walkthrough を参照してください。

開始方法

ユースケースに応じて、次のリソースを参照して W&B Sweeps を開始してください。

スイープ設定を定義し、スイープを初期化し、スイープを開始するために使用する W&B Python SDK コマンドのステップごとの概要については、sweeps walkthrough を参照してください。
この chapter では、次の方法について説明します。
W&B Sweeps でハイパーパラメータ最適化を調査する厳選された Sweep experiments のリストを見てみましょう。 result は W&B Reports に保存されます。

ステップごとのビデオについては、Tune Hyperparameters Easily with W&B Sweeps を参照してください。

2.1 - Tutorial: Define, initialize, and run a sweep

Sweeps クイックスタートでは、sweep の定義、初期化、および実行方法について説明します。主な手順は4つあります。

このページでは、sweep の定義、初期化、および実行方法について説明します。主な手順は4つあります。

トレーニングコードのセットアップ
sweep configuration での探索空間の定義
sweep の初期化
sweep agent の起動

次のコードをコピーして Jupyter Notebook または Python スクリプトに貼り付けます。

# W&B Python ライブラリをインポートして W&B にログインします
import wandb

wandb.login()

# 1: 目的関数/トレーニング関数を定義します
def objective(config):
    score = config.x**3 + config.y
    return score

def main():
    wandb.init(project="my-first-sweep")
    score = objective(wandb.config)
    wandb.log({"score": score})

# 2: 探索空間を定義します
sweep_configuration = {
    "method": "random",
    "metric": {"goal": "minimize", "name": "score"},
    "parameters": {
        "x": {"max": 0.1, "min": 0.01},
        "y": {"values": [1, 3, 7]},
    },
}

# 3: sweep を開始します
sweep_id = wandb.sweep(sweep=sweep_configuration, project="my-first-sweep")

wandb.agent(sweep_id, function=main, count=10)

以下のセクションでは、コードサンプルの各ステップを分解して説明します。

トレーニングコードのセットアップ

wandb.config からハイパーパラメーターの値を受け取り、それらを使用して model をトレーニングし、メトリクスを返すトレーニング関数を定義します。

必要に応じて、W&B Run の出力を保存する project の名前を指定します (wandb.init の project パラメータ)。project が指定されていない場合、run は「未分類」の project に配置されます。

sweep と run は両方とも同じ project に存在する必要があります。したがって、W&B を初期化するときに指定する名前は、sweep を初期化するときに指定する project の名前と一致する必要があります。

# 1: 目的関数/トレーニング関数を定義します
def objective(config):
    score = config.x**3 + config.y
    return score


def main():
    wandb.init(project="my-first-sweep")
    score = objective(wandb.config)
    wandb.log({"score": score})

sweep configuration での探索空間の定義

辞書で sweep するハイパーパラメーターを指定します。configuration オプションについては、sweep configuration の定義を参照してください。

上記の例は、ランダム検索 ('method':'random') を使用する sweep configuration を示しています。sweep は、バッチサイズ、エポック、および学習率について、configuration にリストされている値のランダムなセットをランダムに選択します。

W&B は、"goal": "minimize" が関連付けられている場合、metric キーで指定されたメトリクスを最小化します。この場合、W&B はメトリクス score ("name": "score") の最小化のために最適化します。

# 2: 探索空間を定義します
sweep_configuration = {
    "method": "random",
    "metric": {"goal": "minimize", "name": "score"},
    "parameters": {
        "x": {"max": 0.1, "min": 0.01},
        "y": {"values": [1, 3, 7]},
    },
}

Sweep の初期化

W&B は Sweep Controller を使用して、クラウド (標準)、ローカル (ローカル) で1つまたは複数のマシンにわたる Sweeps を管理します。Sweep Controller の詳細については、ローカルでの検索と停止アルゴリズムを参照してください。

sweep 識別番号は、sweep を初期化するときに返されます。

sweep_id = wandb.sweep(sweep=sweep_configuration, project="my-first-sweep")

sweep の初期化の詳細については、sweep の初期化を参照してください。

Sweep の開始

wandb.agent API 呼び出しを使用して sweep を開始します。

wandb.agent(sweep_id, function=main, count=10)

結果の可視化 (オプション)

project を開いて、W&B App ダッシュボードでライブ結果を確認します。数回クリックするだけで、パラレル座標図、パラメーターの重要性分析などの豊富なインタラクティブなグラフを構築できます。詳細

結果の可視化方法の詳細については、sweep 結果の可視化を参照してください。ダッシュボードの例については、このサンプルSweeps Projectを参照してください。

エージェントの停止 (オプション)

ターミナルで、Ctrl+C を押して現在の run を停止します。もう一度押すと、agent が終了します。

2.2 - Add W&B (wandb) to your code

W&B を Python コードスクリプトまたは Jupyter Notebook に追加します。

W&B Python SDK をスクリプトまたは Jupyter Notebook に追加する方法は多数あります。以下に、W&B Python SDK を独自のコードに統合する方法の「ベストプラクティス」の例を示します。

元のトレーニングスクリプト

Python スクリプトに次のコードがあるとします。ここでは、典型的なトレーニングループを模倣する main という関数を定義します。エポックごとに、トレーニングデータセットと検証データセットで精度と損失が計算されます。これらの値は、この例の目的のためにランダムに生成されます。

ここでは、ハイパーパラメータの値を格納する config という辞書を定義しました。セルの最後に、main 関数を呼び出して、モックトレーニングコードを実行します。

import random
import numpy as np

def train_one_epoch(epoch, lr, bs):
    acc = 0.25 + ((epoch / 30) + (random.random() / 10))
    loss = 0.2 + (1 - ((epoch - 1) / 10 + random.random() / 5))
    return acc, loss

def evaluate_one_epoch(epoch):
    acc = 0.1 + ((epoch / 20) + (random.random() / 10))
    loss = 0.25 + (1 - ((epoch - 1) / 10 + random.random() / 6))
    return acc, loss

# config variable with hyperparameter values
config = {"lr": 0.0001, "bs": 16, "epochs": 5}

def main():
    # Note that we define values from `wandb.config`
    # instead of defining hard values
    # ハードコードされた値を定義する代わりに、`wandb.config` から値を定義することに注意してください
    lr = config["lr"]
    bs = config["bs"]
    epochs = config["epochs"]

    for epoch in np.arange(1, epochs):
        train_acc, train_loss = train_one_epoch(epoch, lr, bs)
        val_acc, val_loss = evaluate_one_epoch(epoch)

        print("epoch: ", epoch)
        print("training accuracy:", train_acc, "training loss:", train_loss)
        print("validation accuracy:", val_acc, "training loss:", val_loss)

W&B Python SDK を使用したトレーニングスクリプト

次のコード例は、W&B Python SDK をコードに追加する方法を示しています。CLI で W&B Sweep ジョブを開始する場合は、[CLI] タブを確認してください。Jupyter Notebook または Python スクリプト内で W&B Sweep ジョブを開始する場合は、[Python SDK] タブを確認してください。

W&B Sweep を作成するために、次のコード例を追加しました。

Weights & Biases Python SDK をインポートします。
キーと値のペアで sweep configuration を定義する辞書オブジェクトを作成します。以下の例では、バッチサイズ (batch_size)、エポック数 (epochs)、および学習率 (lr) のハイパーパラメータは、各 sweep 中に変化します。sweep configuration の作成方法の詳細については、sweep configuration の定義を参照してください。
sweep configuration 辞書を wandb.sweep に渡します。これにより、sweep が初期化されます。これにより、sweep ID (sweep_id) が返されます。sweep の初期化方法の詳細については、sweep の初期化を参照してください。
wandb.init() API を使用して、W&B Run としてデータを同期およびログ記録するバックグラウンドプロセスを生成します。
(オプション) ハードコードされた値を定義する代わりに、wandb.config から値を定義します。
最適化するメトリクスを wandb.log でログに記録します。configuration で定義されたメトリクスをログに記録する必要があります。configuration 辞書 (この例では sweep_configuration) 内で、val_acc 値を最大化するように sweep を定義しました。
wandb.agent API 呼び出しで sweep を開始します。sweep ID、sweep が実行する関数の名前 (function=main) を指定し、試行する run の最大数を 4 (count=4) に設定します。W&B Sweep の開始方法の詳細については、sweep agent の開始を参照してください。

import wandb
import numpy as np
import random

# Define sweep config
# sweep configuration を定義する
sweep_configuration = {
    "method": "random",
    "name": "sweep",
    "metric": {"goal": "maximize", "name": "val_acc"},
    "parameters": {
        "batch_size": {"values": [16, 32, 64]},
        "epochs": {"values": [5, 10, 15]},
        "lr": {"max": 0.1, "min": 0.0001},
    },
}

# Initialize sweep by passing in config.
# (Optional) Provide a name of the project.
# configuration を渡して sweep を初期化します。
# （オプション） Project の名前を指定します。
sweep_id = wandb.sweep(sweep=sweep_configuration, project="my-first-sweep")


# Define training function that takes in hyperparameter
# values from `wandb.config` and uses them to train a
# model and return metric
# `wandb.config` から ハイパーパラメータ 値を取得し、それらを使用して
# モデルをトレーニングし、メトリクス を返すトレーニング関数を定義する
def train_one_epoch(epoch, lr, bs):
    acc = 0.25 + ((epoch / 30) + (random.random() / 10))
    loss = 0.2 + (1 - ((epoch - 1) / 10 + random.random() / 5))
    return acc, loss


def evaluate_one_epoch(epoch):
    acc = 0.1 + ((epoch / 20) + (random.random() / 10))
    loss = 0.25 + (1 - ((epoch - 1) / 10 + random.random() / 6))
    return acc, loss


def main():
    run = wandb.init()

    # note that we define values from `wandb.config`
    # instead of defining hard values
    # ハードコードされた値を定義する代わりに、`wandb.config` から値を定義することに注意してください
    lr = wandb.config.lr
    bs = wandb.config.batch_size
    epochs = wandb.config.epochs

    for epoch in np.arange(1, epochs):
        train_acc, train_loss = train_one_epoch(epoch, lr, bs)
        val_acc, val_loss = evaluate_one_epoch(epoch)

        wandb.log(
            {
                "epoch": epoch,
                "train_acc": train_acc,
                "train_loss": train_loss,
                "val_acc": val_acc,
                "val_loss": val_loss,
            }
        )


# Start sweep job.
# sweep ジョブを開始します。
wandb.agent(sweep_id, function=main, count=4)

W&B Sweep を作成するには、まず YAML configuration ファイルを作成します。configuration ファイルには、sweep で探索するハイパーパラメータが含まれています。以下の例では、バッチサイズ (batch_size)、エポック数 (epochs)、および学習率 (lr) のハイパーパラメータは、各 sweep 中に変化します。

# config.yaml
program: train.py
method: random
name: sweep
metric:
  goal: maximize
  name: val_acc
parameters:
  batch_size: 
    values: [16,32,64]
  lr:
    min: 0.0001
    max: 0.1
  epochs:
    values: [5, 10, 15]

W&B Sweep configuration の作成方法の詳細については、sweep configuration の定義を参照してください。

YAML ファイルの program キーに Python スクリプトの名前を指定する必要があることに注意してください。

次に、次のコード例を追加します。

Wieghts & Biases Python SDK (wandb) と PyYAML (yaml) をインポートします。PyYAML は、YAML configuration ファイルを読み込むために使用されます。
configuration ファイルを読み込みます。
wandb.init() API を使用して、W&B Run としてデータを同期およびログ記録するバックグラウンドプロセスを生成します。config オブジェクトを config パラメータに渡します。
ハードコードされた値を使用する代わりに、wandb.config からハイパーパラメータ値を定義します。
最適化するメトリクスを wandb.log でログに記録します。configuration で定義されたメトリクスをログに記録する必要があります。configuration 辞書 (この例では sweep_configuration) 内で、val_acc 値を最大化するように sweep を定義しました。

import wandb
import yaml
import random
import numpy as np


def train_one_epoch(epoch, lr, bs):
    acc = 0.25 + ((epoch / 30) + (random.random() / 10))
    loss = 0.2 + (1 - ((epoch - 1) / 10 + random.random() / 5))
    return acc, loss


def evaluate_one_epoch(epoch):
    acc = 0.1 + ((epoch / 20) + (random.random() / 10))
    loss = 0.25 + (1 - ((epoch - 1) / 10 + random.random() / 6))
    return acc, loss


def main():
    # Set up your default hyperparameters
    # デフォルトのハイパーパラメータを設定する
    with open("./config.yaml") as file:
        config = yaml.load(file, Loader=yaml.FullLoader)

    run = wandb.init(config=config)

    # Note that we define values from `wandb.config`
    # instead of  defining hard values
    # ハードコードされた値を定義する代わりに、`wandb.config` から値を定義することに注意してください
    lr = wandb.config.lr
    bs = wandb.config.batch_size
    epochs = wandb.config.epochs

    for epoch in np.arange(1, epochs):
        train_acc, train_loss = train_one_epoch(epoch, lr, bs)
        val_acc, val_loss = evaluate_one_epoch(epoch)

        wandb.log(
            {
                "epoch": epoch,
                "train_acc": train_acc,
                "train_loss": train_loss,
                "val_acc": val_acc,
                "val_loss": val_loss,
            }
        )


# Call the main function.
# main 関数を呼び出します。
main()

CLI に移動します。CLI 内で、sweep agent が試行する run の最大数を設定します。この手順はオプションです。次の例では、最大数を 5 に設定します。

NUM=5

次に、wandb sweep コマンドで sweep を初期化します。YAML ファイルの名前を指定します。オプションで、project フラグ (--project) の Project の名前を指定します。

wandb sweep --project sweep-demo-cli config.yaml

これにより、sweep ID が返されます。sweep の初期化方法の詳細については、sweep の初期化を参照してください。

sweep ID をコピーし、次のコードスニペットの sweepID を置き換えて、wandb agent コマンドで sweep ジョブを開始します。

wandb agent --count $NUM your-entity/sweep-demo-cli/sweepID

sweep ジョブの開始方法の詳細については、sweep ジョブの開始を参照してください。

メトリクスをログに記録する際の考慮事項

sweep configuration で指定したメトリクスを明示的に W&B にログに記録してください。サブディレクトリー内で sweep のメトリクスをログに記録しないでください。

たとえば、次の疑似コードを考えてみましょう。ユーザーは検証損失 ("val_loss": loss) をログに記録したいと考えています。最初に、値を辞書に渡します。ただし、wandb.log に渡される辞書は、辞書内のキーと値のペアに明示的にアクセスしません。

# Import the W&B Python Library and log into W&B
# W&B Python ライブラリをインポートし、W&B にログインします
import wandb
import random

def train():
    offset = random.random() / 5
    acc = 1 - 2**-epoch - random.random() / epoch - offset
    loss = 2**-epoch + random.random() / epoch + offset

    val_metrics = {"val_loss": loss, "val_acc": acc}
    return val_metrics


def main():
    wandb.init(entity="<entity>", project="my-first-sweep")
    val_metrics = train()
    # Incorrect. You must explicitly access the
    # key-value pair in the dictionary
    # 間違いです。 辞書 のキーと値のペアに明示的にアクセスする必要があります
    # 正しいメトリクス の記録方法については、次のコードブロックを参照してください
    wandb.log({"val_loss": val_metrics})


sweep_configuration = {
    "method": "random",
    "metric": {"goal": "minimize", "name": "val_loss"},
    "parameters": {
        "x": {"max": 0.1, "min": 0.01},
        "y": {"values": [1, 3, 7]},
    },
}

sweep_id = wandb.sweep(sweep=sweep_configuration, project="my-first-sweep")

wandb.agent(sweep_id, function=main, count=10)

代わりに、Python 辞書内のキーと値のペアに明示的にアクセスします。たとえば、次のコードは、辞書を wandb.log メソッドに渡すときに、キーと値のペアを指定します。

# Import the W&B Python Library and log into W&B
# W&B Python ライブラリをインポートし、W&B にログインします
import wandb
import random


def train():
    offset = random.random() / 5
    acc = 1 - 2**-epoch - random.random() / epoch - offset
    loss = 2**-epoch + random.random() / epoch + offset

    val_metrics = {"val_loss": loss, "val_acc": acc}
    return val_metrics


def main():
    wandb.init(entity="<entity>", project="my-first-sweep")
    val_metrics = train()
    wandb.log({"val_loss", val_metrics["val_loss"]})


sweep_configuration = {
    "method": "random",
    "metric": {"goal": "minimize", "name": "val_loss"},
    "parameters": {
        "x": {"max": 0.1, "min": 0.01},
        "y": {"values": [1, 3, 7]},
    },
}

sweep_id = wandb.sweep(sweep=sweep_configuration, project="my-first-sweep")

wandb.agent(sweep_id, function=main, count=10)

2.3 - Define a sweep configuration

sweep の設定ファイルを作成する方法について説明します。

W&B Sweep は、ハイパーパラメーターの値を探索する戦略と、それらを評価するコードを組み合わせたものです。この戦略は、すべてのオプションを試すという単純なものから、ベイズ最適化やHyperband (BOHB) のように複雑なものまであります。

Python 辞書または YAML ファイルで sweep configuration を定義します。sweep configuration の定義方法は、sweep の管理方法によって異なります。

sweep を初期化し、コマンドラインから sweep agent を開始する場合は、YAML ファイルで sweep configuration を定義します。Python スクリプトまたは Jupyter notebook 内で sweep を初期化して完全に開始する場合は、Python 辞書で sweep を定義します。

以下のガイドでは、sweep configuration のフォーマット方法について説明します。トップレベルの sweep configuration キーの包括的なリストについては、Sweep configuration options を参照してください。

基本構造

両方の sweep configuration フォーマットオプション (YAML と Python 辞書) は、キーと値のペアとネストされた構造を利用します。

sweep configuration 内のトップレベルキーを使用して、sweep の名前 (name キー)、検索するパラメータ (parameters キー)、パラメータ空間を検索する方法 (method キー) など、sweep 検索の特性を定義します。

たとえば、次のコードスニペットは、YAML ファイル内と Python 辞書内で定義された同じ sweep configuration を示しています。sweep configuration 内には、program、name、method、metric、および parameters という 5 つのトップレベルキーが指定されています。

コマンドライン (CLI) からインタラクティブに Sweeps を管理する場合は、YAML ファイルで sweep configuration を定義します。

program: train.py
name: sweepdemo
method: bayes
metric:
  goal: minimize
  name: validation_loss
parameters:
  learning_rate:
    min: 0.0001
    max: 0.1
  batch_size:
    values: [16, 32, 64]
  epochs:
    values: [5, 10, 15]
  optimizer:
    values: ["adam", "sgd"]

Python スクリプトまたは Jupyter notebook でトレーニングアルゴリズムを定義する場合は、Python 辞書データ構造で sweep を定義します。

次のコードスニペットは、sweep_configuration という変数に sweep configuration を格納します。

sweep_configuration = {
    "name": "sweepdemo",
    "method": "bayes",
    "metric": {"goal": "minimize", "name": "validation_loss"},
    "parameters": {
        "learning_rate": {"min": 0.0001, "max": 0.1},
        "batch_size": {"values": [16, 32, 64]},
        "epochs": {"values": [5, 10, 15]},
        "optimizer": {"values": ["adam", "sgd"]},
    },
}

トップレベルの parameters キー内には、learning_rate、batch_size、epoch、および optimizer というキーがネストされています。指定するネストされたキーごとに、1 つまたは複数の値、分布、確率などを指定できます。詳細については、Sweep configuration options の parameters セクションを参照してください。

二重にネストされたパラメータ

sweep configuration は、ネストされたパラメータをサポートしています。ネストされたパラメータを区切るには、トップレベルのパラメータ名の下に追加の parameters キーを使用します。sweep config は、複数レベルのネスティングをサポートしています。

ベイズまたはランダムなハイパーパラメータ検索を使用する場合は、確率分布をランダム変数に指定します。各ハイパーパラメータについて:

sweep config にトップレベルの parameters キーを作成します。
parameters キー内に、以下をネストします。
1. 最適化するハイパーパラメータの名前を指定します。
2. distribution キーに使用する分布を指定します。ハイパーパラメータ名の下に distribution キーと値のペアをネストします。
3. 探索する 1 つまたは複数の値を指定します。値 (または値 ) は、分布キーとインラインである必要があります。
  1. (オプション) トップレベルのパラメータ名の下に追加の parameters キーを使用して、ネストされたパラメータを区切ります。

sweep configuration で定義されたネストされたパラメータは、W&B run configuration で指定されたキーを上書きします。

たとえば、train.py Python スクリプトで次の設定で W&B run を初期化するとします (1 ～ 2 行を参照)。次に、sweep_configuration という辞書で sweep configuration を定義します (4 ～ 13 行を参照)。次に、sweep config 辞書を wandb.sweep に渡して、sweep config を初期化します (16 行を参照)。

def main():
    run = wandb.init(config={"nested_param": {"manual_key": 1}})


sweep_configuration = {
    "top_level_param": 0,
    "nested_param": {
        "learning_rate": 0.01,
        "double_nested_param": {"x": 0.9, "y": 0.8},
    },
}

# Sweep を config に渡して初期化します。
sweep_id = wandb.sweep(sweep=sweep_configuration, project="<project>")

# Sweep ジョブを開始します。
wandb.agent(sweep_id, function=main, count=4)

W&B run の初期化時に渡される nested_param.manual_key にはアクセスできません。run.config は、sweep configuration 辞書で定義されているキーと値のペアのみを保持します。

Sweep configuration テンプレート

次のテンプレートは、パラメータを構成し、検索制約を指定する方法を示しています。<> で囲まれた hyperparameter_name をハイパーパラメータの名前に置き換え、値を置き換えます。

program: <insert>
method: <insert>
parameter:
  hyperparameter_name0:
    value: 0  
  hyperparameter_name1: 
    values: [0, 0, 0]
  hyperparameter_name: 
    distribution: <insert>
    value: <insert>
  hyperparameter_name2:  
    distribution: <insert>
    min: <insert>
    max: <insert>
    q: <insert>
  hyperparameter_name3: 
    distribution: <insert>
    values:
      - <list_of_values>
      - <list_of_values>
      - <list_of_values>
early_terminate:
  type: hyperband
  s: 0
  eta: 0
  max_iter: 0
command:
- ${Command macro}
- ${Command macro}
- ${Command macro}
- ${Command macro}

Sweep configuration の例

program: train.py
method: random
metric:
  goal: minimize
  name: loss
parameters:
  batch_size:
    distribution: q_log_uniform_values
    max: 256 
    min: 32
    q: 8
  dropout: 
    values: [0.3, 0.4, 0.5]
  epochs:
    value: 1
  fc_layer_size: 
    values: [128, 256, 512]
  learning_rate:
    distribution: uniform
    max: 0.1
    min: 0
  optimizer:
    values: ["adam", "sgd"]

sweep_config = {
    "method": "random",
    "metric": {"goal": "minimize", "name": "loss"},
    "parameters": {
        "batch_size": {
            "distribution": "q_log_uniform_values",
            "max": 256,
            "min": 32,
            "q": 8,
        },
        "dropout": {"values": [0.3, 0.4, 0.5]},
        "epochs": {"value": 1},
        "fc_layer_size": {"values": [128, 256, 512]},
        "learning_rate": {"distribution": "uniform", "max": 0.1, "min": 0},
        "optimizer": {"values": ["adam", "sgd"]},
    },
}

Bayes hyperband の例

program: train.py
method: bayes
metric:
  goal: minimize
  name: val_loss
parameters:
  dropout:
    values: [0.15, 0.2, 0.25, 0.3, 0.4]
  hidden_layer_size:
    values: [96, 128, 148]
  layer_1_size:
    values: [10, 12, 14, 16, 18, 20]
  layer_2_size:
    values: [24, 28, 32, 36, 40, 44]
  learn_rate:
    values: [0.001, 0.01, 0.003]
  decay:
    values: [1e-5, 1e-6, 1e-7]
  momentum:
    values: [0.8, 0.9, 0.95]
  epochs:
    value: 27
early_terminate:
  type: hyperband
  s: 2
  eta: 3
  max_iter: 27

次のタブは、early_terminate の最小または最大イテレーション数を指定する方法を示しています。

この例のブラケットは [3, 3*eta, 3*eta*eta, 3*eta*eta*eta] で、これは [3, 9, 27, 81] と同じです。

early_terminate:
  type: hyperband
  min_iter: 3

この例のブラケットは [27/eta, 27/eta/eta] で、これは [9, 3] と同じです。

early_terminate:
  type: hyperband
  max_iter: 27
  s: 2

コマンドの例

program: main.py
metric:
  name: val_loss
  goal: minimize

method: bayes
parameters:
  optimizer.config.learning_rate:
    min: !!float 1e-5
    max: 0.1
  experiment:
    values: [expt001, expt002]
  optimizer:
    values: [sgd, adagrad, adam]

command:
- ${env}
- ${interpreter}
- ${program}
- ${args_no_hyphens}

/usr/bin/env python train.py --param1=value1 --param2=value2

python train.py --param1=value1 --param2=value2

次のタブは、一般的なコマンドマクロを指定する方法を示しています。

{$interpreter} マクロを削除し、python インタープリターをハードコードするために値を明示的に指定します。たとえば、次のコードスニペットは、これを行う方法を示しています。

command:
  - ${env}
  - python3
  - ${program}
  - ${args}

以下は、sweep configuration パラメータで指定されていない追加のコマンドライン引数を追加する方法を示しています。

command:
  - ${env}
  - ${interpreter}
  - ${program}
  - "--config"
  - "your-training-config.json"
  - ${args}

プログラムが引数解析を使用していない場合は、引数をすべて渡すことを避け、wandb.init が sweep パラメータを wandb.config に自動的に取り込むことを利用できます。

command:
  - ${env}
  - ${interpreter}
  - ${program}

Hydra などのツールが期待する方法で引数を渡すようにコマンドを変更できます。詳細については、Hydra with W&B を参照してください。

command:
  - ${env}
  - ${interpreter}
  - ${program}
  - ${args_no_hyphens}

2.3.1 - Sweep configuration options

sweep configurationは、ネストされたキーと値のペアで構成されています。sweep configuration内のトップレベルキーを使用して、検索するパラメータ（parameter キー）、パラメータ空間を検索する方法（method キー）など、sweep検索の品質を定義します。

以下の表は、トップレベルのsweep configurationキーと簡単な説明を示しています。各キーの詳細については、それぞれのセクションを参照してください。

トップレベルキー	説明
`program`	（必須）実行するトレーニングスクリプト
`entity`	このsweepのエンティティ
`project`	このsweepのプロジェクト
`description`	sweepのテキストによる説明
`name`	sweepの名前。W&B UIに表示されます。
`method`	（必須）検索戦略
`metric`	最適化するメトリック（特定の検索戦略と停止基準でのみ使用されます）
`parameters`	（必須）検索するパラメータ範囲
`early_terminate`	早期停止基準
`command`	トレーニングスクリプトを呼び出し、引数を渡すためのコマンド構造
`run_cap`	このsweepのrunの最大数

sweep configurationの構造化方法の詳細については、Sweep configurationの構造を参照してください。

`metric`

metric トップレベルのsweep configurationキーを使用して、最適化する名前、目標、およびターゲットメトリックを指定します。

キー	説明
`name`	最適化するメトリックの名前。
`goal`	`minimize` または `maximize`（デフォルトは `minimize`）。
`target`	最適化しているメトリックの目標値。指定した目標値にrunが到達した場合、sweepは新しいrunを作成しません。（runがターゲットに到達すると）runを実行しているアクティブなエージェントは、エージェントが新しいrunの作成を停止するまでrunの完了を待ちます。

`parameters`

YAMLファイルまたはPythonスクリプトで、parametersをトップレベルキーとして指定します。parametersキーの中で、最適化するハイパーパラメータの名前を指定します。一般的なハイパーパラメータには、学習率、バッチサイズ、エポック、オプティマイザーなどがあります。sweep configurationで定義するハイパーパラメータごとに、1つまたは複数の検索制約を指定します。

次の表は、サポートされているハイパーパラメータ検索制約を示しています。ハイパーパラメータとユースケースに基づいて、以下の検索制約のいずれかを使用して、sweep agentに検索場所（分布の場合）または検索または使用するもの（value、valuesなど）を指示します。

検索制約	説明
`values`	このハイパーパラメータの有効な値をすべて指定します。`grid`と互換性があります。
`value`	このハイパーパラメータの単一の有効な値を指定します。`grid`と互換性があります。
`distribution`	確率分布を指定します。デフォルト値については、この表の後の注記を参照してください。
`probabilities`	`random`を使用する場合に、`values`の各要素を選択する確率を指定します。
`min`、`max`	（`int`または `float`）最大値と最小値。`int`の場合、`int_uniform`分散ハイパーパラメータ用。`float`の場合、`uniform`分散ハイパーパラメータ用。
`mu`	（`float`）`normal` - または `lognormal` - 分散ハイパーパラメータの平均パラメータ。
`sigma`	（`float`）`normal` - または `lognormal` - 分散ハイパーパラメータの標準偏差パラメータ。
`q`	（`float`）量子化されたハイパーパラメータの量子化ステップサイズ。
`parameters`	ルートレベルのパラメータ内に他のパラメータをネストします。

分布が指定されていない場合、W&Bは次の条件に基づいて次の分布を設定します。

valuesを指定した場合はcategorical
maxとminを整数として指定した場合はint_uniform
maxとminをfloatとして指定した場合はuniform
valueにセットを提供した場合はconstant

`method`

methodキーでハイパーパラメータ検索戦略を指定します。選択できるハイパーパラメータ検索戦略は、グリッド、ランダム、ベイズ探索の3つです。

グリッド検索

ハイパーパラメータ値のすべての組み合わせを反復処理します。グリッド検索は、各反復で使用するハイパーパラメータ値のセットについて、情報に基づかない決定を行います。グリッド検索は、計算コストが高くなる可能性があります。

グリッド検索は、連続検索空間内で検索している場合、永久に実行されます。

ランダム検索

分布に基づいて、各反復でランダムで情報に基づかないハイパーパラメータ値のセットを選択します。コマンドライン、Pythonスクリプト内、またはW&B App UIからプロセスを停止しない限り、ランダム検索は永久に実行されます。

ランダム（method: random）検索を選択した場合は、メトリックキーで分布空間を指定します。

ベイズ探索

ランダムおよびグリッド検索とは対照的に、ベイズモデルは情報に基づいた決定を行います。ベイズ最適化は、確率モデルを使用して、目的関数を評価する前に代用関数で値をテストする反復プロセスを通じて、使用する値を決定します。ベイズ探索は、連続パラメータの数が少ない場合にはうまく機能しますが、スケールは劣ります。ベイズ探索の詳細については、ベイズ最適化入門論文を参照してください。

ベイズ探索は、コマンドライン、Pythonスクリプト内、またはW&B App UIからプロセスを停止しない限り、永久に実行されます。

ランダムおよびベイズ探索の分布オプション

parameterキー内で、ハイパーパラメータの名前をネストします。次に、distributionキーを指定し、値の分布を指定します。

次の表は、W&Bがサポートする分布を示しています。

`distribution`キーの値	説明
`constant`	定数分布。使用する定数（`value`）を指定する必要があります。
`categorical`	カテゴリ分布。このハイパーパラメータの有効な値（`values`）をすべて指定する必要があります。
`int_uniform`	整数に対する離散一様分布。`max`と`min`を整数として指定する必要があります。
`uniform`	連続一様分布。`max`と`min`をfloatとして指定する必要があります。
`q_uniform`	量子化された一様分布。`round(X / q) * q`を返します。ここで、Xは一様です。`q`のデフォルトは`1`です。
`log_uniform`	対数一様分布。`exp(min)`と`exp(max)`の間の値`X`を返します。自然対数は`min`と`max`の間で均等に分布します。
`log_uniform_values`	対数一様分布。`min`と`max`の間の値`X`を返します。`log(`X`)`は`log(min)`と`log(max)`の間で均等に分布します。
`q_log_uniform`	量子化された対数一様分布。`round(X / q) * q`を返します。ここで、`X`は`log_uniform`です。`q`のデフォルトは`1`です。
`q_log_uniform_values`	量子化された対数一様分布。`round(X / q) * q`を返します。ここで、`X`は`log_uniform_values`です。`q`のデフォルトは`1`です。
`inv_log_uniform`	逆対数一様分布。`X`を返します。ここで、`log(1/X)`は`min`と`max`の間で均等に分布します。
`inv_log_uniform_values`	逆対数一様分布。`X`を返します。ここで、`log(1/X)`は`log(1/max)`と`log(1/min)`の間で均等に分布します。
`normal`	正規分布。平均`mu`（デフォルト`0`）および標準偏差`sigma`（デフォルト`1`）で正規分布した値を返します。
`q_normal`	量子化された正規分布。`round(X / q) * q`を返します。ここで、`X`は`normal`です。Qのデフォルトは1です。
`log_normal`	対数正規分布。自然対数`log(X)`が平均`mu`（デフォルト`0`）および標準偏差`sigma`（デフォルト`1`）で正規分布するように、値`X`を返します。
`q_log_normal`	量子化された対数正規分布。`round(X / q) * q`を返します。ここで、`X`は`log_normal`です。`q`のデフォルトは`1`です。

`early_terminate`

パフォーマンスの低いrunを停止するには、早期終了（early_terminate）を使用します。早期終了が発生した場合、W&Bは新しいハイパーパラメータ値のセットで新しいrunを作成する前に、現在のrunを停止します。

early_terminateを使用する場合は、停止アルゴリズムを指定する必要があります。sweep configuration内のearly_terminate内にtypeキーをネストします。

停止アルゴリズム

現在、W&BはHyperband停止アルゴリズムをサポートしています。

Hyperbandハイパーパラメータ最適化は、プログラムを停止するか、事前設定された1つ以上の反復回数（ブラケットと呼ばれる）で続行するかを評価します。

W&Bのrunがブラケットに到達すると、sweepはそのrunのメトリックを以前に報告されたすべてのメトリック値と比較します。runのメトリック値が高すぎる場合（目標が最小化の場合）、またはrunのメトリックが低すぎる場合（目標が最大化の場合）、sweepはrunを終了します。

ブラケットは、ログに記録された反復回数に基づいています。ブラケットの数は、最適化するメトリックをログに記録する回数に対応します。反復は、ステップ、エポック、またはその間の何かに対応できます。ステップカウンターの数値は、ブラケットの計算には使用されません。

ブラケットスケジュールを作成するには、min_iterまたはmax_iterのいずれかを指定します。

キー	説明
`min_iter`	最初のブラケットの反復を指定します
`max_iter`	最大反復回数を指定します。
`s`	ブラケットの総数を指定します（`max_iter`に必要）。
`eta`	ブラケット乗数スケジュールを指定します（デフォルト：`3`）。
`strict`	元のHyperband論文に厳密に従って、runをより積極的にプルーニングする「strict」モードを有効にします。デフォルトはfalseです。

Hyperbandは、数分ごとに終了するW&B runを確認します。runまたは反復が短い場合、終了runのタイムスタンプは、指定されたブラケットと異なる場合があります。

`command`

commandキー内のネストされた値を使用して、形式と内容を変更します。ファイル名などの固定コンポーネントを直接含めることができます。

Unixシステムでは、/usr/bin/envは、OSが環境に基づいて正しいPythonインタープリターを選択するようにします。

W&Bは、コマンドの可変コンポーネントに対して次のマクロをサポートしています。

コマンドマクロ	説明
`${env}`	Unixシステムでは`/usr/bin/env`、Windowsでは省略。
`${interpreter}`	`python`に展開されます。
`${program}`	sweep configurationの`program`キーで指定されたトレーニングスクリプトのファイル名。
`${args}`	`--param1=value1 --param2=value2`の形式のハイパーパラメータとその値。
`${args_no_boolean_flags}`	`--param1=value1`の形式のハイパーパラメータとその値。ただし、ブールパラメータは`True`の場合は`--boolean_flag_param`の形式になり、`False`の場合は省略されます。
`${args_no_hyphens}`	`param1=value1 param2=value2`の形式のハイパーパラメータとその値。
`${args_json}`	JSONとしてエンコードされたハイパーパラメータとその値。
`${args_json_file}`	JSONとしてエンコードされたハイパーパラメータとその値を含むファイルへのパス。
`${envvar}`	環境変数を渡す方法。`${envvar:MYENVVAR}` はMYENVVAR環境変数の値に展開されます。

2.4 - Initialize a sweep

W&B Sweep の初期化

W&B は、クラウド（標準）、ローカル（ローカル）の 1 台以上のマシンで Sweeps を管理するために、 Sweep Controller を使用します。run が完了すると、sweep controller は、実行する新しい run を記述した新しい一連の指示を発行します。これらの指示は、実際に run を実行する エージェント によって取得されます。典型的な W&B Sweep では、コントローラは W&B サーバー上に存在します。エージェントは あなたの マシン上に存在します。

以下のコードスニペットは、CLI および Jupyter Notebook または Python スクリプト内で Sweeps を初期化する方法を示しています。

sweep を初期化する前に、sweep configuration が YAML ファイルまたはスクリプト内のネストされた Python 辞書 object で定義されていることを確認してください。詳細については、sweep configuration の定義を参照してください。
W&B Sweep と W&B Run は、同じ project 内にある必要があります。したがって、W&B を初期化するときに指定する名前 (wandb.init) は、W&B Sweep を初期化するときに指定する project の名前 (wandb.sweep) と一致する必要があります。

W&B SDK を使用して sweep を初期化します。sweep configuration 辞書を sweep パラメータに渡します。オプションで、W&B Run の出力を保存する project パラメータ（project）の project 名を指定します。project が指定されていない場合、run は「未分類」の project に配置されます。

import wandb

# sweep configuration の例
sweep_configuration = {
    "method": "random",
    "name": "sweep",
    "metric": {"goal": "maximize", "name": "val_acc"},
    "parameters": {
        "batch_size": {"values": [16, 32, 64]},
        "epochs": {"values": [5, 10, 15]},
        "lr": {"max": 0.1, "min": 0.0001},
    },
}

sweep_id = wandb.sweep(sweep=sweep_configuration, project="project-name")

wandb.sweep 関数は、sweep ID を返します。sweep ID には、Entity 名と project 名が含まれます。sweep ID をメモしておいてください。

W&B CLI を使用して sweep を初期化します。configuration ファイルの名前を指定します。オプションで、project フラグの project 名を指定します。project が指定されていない場合、W&B Run は「未分類」の project に配置されます。

wandb sweep コマンドを使用して、sweep を初期化します。次のコード例では、sweeps_demo project の sweep を初期化し、configuration に config.yaml ファイルを使用します。

wandb sweep --project sweeps_demo config.yaml

このコマンドは、sweep ID を出力します。sweep ID には、Entity 名と project 名が含まれます。sweep ID をメモしておいてください。

2.5 - Start or stop a sweep agent

複数のマシン上で W&B Sweep エージェントを開始または停止します。

複数のマシン上の 1 つまたは複数のエージェントで W&B Sweep を開始します。W&B Sweep エージェントは、ハイパーパラメータのために W&B Sweep ( wandb sweep) を初期化したときに起動した W&B サーバーにクエリを実行し、それらを使用してモデルトレーニングを実行します。

W&B Sweep エージェントを開始するには、W&B Sweep を初期化したときに返された W&B Sweep ID を指定します。W&B Sweep ID の形式は次のとおりです。

entity/project/sweep_ID

以下に詳細を示します。

entity: W&B のユーザー名または Team 名。
project: W&B Run の出力を保存する Project の名前。Project が指定されていない場合、run は「未分類」Project に配置されます。
sweep_ID: W&B によって生成された、疑似ランダムな一意の ID。

Jupyter Notebook または Python スクリプト内で W&B Sweep エージェントを開始する場合、W&B Sweep が実行する関数の名前を指定します。

以下のコードスニペットは、W&B でエージェントを開始する方法を示しています。設定ファイルが既にあって、W&B Sweep を初期化済みであることを前提としています。設定ファイルを定義する方法の詳細については、Sweep 設定の定義を参照してください。

wandb agent コマンドを使用して sweep を開始します。sweep を初期化したときに返された sweep ID を指定します。以下のコードスニペットをコピーして貼り付け、sweep_id を sweep ID に置き換えます。

wandb agent sweep_id

W&B Python SDK ライブラリを使用して sweep を開始します。sweep を初期化したときに返された sweep ID を指定します。さらに、sweep が実行する関数の名前を指定します。

wandb.agent(sweep_id=sweep_id, function=function_name)

W&B エージェントの停止

ランダム探索とベイズ探索は永久に実行されます。コマンドライン、python スクリプト内、または Sweeps UI からプロセスを停止する必要があります。

オプションで、W&B Run の数を Sweep エージェントが試行する回数を指定します。次のコードスニペットは、CLI および Jupyter Notebook、Python スクリプト内で W&B Runs の最大数を設定する方法を示しています。

まず、sweep を初期化します。詳細については、Sweeps の初期化を参照してください。

sweep_id = wandb.sweep(sweep_config)

次に、sweep ジョブを開始します。sweep の開始から生成された sweep ID を指定します。試行する run の最大数を設定するには、count パラメータに整数値を渡します。

sweep_id, count = "dtzl1o7u", 10
wandb.agent(sweep_id, count=count)

sweep agent の完了後、同じスクリプトまたは Notebook 内で新しい run を開始する場合は、新しい run を開始する前に wandb.teardown() を呼び出す必要があります。

まず、wandb sweep コマンドで sweep を初期化します。詳細については、Sweeps の初期化を参照してください。

wandb sweep config.yaml

試行する run の最大数を設定するには、count フラグに整数値を渡します。

NUM=10
SWEEPID="dtzl1o7u"
wandb agent --count $NUM $SWEEPID

2.6 - Parallelize agents

マルチコアまたはマルチ GPU マシンで W&B Sweep エージェントを並列化します。

マルチコアまたはマルチ GPU マシンで W&B Sweep エージェントを並列化します。開始する前に、W&B Sweep を初期化していることを確認してください。W&B Sweep の初期化方法の詳細については、Sweeps の初期化を参照してください。

マルチ CPU マシンでの並列化

ユースケースに応じて、次のタブで CLI を使用するか、Jupyter Notebook 内で W&B Sweep エージェントを並列化する方法を検討してください。

wandb agent コマンドを使用して、ターミナルで複数の CPU に W&B Sweep エージェントを並列化します。sweep を初期化したときに返された sweep ID を指定します。

ローカルマシンで複数のターミナルウィンドウを開きます。
次のコードスニペットをコピーして貼り付け、sweep_id を sweep ID に置き換えます。

wandb agent sweep_id

W&B Python SDK ライブラリを使用して、Jupyter Notebook 内で複数の CPU に W&B Sweep エージェントを並列化します。sweep を初期化したときに返された sweep ID があることを確認してください。さらに、sweep が function パラメータに対して実行する関数の名前を指定します。

複数の Jupyter Notebook を開きます。
複数の Jupyter Notebook に W&B Sweep ID をコピーして貼り付け、W&B Sweep を並列化します。たとえば、sweep ID が sweep_id という変数に格納され、関数の名前が function_name の場合、次のコードスニペットを複数の Jupyter Notebook に貼り付けて、sweep を並列化できます。

wandb.agent(sweep_id=sweep_id, function=function_name)

マルチ GPU マシンでの並列化

次の手順に従って、CUDA Toolkit を使用してターミナルで複数の GPU に W&B Sweep エージェントを並列化します。

ローカルマシンで複数のターミナルウィンドウを開きます。
W&B Sweep ジョブ (wandb agent) を開始するときに、CUDA_VISIBLE_DEVICES で使用する GPU インスタンスを指定します。CUDA_VISIBLE_DEVICES に、使用する GPU インスタンスに対応する整数値を割り当てます。

たとえば、ローカルマシンに 2 つの NVIDIA GPU があるとします。ターミナルウィンドウを開き、CUDA_VISIBLE_DEVICES を 0 (CUDA_VISIBLE_DEVICES=0) に設定します。次の例の sweep_ID を、W&B Sweep を初期化したときに返される W&B Sweep ID に置き換えます。

ターミナル 1

CUDA_VISIBLE_DEVICES=0 wandb agent sweep_ID

2 番目のターミナルウィンドウを開きます。CUDA_VISIBLE_DEVICES を 1 (CUDA_VISIBLE_DEVICES=1) に設定します。上記のコードスニペットで説明されている sweep_ID に同じ W&B Sweep ID を貼り付けます。

ターミナル 2

CUDA_VISIBLE_DEVICES=1 wandb agent sweep_ID

2.7 - Visualize sweep results

W&B App UIでW&B Sweepsの結果を可視化します。

W&B App UI で W&B Sweeps の結果を可視化します。https://wandb.ai/home にある W&B App UI に移動します。W&B Sweep を初期化する際に指定した project を選択します。project の workspace にリダイレクトされます。左側のパネルにある Sweep icon (ほうきのアイコン) を選択します。Sweep UI で、リストから Sweep の名前を選択します。

デフォルトでは、W&B は W&B Sweep ジョブを開始すると、自動的にパラレル座標図、パラメータのインポータンスプロット、および散布図を作成します。

Sweep UI インターフェースに移動し、自動生成されたプロットを表示する方法を示すアニメーション。

パラレル座標図は、多数のハイパーパラメータとモデルのメトリクスの関係を一目でまとめたものです。パラレル座標図の詳細については、パラレル座標を参照してください。

散布図 (左) は、Sweep 中に生成された W&B Runs を比較します。散布図の詳細については、散布図を参照してください。

パラメータのインポータンスプロット (右) は、メトリクスの望ましい値の最良の予測因子であり、メトリクスの望ましい値と高度に相関するハイパーパラメータをリストします。パラメータのインポータンスプロットの詳細については、パラメータの重要性を参照してください。

自動的に使用される従属値と独立値 (x 軸と y 軸) を変更できます。各 panel 内には、Edit panel という鉛筆アイコンがあります。Edit panel を選択します。モデルが表示されます。モーダル内で、グラフの振る舞いを変更できます。

すべてのデフォルトの W&B 可視化オプションの詳細については、Panels を参照してください。W&B Sweep の一部ではない W&B Runs からプロットを作成する方法については、Data Visualization のドキュメントを参照してください。

2.8 - Manage sweeps with the CLI

CLI を使用して、W&B Sweep を一時停止、再開、およびキャンセルします。

CLI で W&B Sweep を一時停止、再開、キャンセルします。W&B Sweep を一時停止すると、Sweep が再開されるまで新しい W&B Run を実行しないように W&B エージェントに指示します。Sweep を再開すると、新しい W&B Run の実行を続行するようにエージェントに指示します。W&B Sweep を停止すると、新しい W&B Run の作成または実行を停止するように W&B Sweep エージェントに指示します。W&B Sweep をキャンセルすると、現在実行中の W&B Run を強制終了し、新しい Run の実行を停止するように Sweep エージェントに指示します。

いずれの場合も、W&B Sweep を初期化したときに生成された W&B Sweep ID を指定してください。必要に応じて、新しいターミナルウィンドウを開いて、次のコマンドを実行します。W&B Sweep が現在のターミナルウィンドウに出力ステートメントを出力している場合は、新しいターミナルウィンドウを開くとコマンドを実行しやすくなります。

次のガイダンスに従って、sweep を一時停止、再開、およびキャンセルします。

Sweep の一時停止

新しい W&B Run の実行を一時的に停止するように W&B Sweep を一時停止します。W&B Sweep を一時停止するには、wandb sweep --pause コマンドを使用します。一時停止する W&B Sweep ID を指定します。

wandb sweep --pause entity/project/sweep_ID

Sweep の再開

wandb sweep --resume コマンドを使用して、一時停止した W&B Sweep を再開します。再開する W&B Sweep ID を指定します。

wandb sweep --resume entity/project/sweep_ID

Sweep の停止

新しい W&B Run の実行を停止し、現在実行中の Run を終了させるには、W&B sweep を完了させます。

wandb sweep --stop entity/project/sweep_ID

Sweep のキャンセル

実行中のすべての run を強制終了し、新しい run の実行を停止するには、sweep をキャンセルします。W&B Sweep をキャンセルするには、wandb sweep --cancel コマンドを使用します。キャンセルする W&B Sweep ID を指定します。

wandb sweep --cancel entity/project/sweep_ID

CLI コマンドオプションの完全なリストについては、wandb sweep CLI リファレンスガイドを参照してください。

複数のエージェントにまたがる sweep の一時停止、再開、停止、およびキャンセル

単一のターミナルから複数のエージェントにまたがって W&B Sweep を一時停止、再開、停止、またはキャンセルします。たとえば、マルチコアマシンがあるとします。W&B Sweep を初期化した後、新しいターミナルウィンドウを開き、各新しいターミナルに Sweep ID をコピーします。

任意のターミナル内から、wandb sweep CLI コマンドを使用して、W&B Sweep を一時停止、再開、停止、またはキャンセルします。たとえば、次のコードスニペットは、CLI を使用して複数のエージェントにまたがる W&B Sweep を一時停止する方法を示しています。

wandb sweep --pause entity/project/sweep_ID

エージェント全体で Sweep を再開するには、Sweep ID と共に --resume フラグを指定します。

wandb sweep --resume entity/project/sweep_ID

W&B エージェントを並列化する方法の詳細については、エージェントの並列化を参照してください。

2.9 - Learn more about sweeps

Sweeps に役立つ情報源を集めました。

学術論文

Li, Lisha, 他. “Hyperband: A novel bandit-based approach to hyperparameter optimization.” The Journal of Machine Learning Research 18.1 (2017): 6765-6816.

Sweep Experiments

以下の W&B Reports は、W&B Sweeps を使用したハイパーパラメーター最適化を調査する Projects の例を示しています。

Drought Watch Benchmark Progress
- 説明: ベースラインを開発し、Drought Watch ベンチマークへのサブミッションを検証します。
Tuning Safety Penalties in Reinforcement Learning
- 説明: パターン作成、パターン除去、ナビゲーションの 3 つの異なるタスクにおいて、異なる副作用ペナルティで学習させたエージェントを検証します。
Meaning and Noise in Hyperparameter Search with W&B Stacey Svetlichnaya
- 説明: シグナルとパレイドリア（想像上のパターン）をどのように区別しますか？この記事では、W&B で何ができるかを紹介し、さらなる探求を促すことを目的としています。
Who is Them? Text Disambiguation with Transformers
- 説明: 自然言語理解のためのモデルを調査するために Hugging Face を使用します
DeepChem: Molecular Solubility
- 説明: ランダムフォレストと深層ネットを使用して、分子構造から化学的特性を予測します。
Intro to MLOps: Hyperparameter Tuning
- 説明: ハイパーパラメーター最適化が重要な理由を探り、機械学習モデルのハイパーパラメーターのチューニングを自動化するための 3 つのアルゴリズムを見てみましょう。

selfm-anaged

次のハウツーガイドでは、W&B を使用して実際の問題を解決する方法を示します。

Sweeps with XGBoost
- 説明: XGBoost を使用したハイパーパラメーターチューニングに W&B Sweeps を使用する方法。

Sweep GitHub リポジトリ

W&B はオープンソースを提唱し、コミュニティからの貢献を歓迎します。GitHub リポジトリは https://github.com/wandb/sweeps にあります。W&B オープンソースリポジトリへの貢献方法については、W&B GitHub のContribution guidelinesを参照してください。

2.10 - Manage algorithms locally

W&B クラウドでホストされているサービスを使用する代わりに、ローカルでアルゴリズムを検索して停止します。

ハイパーパラメータコントローラは、デフォルトで Weights & Biased によってクラウドサービスとしてホストされています。W&B エージェントはコントローラと通信して、トレーニングに使用するパラメータの次のセットを決定します。コントローラは、どの run を停止できるかを判断するために、早期停止アルゴリズムを実行する役割も担っています。

ローカルコントローラの機能を使用すると、ユーザーはローカルで検索および停止アルゴリズムを開始できます。ローカルコントローラを使用すると、ユーザーはコードを検査および調査して、問題をデバッグしたり、クラウドサービスに組み込むことができる新機能を開発したりできます。

この機能は、 Sweeps ツール用の新しいアルゴリズムのより迅速な開発とデバッグをサポートするために提供されています。実際のハイパーパラメータ最適化のワークロードを目的としたものではありません。

始める前に、W&B SDK（wandb）をインストールする必要があります。コマンドラインに次のコードスニペットを入力します。

pip install wandb sweeps

以下の例では、設定ファイルとトレーニングループが Python スクリプトまたは Jupyter Notebook で定義されていることを前提としています。設定ファイルを定義する方法の詳細については、sweep configuration の定義を参照してください。

コマンドラインからローカルコントローラを実行する

通常、Weights & Biased がクラウドサービスとしてホストするハイパーパラメータコントローラを使用する場合と同様に、sweep を初期化します。コントローラフラグ（controller）を指定して、W&B sweep ジョブにローカルコントローラを使用することを示します。

wandb sweep --controller config.yaml

または、sweep の初期化とローカルコントローラを使用することの指定を2つのステップに分けることもできます。

ステップを分けるには、まず、次のキーと値を sweep の YAML 設定ファイルに追加します。

controller:
  type: local

次に、sweep を初期化します。

wandb sweep config.yaml

sweep を初期化したら、wandb controllerでコントローラを起動します。

# wandb sweep コマンドは sweep_id を出力します
wandb controller {user}/{entity}/{sweep_id}

ローカルコントローラを使用するように指定したら、1つ以上の Sweep agent を起動して sweep を実行します。通常と同じように W&B Sweep を開始します。詳細については、Sweep agent の開始を参照してください。

wandb sweep sweep_ID

W&B Python SDK でローカルコントローラを実行する

次のコードスニペットは、W&B Python SDK でローカルコントローラを指定および使用する方法を示しています。

Python SDK でコントローラを使用する最も簡単な方法は、sweep ID をwandb.controllerメソッドに渡すことです。次に、return オブジェクトの run メソッドを使用して、sweep ジョブを開始します。

sweep = wandb.controller(sweep_id)
sweep.run()

コントローラーループをより細かく制御したい場合：

import wandb

sweep = wandb.controller(sweep_id)
while not sweep.done():
    sweep.print_status()
    sweep.step()
    time.sleep(5)

または、提供されるパラメータをさらに制御することもできます。

import wandb

sweep = wandb.controller(sweep_id)
while not sweep.done():
    params = sweep.search()
    sweep.schedule(params)
    sweep.print_status()

コードで sweep を完全に指定する場合は、次のようにします。

import wandb

sweep = wandb.controller()
sweep.configure_search("grid")
sweep.configure_program("train-dummy.py")
sweep.configure_controller(type="local")
sweep.configure_parameter("param1", value=3)
sweep.create()
sweep.run()

2.11 - Sweeps troubleshooting

W&B Sweep でよくある問題をトラブルシューティングします。

提案されたガイダンスに従って、一般的なエラーメッセージのトラブルシューティングを行います。

`CommError, Run does not exist` および `ERROR Error uploading`

これらの 2 つのエラーメッセージが両方とも返された場合、W&B の Run ID が定義されている可能性があります。例として、Jupyter Notebook または Python スクリプトのどこかに、次のようなコードスニペットが定義されている可能性があります。

wandb.init(id="some-string")

W&B は W&B Sweeps によって作成された Runs に対して、ランダムでユニークな ID を自動的に生成するため、W&B Sweeps の Run ID を設定することはできません。

W&B の Run ID は、1 つの project 内でユニークである必要があります。

W&B を初期化する際に、テーブルやグラフに表示されるカスタム名を付けたい場合は、name パラメータに名前を渡すことをお勧めします。例：

wandb.init(name="a helpful readable run name")

`Cuda out of memory`

このエラーメッセージが表示された場合は、コードをリファクタリングして、プロセスベースの実行を使用するようにします。より具体的には、コードを Python スクリプトに書き換えます。さらに、W&B Python SDK ではなく、CLI から W&B Sweep Agent を呼び出します。

例として、コードを train.py という Python スクリプトに書き換えたとします。トレーニングスクリプトの名前 (train.py) を YAML Sweep configuration ファイル (config.yaml（この例）) に追加します。

program: train.py
method: bayes
metric:
  name: validation_loss
  goal: maximize
parameters:
  learning_rate:
    min: 0.0001
    max: 0.1
  optimizer:
    values: ["adam", "sgd"]

次に、次のコードを train.py Python スクリプトに追加します。

if _name_ == "_main_":
    train()

CLI に移動し、wandb sweep で W&B Sweep を初期化します。

wandb sweep config.yaml

返された W&B Sweep ID をメモします。次に、Python SDK (wandb.agent) ではなく、CLI で wandb agent を使用して Sweep ジョブを開始します。次のコードスニペットの sweep_ID を、前の手順で返された Sweep ID に置き換えます。

wandb agent sweep_ID

`anaconda 400 error`

次のエラーは通常、最適化しているメトリックをログに記録しない場合に発生します。

wandb: ERROR Error while calling W&B API: anaconda 400 error: 
{"code": 400, "message": "TypeError: bad operand type for unary -: 'NoneType'"}

YAML ファイルまたはネストされた辞書の中で、最適化する「metric」という名前のキーを指定します。このメトリックを必ずログに記録 (wandb.log) してください。さらに、Python スクリプトまたは Jupyter Notebook 内で Sweep を最適化するために定義した 正確な メトリック名を使用してください。設定ファイルの詳細については、Sweep configuration の定義を参照してください。

2.12 - Sweeps UI

Sweeps UI のさまざまなコンポーネントについて説明します。

State （ステート）、作成時間（Created）、sweep を開始した Entity （Creator）、完了した run の数（Run count）、sweep の計算にかかった時間（Compute time）は、Sweeps UI に表示されます。sweep が作成すると予想される run の数（Est. Runs）は、離散的な検索空間でグリッド検索を行う場合に提供されます。また、sweep をクリックして、インターフェースから sweep を一時停止、再開、停止、または強制終了することもできます。

2.13 - Tutorial: Create sweep job from project

既存の W&B プロジェクトから sweep ジョブを作成する方法のチュートリアル。

このチュートリアルでは、既存の W&B のプロジェクトから sweep job を作成する方法について説明します。ここでは、Fashion MNIST データセットを使用して、PyTorch の畳み込みニューラルネットワークに画像の分類方法を学習させます。必要なコードとデータセットは、W&B のリポジトリにあります。https://github.com/wandb/examples/tree/master/examples/pytorch/pytorch-cnn-fashion

この W&B ダッシュボードで結果を確認してください。

1. プロジェクトを作成する

まず、ベースラインを作成します。W&B examples GitHub リポジトリから PyTorch MNIST データセットのサンプルモデルをダウンロードします。次に、モデルをトレーニングします。トレーニングスクリプトは、examples/pytorch/pytorch-cnn-fashion ディレクトリー内にあります。

このリポジトリをクローンします git clone https://github.com/wandb/examples.git
このサンプルを開きます cd examples/pytorch/pytorch-cnn-fashion
run を手動で実行します python train.py

オプションで、W&B App UI ダッシュボードに表示される例を確認してください。

プロジェクトページの例を見る →

2. sweep を作成する

プロジェクトページから、サイドバーの Sweep tab を開き、Create Sweep を選択します。

自動生成された設定は、完了した run に基づいて sweep する値を推測します。試したいハイパーパラメーターの範囲を指定するには、設定を編集します。sweep を起動すると、ホストされている W&B sweep server で新しいプロセスが開始されます。この集中型サービスは、トレーニング job を実行しているマシンであるエージェントを調整します。

3. エージェントを起動する

次に、ローカルでエージェントを起動します。作業を分散して sweep job をより迅速に完了したい場合は、最大 20 個のエージェントを異なるマシンで並行して起動できます。エージェントは、次に試すパラメータのセットを出力します。

これで sweep が実行されました。次の図は、サンプル sweep job の実行中にダッシュボードがどのように表示されるかを示しています。プロジェクトページの例を見る →

既存の run で新しい sweep をシードする

以前にログに記録した既存の run を使用して、新しい sweep を起動します。

プロジェクトテーブルを開きます。
テーブルの左側にあるチェックボックスで、使用する run を選択します。
ドロップダウンをクリックして、新しい sweep を作成します。

これで、sweep がサーバー上にセットアップされます。run の実行を開始するには、1 つ以上のエージェントを起動するだけです。

新しい sweep をベイジアン sweep として開始すると、選択した run によってガウス過程もシードされます。

3 - Tables

データセットを反復処理し、モデルの予測を理解する

Try in Colab Try in W&B

W&B Tables を使用して、テーブル形式のデータを可視化およびクエリします。例:

同じテストセットで異なるモデルがどのように機能するかを比較する
データ内のパターンを特定する
サンプルモデルの予測を視覚的に確認する
一般的に誤分類された例を見つけるためにクエリする

上の画像は、セマンティックセグメンテーションとカスタムメトリクスを含むテーブルを示しています。このテーブルは、W&B ML コースのサンプル project でご覧ください。

仕組み

Table は、各カラムが単一のデータ型を持つデータの二次元グリッドです。Tables は、プリミティブ型と数値型、およびネストされたリスト、辞書、リッチメディア型をサポートしています。

Table をログする

数行のコードで Table をログします。

wandb.init(): run を作成して、結果を追跡します。
wandb.Table(): 新しい table オブジェクトを作成します。
- columns: カラム名を設定します。
- data: テーブルの内容を設定します。
run.log(): テーブルをログして、W&B に保存します。

import wandb

run = wandb.init(project="table-test")
my_table = wandb.Table(columns=["a", "b"], data=[["a1", "b1"], ["a2", "b2"]])
run.log({"Table Name": my_table})

開始方法

クイックスタート: データテーブルのログ、データの可視化、およびデータのクエリを学習します。
Tables Gallery: Tables のユースケースの例をご覧ください。

3.1 - Tutorial: Log tables, visualize and query data

W&B Tables の使い方を5分間のクイックスタートで見てみましょう。

次のクイックスタートでは、データテーブルのログ記録、データの可視化、およびデータのクエリ方法について説明します。

下のボタンを選択して、MNIST データに関する PyTorch のクイックスタートのサンプルプロジェクトを試してください。

1. テーブルのログを記録する

W&B でテーブルのログを記録します。新しいテーブルを構築するか、Pandas Dataframe を渡すことができます。

新しいテーブルを構築してログに記録するには、以下を使用します。

wandb.init(): run を作成して、結果を追跡します。
wandb.Table(): 新しいテーブルオブジェクトを作成します。
- columns: 列名を設定します。
- data: 各行の内容を設定します。
run.log(): テーブルをログに記録して、W&B に保存します。

例を次に示します。

import wandb

run = wandb.init(project="table-test")
# Create and log a new table.
my_table = wandb.Table(columns=["a", "b"], data=[["a1", "b1"], ["a2", "b2"]])
run.log({"Table Name": my_table})

Pandas Dataframe を wandb.Table() に渡して、新しいテーブルを作成します。

import wandb
import pandas as pd

df = pd.read_csv("my_data.csv")

run = wandb.init(project="df-table")
my_table = wandb.Table(dataframe=df)
wandb.log({"Table Name": my_table})

サポートされているデータ型の詳細については、W&B API リファレンスガイドの wandb.Table を参照してください。

2. プロジェクトワークスペースでテーブルを可視化する

ワークスペースで結果のテーブルを表示します。

W&B アプリでプロジェクトに移動します。
プロジェクトワークスペースで run の名前を選択します。一意のテーブルのキーごとに新しいパネルが追加されます。

この例では、my_table はキー Table Name でログに記録されます。

3. モデルのバージョン間で比較する

複数の W&B の Runs からサンプルテーブルをログに記録し、プロジェクトワークスペースで結果を比較します。このサンプルワークスペースでは、同じテーブル内の複数の異なるバージョンから行を結合する方法を示します。

テーブルフィルター、ソート、およびグループ化機能を使用して、モデルの結果を探索および評価します。

3.2 - Visualize and analyze tables

W&B Tables を可視化、分析します。

W&B Tables をカスタマイズして、機械学習モデルの性能に関する質問に答えたり、データを分析したりできます。

インタラクティブにデータを探索して、以下を実現します。

モデル、エポック、個々のサンプル間で、変更を正確に比較する
データにおけるより高レベルのパターンを理解する
可視化サンプルでインサイトを捉え、伝達する

W&B Tables は、次の振る舞いをします。

Artifacts コンテキストではステートレス: Artifacts バージョンとともに記録されたテーブルは、ブラウザウィンドウを閉じるとデフォルト状態にリセットされます。
Workspace または Report コンテキストではステートフル: 単一 run の Workspace 、複数 run の Project Workspace 、または Report でテーブルに加えた変更は保持されます。

現在の W&B Table ビューを保存する方法については、ビューを保存を参照してください。

2つのテーブルを表示する方法

マージされたビューまたは並べて表示するビューで2つのテーブルを比較します。例えば、下の図はMNIST データのテーブル比較を示しています。

次の手順に従って、 2つのテーブルを比較します。

W&B App で Project に移動します。
左側のパネルで Artifacts アイコンを選択します。
Artifacts バージョンを選択します。

次の図では、 5 エポック (インタラクティブな例はこちら) の後、 MNIST 検証データに対するモデルの予測を示します。

サイドバーで比較する2番目の Artifacts バージョンにマウスを合わせ、表示されたら [比較] をクリックします。例えば、下の図では、トレーニングの5 エポック後に同じモデルによって行われたMNIST の予測と比較するために、「v4」というラベルのバージョンを選択します。

1 エポック (ここに表示) 対 5 エポック (v4) のトレーニング後にモデルの予測を比較する準備

マージされたビュー

最初は、両方のテーブルがマージされて表示されます。最初に選択されたテーブルのインデックスは0で青色で強調表示され、 2番目のテーブルのインデックスは1で黄色で強調表示されます。マージされたテーブルのライブ例はこちらをご覧ください。

マージされたビューからは、以下が可能です。

結合キーを選択する: 左上のドロップダウンを使用して、 2つのテーブルの結合キーとして使用する列を設定します。通常、これはデータセット内の特定の例のファイル名や、生成されたサンプルのインクリメントインデックスなど、各行の一意の識別子です。現在、 任意の 列を選択できますが、判読できないテーブルやクエリの速度低下が発生する可能性があることに注意してください。
結合する代わりに連結する: このドロップダウンで [すべてのテーブルを連結する] を選択すると、列全体を結合する代わりに、両方のテーブルから すべての行を結合 して、より大きなテーブルにすることができます。
各テーブルを明示的に参照する: フィルター式で0、 1、 * を使用して、 1つまたは両方のテーブルインスタンスの列を明示的に指定します。
詳細な数値の差をヒストグラムとして可視化する: 任意のセルの値を一目で比較できます。

並べて表示するビュー

2つのテーブルを並べて表示するには、最初のドロップダウンを [テーブルをマージ: テーブル] から [リスト: テーブル] に変更し、それぞれ [ページサイズ] を更新します。ここで、最初に選択したテーブルは左側にあり、 2番目のテーブルは右側にあります。また、 [垂直] チェックボックスをクリックして、これらのテーブルを垂直方向に比較することもできます。

テーブルを一目で比較する: 任意の操作 (ソート、フィルタリング、グループ化) を両方のテーブルにまとめて適用し、変更や違いをすばやく見つけます。例えば、推測でグループ化された不正な予測、全体で最も難しいネガティブ、真のラベルごとの信頼度スコア分布などを表示します。
2つのテーブルを個別に探索する: スクロールして、目的の側面/行に焦点を当てます。

Artifacts を比較する

時間の経過とともにテーブルを比較したり、モデルバリアントを比較したりすることもできます。

時間の経過とともにテーブルを比較する

トレーニングの意味のあるステップごとに Artifacts にテーブルを記録して、トレーニング時間中のモデルの性能を分析します。例えば、すべての検証ステップの終了時、トレーニングの50 エポックごと、またはパイプラインに適した頻度でテーブルを記録できます。並べて表示するビューを使用して、モデル予測の変化を可視化します。

ラベルごとに、モデルは1 (L) よりも5 (R) トレーニングエポック後に間違いが少なくなります

トレーニング時間中の予測の可視化に関するより詳細なウォークスルーについては、この Report およびこのインタラクティブなノートブックの例を参照してください。

モデルバリアント全体でテーブルを比較する

2つの異なるモデルに対して同じステップで記録された2つの Artifacts バージョンを比較して、異なる設定 (ハイパーパラメーター、ベースアーキテクチャーなど) 全体でモデルの性能を分析します。

例えば、 baseline と新しいモデルバリアントである 2x_layers_2x_lr の間で予測を比較します。この場合、最初の畳み込みレイヤーは32から64に、 2番目のレイヤーは128から256に、学習率は0.001から0.002に倍増します。このライブ例から、並べて表示するビューを使用して、 1 (左側のタブ) 対 5 トレーニングエポック (右側のタブ) 後の不正な予測に絞り込みます。

1 エポック後、性能は混合しています: 精度は一部のクラスでは向上し、他のクラスでは悪化します。

ビューを保存

run Workspace 、 Project Workspace 、または Report で操作するテーブルは、ビューの状態を自動的に保存します。テーブル操作を適用してブラウザを閉じると、次にテーブルに移動したときに、テーブルには最後に表示された設定が保持されます。

Artifacts コンテキストで操作するテーブルはステートレスのままです。

特定の状態で Workspace からテーブルを保存するには、 W&B Report にエクスポートします。テーブルを Report にエクスポートするには、次の手順を実行します。

Workspace 可視化パネルの右上隅にあるケバブアイコン (3つの垂直ドット) を選択します。
[パネルを共有] または [レポートに追加] を選択します。

[パネルを共有] を選択すると新しい Report が作成され、 [レポートに追加] を選択すると既存の Report に追加できます。

例

これらの Reports は、 W&B Tables のさまざまなユースケースを示しています。

3.3 - Example tables

W&B テーブルの例

次のセクションでは、テーブルを使用できる方法のいくつかを紹介します。

データの表示

モデルトレーニングまたは評価中に、メトリクスとリッチメディアをログに記録し、クラウドまたはホスティングインスタンスに同期された永続的なデータベースで結果を可視化します。

たとえば、写真データセットのバランスの取れた分割を示すこのテーブルを確認してください。

データをインタラクティブに探索する

テーブルの表示、並べ替え、フィルタリング、グループ化、結合、およびクエリを実行して、データとモデルのパフォーマンスを理解します。静的なファイルを参照したり、分析スクリプトを再実行したりする必要はありません。

たとえば、スタイルが転送されたオーディオに関するこのレポートを参照してください。

モデルのバージョンを比較する

さまざまなトレーニングエポック、データセット、ハイパーパラメーターの選択、モデルアーキテクチャーなどで、結果をすばやく比較します。

たとえば、同じテスト画像で 2 つのモデルを比較するこのテーブルを参照してください。

すべての詳細を追跡し、全体像を把握する

特定のステップで特定の予測を可視化するためにズームインします。集計統計を表示し、エラーのパターンを特定し、改善の機会を理解するためにズームアウトします。このツールは、単一のモデルトレーニングのステップを比較したり、異なるモデルバージョン間で結果を比較したりするために使用できます。

たとえば、MNIST データセットで 1 回、次に 5 回のエポック後の結果を分析するこのサンプルテーブルを参照してください。

W&B Tables を使用したプロジェクト例

以下は、W&B Tables を使用する実際の W&B のProjectsのハイライトです。

画像分類

このレポートを読むか、この colab に従うか、artifacts コンテキストを調べて、CNN が iNaturalist の写真から 10 種類の生物（植物、鳥、昆虫など）を識別する方法を確認してください。

オーディオ

音色転送に関するこのレポートでオーディオテーブルを操作します。録音されたクジラの歌と、バイオリンやトランペットなどの楽器で同じメロディーをシンセサイズした演奏を比較できます。この colab を使用して、独自の曲を録音し、W&B でシンセサイズされたバージョンを探索することもできます。

テキスト

トレーニングデータまたは生成された出力からテキストサンプルを参照し、関連フィールドで動的にグループ化し、モデルのバリアントまたは実験設定全体で評価を調整します。テキストを Markdown としてレンダリングするか、ビジュアル差分モードを使用してテキストを比較します。このレポートで、シェイクスピアを生成するための単純な文字ベースの RNN を探索してください。

ビデオ

トレーニング中にログに記録されたビデオを参照および集計して、モデルを理解します。副作用を最小限に抑えることを目指す RL エージェント向けの SafeLife ベンチマークを使用した初期の例を次に示します。

表形式データ

バージョン管理と重複排除を使用して表形式データを分割および事前処理する方法に関するレポートを表示します。

Tables と Artifacts は連携して、データセットのイテレーションをバージョン管理、ラベル付け、および重複排除します

モデルバリアントの比較（セマンティックセグメンテーション）

セマンティックセグメンテーション用の Tables のログを記録し、異なるモデルを比較するインタラクティブノートブックとライブ例。この Table で独自のクエリを試してください。

トレーニング時間に対する改善の分析

時間経過に伴う予測の可視化と、それに付随するインタラクティブノートブックに関する詳細なレポート。

3.4 - Export table data

テーブルからデータをエクスポートする方法。

すべての W&B Artifacts と同様に、Tables は pandas のデータフレームに変換して、簡単にデータのエクスポートができます。

`table` を `artifact` に変換する

まず、テーブルを artifact に変換する必要があります。これを行うには、artifact.get(table, "table_name") を使用するのが最も簡単です。

# 新しいテーブルを作成してログに記録します。
with wandb.init() as r:
    artifact = wandb.Artifact("my_dataset", type="dataset")
    table = wandb.Table(
        columns=["a", "b", "c"], data=[(i, i * 2, 2**i) for i in range(10)]
    )
    artifact.add(table, "my_table")
    wandb.log_artifact(artifact)

# 作成した artifact を使用して、作成したテーブルを取得します。
with wandb.init() as r:
    artifact = r.use_artifact("my_dataset:latest")
    table = artifact.get("my_table")

`artifact` を Dataframe に変換する

次に、テーブルをデータフレームに変換します。

# 前のコード例から続けて:
df = table.get_dataframe()

データのエクスポート

これで、データフレームがサポートする任意の方法を使用してエクスポートできます。

# テーブルデータを .csv に変換する
df.to_csv("example.csv", encoding="utf-8")

次のステップ

artifacts のリファレンスドキュメントを確認してください。
Tables Walktrough ガイドをご覧ください。
Dataframe のリファレンスドキュメントを確認してください。

4 - W&B App UI Reference

4.1 - Panels

ワークスペースパネルの可視化を使用して、ログに記録されたデータをキーごとに探索し、ハイパーパラメータと出力メトリクスの関係を可視化することができます。

ワークスペースのモード

W&B のプロジェクトは、2つの異なるワークスペースモードをサポートしています。ワークスペース名の横にあるアイコンは、そのモードを示しています。

アイコン	ワークスペースモード
	自動ワークスペースは、プロジェクトでログされたすべてのキーに対してパネルを自動的に生成します。自動ワークスペースを選択する: プロジェクトの利用可能なすべてのデータを可視化して、すぐに開始したい場合。ログに記録するキーの数が少ない小規模なプロジェクトの場合。より広範な分析を行う場合。自動ワークスペースからパネルを削除した場合、クイック追加を使用して再作成できます。
	手動ワークスペースは、空白の状態から始まり、ユーザーが意図的に追加したパネルのみを表示します。手動ワークスペースを選択する: プロジェクトでログされたキーの一部のみを重視する場合。より集中的な分析を行う場合。ワークスペースのパフォーマンスを向上させ、あまり役に立たないパネルの読み込みを回避する場合。クイック追加を使用して、手動ワークスペースとそのセクションに役立つ可視化をすばやく簡単に追加できます。

アイコン

ワークスペースモード

自動ワークスペース は、プロジェクトでログされたすべてのキーに対してパネルを自動的に生成します。自動ワークスペースを選択する:

プロジェクトの利用可能なすべてのデータを可視化して、すぐに開始したい場合。
ログに記録するキーの数が少ない小規模なプロジェクトの場合。
より広範な分析を行う場合。

自動ワークスペースからパネルを削除した場合、クイック追加を使用して再作成できます。

手動ワークスペース は、空白の状態から始まり、ユーザーが意図的に追加したパネルのみを表示します。手動ワークスペースを選択する:

プロジェクトでログされたキーの一部のみを重視する場合。
より集中的な分析を行う場合。
ワークスペースのパフォーマンスを向上させ、あまり役に立たないパネルの読み込みを回避する場合。

クイック追加を使用して、手動ワークスペースとそのセクションに役立つ可視化をすばやく簡単に追加できます。

ワークスペースでのパネルの生成方法を変更するには、ワークスペースをリセットします。

ワークスペースへの変更を元に戻す

ワークスペースへの変更を元に戻すには、[元に戻す] ボタン (左を指す矢印) をクリックするか、CMD + Z (macOS) または CTRL + Z (Windows / Linux) を入力します。

ワークスペースのリセット

ワークスペースをリセットするには:

ワークスペースの上部にあるアクションメニュー ... をクリックします。
ワークスペースをリセット をクリックします。

ワークスペースのレイアウトを設定

ワークスペースのレイアウトを設定するには、ワークスペースの上部にある Settings をクリックし、次に Workspace layout をクリックします。

検索中に空のセクションを非表示にする (デフォルトでオン)
パネルをアルファベット順に並べ替える (デフォルトでオフ)
セクション構成 (デフォルトでは最初のプレフィックスでグループ化)。この設定を変更するには:
1. 南京錠アイコンをクリックします。
2. セクション内のパネルをグループ化する方法を選択します。

ワークスペースの折れ線プロットのデフォルトを設定するには、折れ線プロットを参照してください。

セクションのレイアウトを設定する

セクションのレイアウトを設定するには、歯車アイコンをクリックし、次に Display preferences をクリックします。

ツールチップで色付きの run 名をオンまたはオフにする (デフォルトでオン)
コンパニオンチャートのツールチップにハイライトされた run のみを表示する (デフォルトでオフ)
ツールチップに表示される run の数 (単一の run 、すべての run 、または Default)
プライマリチャートのツールチップに完全な run 名を表示する (デフォルトでオフ)

パネルをフルスクリーンモードで表示する

フルスクリーンモードでは、 run セレクターが表示され、パネルは、通常 1000 バケットではなく、10,000 バケットの高精度サンプリングモードプロットを使用します。

パネルをフルスクリーンモードで表示するには:

パネルの上にマウスを置きます。
パネルのアクションメニュー ... をクリックし、次にファインダーまたは正方形の4つの角を示すアウトラインのようなフルスクリーンボタンをクリックします。
フルスクリーンモードで表示中にパネルを共有すると、表示されるリンクは自動的にフルスクリーンモードで開きます。

フルスクリーンモードからパネルのワークスペースに戻るには、ページの上部にある左向きの矢印をクリックします。

パネルの追加

このセクションでは、ワークスペースにパネルを追加するさまざまな方法を示します。

パネルを手動で追加する

グローバルまたはセクションレベルで、ワークスペースにパネルを1つずつ追加します。

パネルをグローバルに追加するには、パネル検索フィールドの近くにあるコントロールバーの Add panels をクリックします。
代わりにパネルをセクションに直接追加するには、セクションのアクション ... メニューをクリックし、次に + Add panels をクリックします。
チャートなど、追加するパネルのタイプを選択します。パネルの設定詳細が表示され、デフォルトが選択されています。
必要に応じて、パネルとその表示設定をカスタマイズします。設定オプションは、選択するパネルのタイプによって異なります。各タイプのパネルのオプションの詳細については、以下の関連セクション (たとえば、折れ線プロットまたは棒グラフ) を参照してください。
Apply をクリックします。

パネルをクイック追加する

Quick add を使用して、選択したキーごとにパネルをグローバルまたはセクションレベルで自動的に追加します。

削除されたパネルがない自動ワークスペースの場合、ワークスペースにはすでにログされたすべてのキーのパネルが含まれているため、Quick add オプションは表示されません。 Quick add を使用して、削除したパネルを再度追加できます。

Quick add を使用してパネルをグローバルに追加するには、パネル検索フィールドの近くにあるコントロールバーの Add panels をクリックし、次に Quick add をクリックします。
Quick add を使用してパネルをセクションに直接追加するには、セクションのアクション ... メニューをクリックし、Add panels をクリックして、次に Quick add をクリックします。
パネルのリストが表示されます。チェックマークが付いている各パネルは、すでにワークスペースに含まれています。
- 利用可能なすべてのパネルを追加するには、リストの上部にある Add panels ボタンをクリックします。 Quick Add リストが閉じ、新しいパネルがワークスペースに表示されます。
- リストから個々のパネルを追加するには、パネルの行の上にマウスを置き、次に Add をクリックします。追加するパネルごとにこの手順を繰り返し、右上にある X をクリックして Quick Add リストを閉じます。新しいパネルがワークスペースに表示されます。
必要に応じて、パネルの設定をカスタマイズします。

パネルの共有

このセクションでは、リンクを使用してパネルを共有する方法を示します。

リンクを使用してパネルを共有するには、次のいずれかを実行します。

パネルをフルスクリーンモードで表示しているときに、ブラウザから URL をコピーします。
アクションメニュー ... をクリックし、Copy panel URL を選択します。

リンクをユーザーまたはチームと共有します。ユーザーがリンクにアクセスすると、パネルがフルスクリーンモードで開きます。

フルスクリーンモードからパネルのワークスペースに戻るには、ページの上部にある左向きの矢印をクリックします。

プログラムでパネルのフルスクリーンリンクを作成する

オートメーションの作成など、特定の状況では、パネルのフルスクリーン URL を含めると便利な場合があります。このセクションでは、パネルのフルスクリーン URL の形式を示します。以下の例では、エンティティ、プロジェクト、パネル、およびセクション名を角かっこで囲んで置き換えます。

https://wandb.ai/<ENTITY_NAME>/<PROJECT_NAME>?panelDisplayName=<PANEL_NAME>&panelSectionName=<SECTON_NAME>

同じセクション内の複数のパネルが同じ名前を持つ場合、この URL はその名前の最初のパネルを開きます。

ソーシャルメディアでパネルを埋め込むか共有する

Webサイトにパネルを埋め込んだり、ソーシャルメディアで共有したりするには、リンクを知っている人なら誰でもパネルを表示できる必要があります。プロジェクトがプライベートの場合、プロジェクトのメンバーのみパネルを表示できます。プロジェクトがパブリックの場合、リンクを知っている人なら誰でもパネルを表示できます。

ソーシャルメディアでパネルを埋め込んだり共有したりするためのコードを取得するには:

ワークスペースから、パネルの上にマウスを置き、次にアクションメニュー ... をクリックします。
Share タブをクリックします。
Only those who are invited have access を Anyone with the link can view に変更します。そうしないと、次の手順の選択肢は使用できません。
Share on Twitter 、 Share on Reddit 、 Share on LinkedIn 、または Copy embed link を選択します。

パネルレポートをメールで送信する

スタンドアロンレポートとして単一のパネルをメールで送信するには:

パネルの上にマウスを置き、次にパネルのアクションメニュー ... をクリックします。
Share panel in report をクリックします。
Invite タブを選択します。
メールアドレスまたはユーザー名を入力します。
必要に応じて、can view を can edit に変更します。
Invite をクリックします。 W&B は、共有しているパネルのみを含むレポートへのクリック可能なリンクを記載したメールをユーザーに送信します。

パネルを共有する場合とは異なり、受信者はこのレポートからワークスペースにアクセスできません。

パネルの管理

パネルの編集

パネルを編集するには:

鉛筆アイコンをクリックします。
パネルの設定を変更します。
パネルを別のタイプに変更するには、タイプを選択してから設定を設定します。
Apply をクリックします。

パネルの移動

パネルを別のセクションに移動するには、パネルのドラッグハンドルを使用できます。代わりに、リストから新しいセクションを選択するには:

必要に応じて、最後のセクションの後に Add section をクリックして、新しいセクションを作成します。
パネルのアクション ... メニューをクリックします。
Move をクリックし、次に新しいセクションを選択します。

ドラッグハンドルを使用して、セクション内のパネルを再配置することもできます。

パネルの複製

パネルを複製するには:

パネルの上部にあるアクション ... メニューをクリックします。
Duplicate をクリックします。

必要に応じて、複製されたパネルをカスタマイズまたは移動できます。

パネルの削除

パネルを削除するには:

パネルの上にマウスを置きます。
アクション ... メニューを選択します。
Delete をクリックします。

手動ワークスペースからすべてのパネルを削除するには、アクション ... メニューをクリックし、次に Clear all panels をクリックします。

自動または手動ワークスペースからすべてのパネルを削除するには、ワークスペースをリセットできます。デフォルトのパネルセットで開始するには Automatic を選択し、パネルのない空のワークスペースで開始するには Manual を選択します。

セクションの管理

デフォルトでは、ワークスペースのセクションには、キーのログ階層が反映されます。ただし、手動ワークスペースでは、セクションはパネルの追加を開始した後にのみ表示されます。

セクションの追加

セクションを追加するには、最後のセクションの後に Add section をクリックします。

既存のセクションの前または後に新しいセクションを追加するには、代わりにセクションのアクション ... メニューをクリックし、次に New section below または New section above をクリックします。

セクションのパネルの管理

多数のパネルを含むセクションは、Standard grid レイアウトを使用している場合、デフォルトでページ分割されます。ページ上のパネルのデフォルトの数は、パネルの設定とセクション内のパネルのサイズによって異なります。

セクションで使用されているレイアウトを確認するには、セクションのアクション ... メニューをクリックします。セクションのレイアウトを変更するには、Layout grid セクションで Standard grid または Custom grid を選択します。
パネルのサイズを変更するには、パネルの上にマウスを置き、ドラッグハンドルをクリックしてドラッグし、パネルのサイズを調整します。

セクションで Standard grid が使用されている場合、1つのパネルのサイズを変更すると、セクション内のすべてのパネルのサイズが変更されます。
セクションで Custom grid が使用されている場合、各パネルのサイズを個別にカスタマイズできます。

セクションがページ分割されている場合は、ページに表示するパネルの数をカスタマイズできます。
セクションの上部にある 1 to of をクリックします。ここで、<X> は表示されているパネルの数、<Y> はパネルの合計数です。
ページごとに表示するパネルの数 (最大100) を選択します。
多数のパネルがある場合にすべてのパネルを表示するには、Custom grid レイアウトを使用するようにパネルを設定します。セクションのアクション ... メニューをクリックし、次に Layout grid セクションで Custom grid を選択します
セクションからパネルを削除するには:
パネルの上にマウスを置き、次にアクション ... メニューをクリックします。
Delete をクリックします。

ワークスペースを自動ワークスペースにリセットすると、削除されたすべてのパネルが再び表示されます。

セクションの名前を変更する

セクションの名前を変更するには、アクション ... メニューをクリックし、次に Rename section をクリックします。

セクションの削除

セクションを削除するには、... メニューをクリックし、次に Delete section をクリックします。これにより、セクションとそのパネルが削除されます。

4.1.1 - Line plots

メトリクスを可視化し、軸をカスタマイズして、プロット上の複数の線を比較します。

折れ線グラフは、wandb.log() で時間の経過とともにメトリクスをプロットすると、デフォルトで表示されます。チャートの設定をカスタマイズして、同じプロット上に複数の線を比較したり、カスタム軸を計算したり、ラベルの名前を変更したりできます。

折れ線グラフの設定を編集する

このセクションでは、個々の折れ線グラフパネル、セクション内のすべての折れ線グラフパネル、またはワークスペース内のすべての折れ線グラフパネルの設定を編集する方法について説明します。

カスタムの X 軸を使用する場合は、Y 軸のログに使用するのと同じ wandb.log() の呼び出しでログに記録されていることを確認してください。

個々の折れ線グラフ

折れ線グラフの個々の設定は、セクションまたはワークスペースの折れ線グラフの設定よりも優先されます。折れ線グラフをカスタマイズするには:

マウスをパネルの上に置き、歯車アイコンをクリックします。
表示されるモーダル内で、タブを選択して設定を編集します。
適用をクリックします。

折れ線グラフの設定

折れ線グラフでは、次の設定を構成できます。

日付: プロットのデータの表示に関する詳細を構成します。

X: X 軸に使用する値を選択します (デフォルトは ステップ)。X 軸を 相対時間 に変更するか、W&B でログに記録した値に基づいてカスタム軸を選択できます。
- 相対時間 (Wall) は、プロセスが開始してからのクロック時間です。したがって、run を開始して 1 日後に再開し、何かをログに記録した場合、24 時間後にプロットされます。
- 相対時間 (プロセス) は、実行中のプロセス内の時間です。したがって、run を開始して 10 秒間実行し、1 日後に再開した場合、そのポイントは 10 秒でプロットされます。
- Wall Time は、グラフ上の最初の run の開始からの経過時間 (分) です。
- ステップ は、デフォルトで wandb.log() が呼び出されるたびに増分され、モデルからログに記録したトレーニングステップの数を反映することになっています。
Y: メトリクスや時間の経過とともに変化するハイパーパラメーターなど、ログに記録された値から 1 つ以上の Y 軸を選択します。
X 軸 および Y 軸 の最小値と最大値 (オプション)。
ポイント集計メソッド。ランダムサンプリング (デフォルト) または フルフィデリティ。サンプリングを参照してください。
スムージング: 折れ線グラフのスムージングを変更します。デフォルトは 時間加重 EMA です。その他の値には、スムージングなし、移動平均、および ガウス があります。
外れ値: デフォルトのプロットの最小スケールと最大スケールから外れ値を排除するようにリスケールします。
run またはグループの最大数: この数を増やすことで、折れ線グラフに一度に表示される線を増やします。デフォルトは 10 runs です。利用可能な run が 10 よりも多いが、グラフが表示数を制限している場合、チャートの上部に「最初の 10 runs を表示」というメッセージが表示されます。
チャートの種類: 折れ線グラフ、面グラフ、およびパーセンテージ面グラフを切り替えます。

グループ化: プロットで run をグループ化および集計するかどうか、またその方法を構成します。

グループ化: 列を選択すると、その列に同じ値を持つすべての run がグループ化されます。
集計: 集計—グラフ上の線の値。オプションは、グループの平均、中央値、最小値、および最大値です。

チャート: パネル、X 軸、Y 軸、および -軸のタイトルを指定し、凡例の表示/非表示を切り替え、その位置を構成します。

凡例: パネルの凡例の外観をカスタマイズします (有効になっている場合)。

凡例: プロットの凡例の各線の凡例のフィールド。
凡例テンプレート: 凡例の完全にカスタマイズ可能なテンプレートを定義します。線のプロットの上部にあるテンプレートに表示するテキストと変数、およびマウスをプロットの上に置いたときに表示される凡例を正確に指定します。

式: カスタム計算式をパネルに追加します。

Y 軸式: 計算されたメトリクスをグラフに追加します。ログに記録されたメトリクスのいずれか、およびハイパーパラメーターなどの設定値を使用して、カスタム線を計算できます。
X 軸式: カスタム式を使用して計算された値を使用するように X 軸をリスケールします。役立つ変数には、デフォルトの X 軸の **_step** が含まれ、要約値を参照するための構文は ${summary:value} です。

セクション内のすべての折れ線グラフ

セクション内のすべての折れ線グラフのデフォルト設定をカスタマイズするには、折れ線グラフのワークスペース設定をオーバーライドします。

セクションの歯車アイコンをクリックして、その設定を開きます。
表示されるモーダル内で、データ または 表示設定 タブを選択して、セクションのデフォルト設定を構成します。各 データ 設定の詳細については、前のセクション個々の折れ線グラフを参照してください。各表示設定の詳細については、セクションレイアウトの構成を参照してください。

ワークスペース内のすべての折れ線グラフ

ワークスペース内のすべての折れ線グラフのデフォルト設定をカスタマイズするには:

ワークスペースの設定をクリックします。これには、設定というラベルの付いた歯車が付いています。
折れ線グラフ をクリックします。
表示されるモーダル内で、データ または 表示設定 タブを選択して、ワークスペースのデフォルト設定を構成します。
- 各 データ 設定の詳細については、前のセクション個々の折れ線グラフを参照してください。
- 各 表示設定 セクションの詳細については、ワークスペースの表示設定を参照してください。ワークスペースレベルでは、折れ線グラフのデフォルトの ズーム の振る舞いを構成できます。この設定は、一致する X 軸キーを持つ折れ線グラフ間でズームを同期するかどうかを制御します。デフォルトでは無効になっています。

プロット上の平均値を可視化する

いくつかの異なる Experiments があり、プロット上の値の平均を表示する場合は、テーブルのグループ化機能を使用できます。run テーブルの上にある [グループ] をクリックし、[すべて] を選択して、グラフに平均値を表示します。

平均化する前のグラフは次のようになります。

次の画像は、グループ化された線を使用して runs 全体の平均値を表すグラフを示しています。

プロット上の NaN 値を可視化する

wandb.log を使用して、PyTorch テンソルを含む NaN 値を折れ線グラフにプロットすることもできます。例：

wandb.log({"test": [..., float("nan"), ...]})

1 つのチャートで 2 つのメトリクスを比較する

ページの右上隅にある パネルを追加 ボタンを選択します。
表示される左側のパネルから、[評価] ドロップダウンを展開します。
Run comparer を選択します。

折れ線グラフの色を変更する

runs のデフォルトの色が比較に役立たない場合があります。これを克服するために、wandb には、手動で色を変更できる 2 つのインスタンスが用意されています。

各 run には、初期化時にデフォルトでランダムな色が割り当てられます。

いずれかの色をクリックすると、カラーパレットが表示され、そこから必要な色を手動で選択できます。

設定を編集するパネルの上にマウスを置きます。
表示される鉛筆アイコンを選択します。
[凡例] タブを選択します。

異なる X 軸で可視化する

実験にかかった絶対時間を確認したり、実験が実行された曜日を確認したりする場合は、X 軸を切り替えることができます。ステップから相対時間、そして Wall Time に切り替える例を次に示します。

面グラフ

折れ線グラフの設定の [詳細設定] タブで、異なるプロットスタイルをクリックして、面グラフまたはパーセンテージ面グラフを取得します。

ズーム

長方形をクリックしてドラッグし、垂直方向と水平方向に同時にズームします。これにより、X 軸と Y 軸のズームが変更されます。

チャートの凡例を非表示にする

この単純なトグルを使用して、折れ線グラフの凡例をオフにします。

4.1.1.1 - Line plot reference

X軸

折れ線グラフのX軸には、W&B.log でログに記録した値を設定できます。ただし、常に数値としてログに記録されている必要があります。

Y軸の変数

Y軸の変数には、wandb.log でログに記録した値を設定できます。ただし、数値、数値の配列、または数値のヒストグラムをログに記録している必要があります。変数のポイント数が1500を超える場合、W&B は1500ポイントまでサンプルダウンします。

runs テーブルで run の色を変更すると、Y軸の線の色を変更できます。

X範囲とY範囲

プロットのXとYの最大値と最小値を変更できます。

X範囲のデフォルトは、X軸の最小値から最大値までです。

Y範囲のデフォルトは、メトリクスの最小値とゼロからメトリクスの最大値までです。

最大 run /グループ数

デフォルトでは、10個の run または run のグループのみがプロットされます。run は run テーブルまたは run セットの上部から取得されるため、run テーブルまたは run セットをソートすると、表示される run を変更できます。

凡例

チャートの凡例を制御して、ログに記録した任意の run の任意の設定値と、作成時間や run を作成したユーザーなど、run からのメタデータを表示できます。

例：

${run:displayName} - ${config:dropout} は、各 run の凡例名を royal-sweep - 0.5 のようにします。ここで、royal-sweep は run 名で、0.5 は dropout という名前の設定パラメータです。

[[ ]] 内に値を設定すると、チャートにカーソルを合わせたときに、ポイント固有の値をクロスヘアに表示できます。たとえば、\[\[ $x: $y ($original) ]] は “2: 3 (2.9)” のように表示されます。

[[ ]] 内でサポートされている値は次のとおりです。

値	意味
`${x}`	X値
`${y}`	Y値（平滑化調整を含む）
`${original}`	Y値（平滑化調整を含まない）
`${mean}`	グループ化された run の平均
`${stddev}`	グループ化された run の標準偏差
`${min}`	グループ化された run の最小
`${max}`	グループ化された run の最大
`${percent}`	合計のパーセント（積み上げ面グラフの場合）

グルーピング

グルーピングをオンにしてすべての run を集計したり、個々の変数でグループ化したりできます。テーブル内でグループ化してグルーピングをオンにすることもできます。グループは自動的にグラフに表示されます。

平滑化

平滑化係数を0から1の間に設定できます。0は平滑化なし、1は最大平滑化です。

外れ値を無視する

デフォルトのプロットの最小スケールと最大スケールから外れ値を排除するようにプロットをリスケールします。プロットに対する設定の影響は、プロットのサンプリングモードによって異なります。

ランダムサンプリングモードを使用するプロットの場合、[外れ値を無視する]を有効にすると、5％から95％のポイントのみが表示されます。外れ値が表示されても、他のポイントとは異なる形式にはなりません。
フルフィデリティモードを使用するプロットの場合、すべてのポイントが常に表示され、各バケットの最後の値に凝縮されます。[外れ値を無視する]が有効になっている場合、各バケットの最小境界と最大境界が網掛け表示されます。それ以外の場合、領域は網掛け表示されません。

式

式を使用すると、1-精度などのメトリクスから派生した値をプロットできます。現在、単一のメトリクスをプロットしている場合にのみ機能します。単純な算術式（+、-、*、/、％）、および累乗の場合は ** を実行できます。

プロットスタイル

折れ線グラフのスタイルを選択します。

折れ線グラフ：

面グラフ：

パーセンテージ面グラフ：

4.1.1.2 - Point aggregation

Data Visualization の精度とパフォーマンスを向上させるために、折れ線グラフ内でポイント集約メソッドを使用します。ポイント集約モードには、full fidelity（完全精度）と random sampling（ランダムサンプリング）の2種類があります。W&B はデフォルトで完全精度モードを使用します。

Full fidelity

完全精度モードを使用すると、W&B はデータポイントの数に基づいて、x軸を動的なバケットに分割します。次に、各バケット内の最小値、最大値、平均値を計算し、折れ線グラフのポイント集約をレンダリングします。

ポイント集約に完全精度モードを使用する主な利点は3つあります。

極端な値とスパイクを保持する: データ内の極端な値とスパイクを保持します。
最小点と最大点のレンダリング方法を設定する: W&B App を使用して、極端な（最小/最大）値を影付きの領域として表示するかどうかをインタラクティブに決定します。
データ忠実度を損なわずにデータを探索する: W&B は、特定のデータポイントにズームインすると、x軸のバケットサイズを再計算します。これにより、精度を損なわずにデータを探索できます。キャッシュを使用して、以前に計算された集約を保存し、ロード時間を短縮します。これは、大規模なデータセットをナビゲートする場合に特に役立ちます。

最小点と最大点のレンダリング方法を設定する

折れ線グラフの周りの影付き領域で最小値と最大値を表示または非表示にします。

次の画像は、青い折れ線グラフを示しています。水色の影付き領域は、各バケットの最小値と最大値を表しています。

折れ線グラフで最小値と最大値をレンダリングするには、次の3つの方法があります。

Never: 最小/最大値は影付きの領域として表示されません。x軸バケット全体の集約された線のみを表示します。
On hover: 最小/最大値の影付き領域は、チャートにカーソルを合わせると動的に表示されます。このオプションを使用すると、ビューがすっきりした状態に保たれ、範囲をインタラクティブに検査できます。
Always: 最小/最大影付き領域は、チャート内のすべてのバケットに対して常に表示され、常に値の全範囲を視覚化できます。チャートで多くの Runs が可視化されている場合、これは視覚的なノイズになる可能性があります。

デフォルトでは、最小値と最大値は影付き領域として表示されません。影付き領域オプションのいずれかを表示するには、次の手順に従います。

W&B の Projects に移動します。
左側のタブで Workspace アイコンを選択します。
画面の右上隅にある歯車アイコンを、Add panels ボタンの左側の横にあるアイコンを選択します。
表示される UI スライダーから、Line plots を選択します。
Point aggregation セクション内で、Show min/max values as a shaded area ドロップダウンメニューから On over または Always を選択します。

W&B の Projects に移動します。
左側のタブで Workspace アイコンを選択します。
完全精度モードを有効にする折れ線グラフパネルを選択します。
表示されるモーダル内で、Show min/max values as a shaded area ドロップダウンメニューから On hover または Always を選択します。

データ忠実度を損なわずにデータを探索する

極端な値やスパイクなどの重要なポイントを見逃すことなく、データセットの特定領域を分析します。折れ線グラフをズームインすると、W&B は各バケット内の最小値、最大値、平均値を計算するために使用されるバケットサイズを調整します。

W&B は x軸をデフォルトで1000個のバケットに動的に分割します。各バケットについて、W&B は次の値を計算します。

Minimum: そのバケット内の最小値。
Maximum: そのバケット内の最大値。
Average: そのバケット内のすべてのポイントの平均値。

W&B は、完全なデータ表現を保持し、すべてのプロットに極端な値を含める方法でバケット内の値をプロットします。1,000ポイント以下にズームインすると、完全精度モードは追加の集約なしですべてのデータポイントをレンダリングします。

折れ線グラフをズームインするには、次の手順に従います。

W&B の Projects に移動します。
左側のタブで Workspace アイコンを選択します。
オプションで、折れ線グラフパネルをワークスペースに追加するか、既存の折れ線グラフパネルに移動します。
クリックしてドラッグし、ズームインする特定の領域を選択します。

折れ線グラフのグループ化と式

折れ線グラフのグループ化を使用すると、W&B は選択したモードに基づいて以下を適用します。

非ウィンドウサンプリング (グループ化): x軸上の Runs 全体でポイントを整列させます。複数のポイントが同じ x 値を共有する場合、平均が計算されます。それ以外の場合は、個別のポイントとして表示されます。
ウィンドウサンプリング (グループ化と式): x軸を 250 個のバケットまたは最長線のポイント数 (いずれか小さい方) に分割します。W&B は各バケット内のポイントの平均を取ります。
Full fidelity (グループ化と式): 非ウィンドウサンプリングと同様ですが、パフォーマンスと詳細のバランスを取るために、Run ごとに最大 500 ポイントを取得します。

Random sampling

ランダムサンプリングは、1500個のランダムにサンプリングされたポイントを使用して折れ線グラフをレンダリングします。ランダムサンプリングは、多数のデータポイントがある場合にパフォーマンス上の理由で役立ちます。

ランダムサンプリングは、非決定論的にサンプリングします。これは、ランダムサンプリングがデータ内の重要な外れ値やスパイクを除外することがあり、データ精度が低下することを意味します。

ランダムサンプリングを有効にする

デフォルトでは、W&B は完全精度モードを使用します。ランダムサンプリングを有効にするには、次の手順に従います。

W&B の Projects に移動します。
左側のタブで Workspace アイコンを選択します。
画面の右上隅にある歯車アイコンを、Add panels ボタンの左側の横にあるアイコンを選択します。
表示される UI スライダーから、Line plots を選択します。
Point aggregation セクションから Random sampling を選択します。

W&B の Projects に移動します。
左側のタブで Workspace アイコンを選択します。
ランダムサンプリングを有効にする折れ線グラフパネルを選択します。
表示されるモーダル内で、Point aggregation method セクションから Random sampling を選択します。

サンプリングされていないデータへのアクセス

W&B Run API を使用して、Run 中にログに記録されたメトリクスの完全な履歴にアクセスできます。次の例は、特定の Run から損失値を取得して処理する方法を示しています。

# W&B API を初期化します
run = api.run("l2k2/examples-numpy-boston/i0wt6xua")

# 'Loss' メトリクスの履歴を取得します
history = run.scan_history(keys=["Loss"])

# 履歴から損失値を抽出します
losses = [row["Loss"] for row in history]

4.1.1.3 - Smooth line plots

折れ線グラフでは、スムージングを使ってノイズの多いデータのトレンドを確認します。

W&B は3種類の平滑化をサポートしています。

これらの機能をインタラクティブな W&B レポートでライブで確認できます。

指数移動平均 (デフォルト)

指数平滑化は、過去の点の重みを指数関数的に減衰させることで、時系列データを平滑化する手法です。範囲は0から1です。背景については、指数平滑化を参照してください。時系列の初期の値がゼロに偏らないように、バイアス除去項が追加されています。

EMAアルゴリズムは、線上の点の密度 (x軸の範囲の単位あたりの y 値の数) を考慮します。これにより、異なる特性を持つ複数の線を同時に表示する際に、一貫した平滑化が可能になります。

以下は、この仕組みの内部動作を示すサンプルコードです。

const smoothingWeight = Math.min(Math.sqrt(smoothingParam || 0), 0.999);
let lastY = yValues.length > 0 ? 0 : NaN;
let debiasWeight = 0;

return yValues.map((yPoint, index) => {
  const prevX = index > 0 ? index - 1 : 0;
  // VIEWPORT_SCALEは、結果をチャートのx軸範囲にスケールします
  const changeInX =
    ((xValues[index] - xValues[prevX]) / rangeOfX) * VIEWPORT_SCALE;
  const smoothingWeightAdj = Math.pow(smoothingWeight, changeInX);

  lastY = lastY * smoothingWeightAdj + yPoint;
  debiasWeight = debiasWeight * smoothingWeightAdj + 1;
  return lastY / debiasWeight;
});

これはアプリ内では次のようになります。

ガウシアン平滑化

ガウシアン平滑化 (またはガウシアンカーネル平滑化) は、点の加重平均を計算します。ここで、重みは平滑化パラメータとして指定された標準偏差を持つガウス分布に対応します。を参照してください。平滑化された値は、すべての入力x 値に対して計算されます。

TensorBoard の振る舞いと一致させることを気にしない場合は、ガウシアン平滑化は平滑化に適した標準的な選択肢です。指数移動平均とは異なり、値の前後に発生する点に基づいて点が平滑化されます。

これはアプリ内では次のようになります。

移動平均

移動平均は、指定されたx 値の前後のウィンドウ内の点の平均で点を置き換える平滑化アルゴリズムです。https://en.wikipedia.org/wiki/Moving_average の「Boxcar Filter」を参照してください。移動平均に選択されたパラメータは、Weights and Biases に移動平均で考慮する点の数を伝えます。

点がx軸上で不均等に配置されている場合は、ガウシアン平滑化の使用を検討してください。

次の画像は、実行中のアプリがアプリ内でどのように見えるかを示しています。

指数移動平均 (非推奨)

TensorBoard EMAアルゴリズムは、一貫した点密度 (x軸の単位あたりにプロットされる点の数) を持たない同じチャート上の複数の線を正確に平滑化できないため、非推奨になりました。

指数移動平均は、TensorBoard の平滑化アルゴリズムと一致するように実装されています。範囲は0から1です。背景については、指数平滑化を参照してください。時系列の初期の値がゼロに偏らないように、バイアス除去項が追加されています。

以下は、この仕組みの内部動作を示すサンプルコードです。

  data.forEach(d => {
    const nextVal = d;
    last = last * smoothingWeight + (1 - smoothingWeight) * nextVal;
    numAccum++;
    debiasWeight = 1.0 - Math.pow(smoothingWeight, numAccum);
    smoothedData.push(last / debiasWeight);

これはアプリ内では次のようになります。

実装の詳細

すべての平滑化アルゴリズムはサンプリングされたデータで実行されます。つまり、1500を超える点をログに記録すると、平滑化アルゴリズムはサーバーから点がダウンロードされた後に実行されます。平滑化アルゴリズムの目的は、データ内のパターンをすばやく見つけるのに役立つことです。多数のログに記録された点を持つメトリクスで正確な平滑化された値が必要な場合は、API を介してメトリクスをダウンロードし、独自の平滑化メソッドを実行する方が良い場合があります。

元のデータを非表示にする

デフォルトでは、元の平滑化されていないデータが背景に薄い線として表示されます。これをオフにするには、[元のデータを表示] トグルをクリックします。

4.1.2 - Bar plots

メトリクスを可視化し、軸をカスタマイズして、カテゴリカルデータを棒グラフとして比較します。

棒グラフは、カテゴリカルデータを長方形の棒で表示し、垂直または水平にプロットできます。棒グラフは、すべてのログに記録された値の長さが1の場合、デフォルトで wandb.log() で表示されます。

Plotting Box and horizontal Bar plots in W&B

チャートの設定で、表示する最大 run 数を制限したり、configで run をグループ化したり、ラベルの名前を変更したりできます。

棒グラフのカスタマイズ

また、Box プロットまたは Violin プロットを作成して、多くの要約統計量を1つのチャートタイプにまとめることもできます。

run テーブルで run をグループ化します。
ワークスペースで「パネルを追加」をクリックします。
標準の「棒グラフ」を追加し、プロットするメトリックを選択します。
「グループ化」タブで、「箱ひげ図」または「バイオリン」などを選択して、これらのスタイルをプロットします。

4.1.3 - Parallel coordinates

機械学習の実験における結果を比較する

並列座標チャートは、多数のハイパーパラメータとモデルのメトリクスの関係を一目で把握できるようにまとめたものです。

軸: wandb.config のさまざまなハイパーパラメータと、wandb.log のメトリクス。
線: 各線は単一の run を表します。線にマウスオーバーすると、run に関する詳細がツールチップに表示されます。現在のフィルタに一致するすべての線が表示されますが、目のアイコンをオフにすると、線はグレー表示になります。

並列座標パネルの作成

ワークスペースのランディングページに移動します
パネルを追加 をクリックします
並列座標 を選択します

パネルの設定

パネルを構成するには、パネルの右上隅にある編集ボタンをクリックします。

ツールチップ: マウスオーバーすると、各 run の情報を示す凡例が表示されます
タイトル: 軸のタイトルを編集して、より読みやすくします
勾配: 好みの色範囲に合わせて勾配をカスタマイズします
対数スケール: 各軸は、対数スケールで個別に表示するように設定できます
軸の反転: 軸の方向を切り替えます。これは、精度と損失の両方を列として持つ場合に便利です

ライブ並列座標パネルを操作する

4.1.4 - Scatter plots

このページでは、W&B で散布図を使用する方法について説明します。

ユースケース

散布図を使用して、複数の run を比較し、実験のパフォーマンスを可視化します。

最小値、最大値、および平均値の線を描画します。
メタデータツールチップをカスタマイズします。
点の色を制御します。
軸の範囲を調整します。
軸にログスケールを使用します。

例

次の例は、数週間の実験におけるさまざまな model の検証精度を表示する散布図を示しています。ツールチップには、バッチサイズ、ドロップアウト、および軸の値が含まれています。線は、検証精度の移動平均も示しています。

ライブの例を見る →

散布図の作成

W&B UI で散布図を作成するには:

[Workspaces] タブに移動します。
[Charts] パネルで、アクションメニュー ... をクリックします。
ポップアップメニューから、[Add panels] を選択します。
[Add panels] メニューで、[Scatter plot] を選択します。
表示するデータのプロットするために、x 軸と y 軸を設定します。オプションで、軸の最大範囲と最小範囲を設定するか、z 軸を追加します。
[Apply] をクリックして、散布図を作成します。
[Charts] パネルで新しい散布図を表示します。

4.1.5 - Save and diff code

デフォルトでは、W&B は最新の git コミットハッシュのみを保存します。より多くのコード機能を有効にすると、UI で Experiments 間のコードを動的に比較できます。

wandb バージョン 0.8.28 以降、W&B は wandb.init() を呼び出すメインのトレーニングファイルからコードを保存できます。

ライブラリコードを保存する

コードの保存を有効にすると、W&B は wandb.init() を呼び出したファイルからコードを保存します。追加のライブラリコードを保存するには、次の 3 つのオプションがあります。

`wandb.init()` を呼び出した後、`wandb.run.log_code(".")` を呼び出す

import wandb

wandb.init()
wandb.run.log_code(".")

`code_dir` を設定して、設定オブジェクトを `wandb.init` に渡す

import wandb

wandb.init(settings=wandb.Settings(code_dir="."))

これにより、現在のディレクトリーとそのすべてのサブディレクトリーにあるすべての Python ソースコードファイルが Artifacts としてキャプチャされます。保存されるソースコードファイルの種類と場所をより詳細に制御するには、リファレンスドキュメントを参照してください。

UI でコードの保存を設定する

プログラムでコードの保存を設定するだけでなく、W&B アカウントの Settings でこの機能を切り替えることもできます。これにより、アカウントに関連付けられているすべての Teams に対してコードの保存が有効になることに注意してください。

デフォルトでは、W&B はすべての Teams に対してコードの保存を無効にします。

W&B アカウントにログインします。
Settings > Privacy に移動します。
Project and content security で、Disable default code saving をオンにします。

コード比較ツール

異なる W&B の Runs で使用されるコードを比較します。

ページの右上隅にある Add panels ボタンを選択します。
TEXT AND CODE ドロップダウンを展開し、Code を選択します。

Jupyter セッション履歴

W&B は、Jupyter ノートブックセッションで実行されたコードの履歴を保存します。Jupyter 内で wandb.init() を呼び出すと、W&B は現在のセッションで実行されたコードの履歴を含む Jupyter ノートブックを自動的に保存する hook を追加します。

コードを含む project のワークスペースに移動します。
左側のナビゲーションバーで Artifacts タブを選択します。
code artifact を展開します。
Files タブを選択します。

これにより、セッションで実行されたセルと、iPython の display メソッドを呼び出すことによって作成された出力が表示されます。これにより、特定の run で Jupyter 内で実行されたコードを正確に確認できます。可能な場合、W&B はコードディレクトリーにある最新バージョンのノートブックも保存します。

4.1.6 - Parameter importance

モデルのハイパーパラメーターと出力メトリクスの関係を可視化します。

どのハイパーパラメータが最も優れた予測因子であり、メトリクスの望ましい値と高度に相関しているかを調べます。

相関は、ハイパーパラメータと選択したメトリクス（この場合は val_loss）の間の線形相関です。したがって、高い相関は、ハイパーパラメータが高い値を持つ場合、メトリクスも高い値を持つことを意味し、その逆もまた同様です。相関は見るべき優れたメトリクスですが、入力間の二次的な相互作用を捉えることができず、大きく異なる範囲の入力を比較するのが面倒になる可能性があります。

したがって、W&B は 重要度 メトリクスも計算します。W&B は、ハイパーパラメータを入力として、メトリクスをターゲット出力としてランダムフォレストをトレーニングし、ランダムフォレストのフィーチャーの重要度の値をレポートします。

この手法のアイデアは、Jeremy Howard との会話に触発されました。彼は、Fast.ai でハイパーパラメータ空間を調査するために、ランダムフォレストのフィーチャーの重要度の使用を開拓しました。W&B は、この講義（およびこれらのノート）をチェックして、この分析の背後にある動機について詳しく学ぶことを強くお勧めします。

ハイパーパラメータの重要度パネルは、高度に相関するハイパーパラメータ間の複雑な相互作用を解きほぐします。そうすることで、モデルのパフォーマンスを予測するという点で、どのハイパーパラメータが最も重要であるかを示すことにより、ハイパーパラメータの検索を微調整するのに役立ちます。

ハイパーパラメータの重要度パネルの作成

W&B の Projects に移動します。
Add panels ボタンを選択します。
CHARTS ドロップダウンを展開し、ドロップダウンから Parallel coordinates を選択します。

空の panel が表示される場合は、runs がグループ化されていないことを確認してください

パラメータマネージャーを使用すると、表示および非表示のパラメータを手動で設定できます。

Manually setting the visible and hidden fields

ハイパーパラメータの重要度パネルの解釈

この panel には、トレーニングスクリプトの wandb.config オブジェクトに渡されたすべてのパラメータが表示されます。次に、これらの config パラメータのフィーチャーの重要度と相関関係が、選択したモデルメトリクス（この場合は val_loss）に関して表示されます。

重要度

重要度の列には、選択したメトリクスの予測に各ハイパーパラメータがどの程度役立ったかが表示されます。多数のハイパーパラメータのチューニングを開始し、このプロットを使用して、さらに調査する価値のあるハイパーパラメータを絞り込むシナリオを想像してください。後続の Sweeps は、最も重要なハイパーパラメータに限定できるため、より優れたモデルをより迅速かつ安価に見つけることができます。

W&B は、ツリーベースのモデルを使用して重要度を計算します。これは、線形モデルよりも、カテゴリデータと正規化されていないデータの両方に対して寛容であるためです。

前の画像では、epochs, learning_rate, batch_size および weight_decay が非常に重要であることがわかります。

相関

相関は、個々のハイパーパラメータとメトリクスの値の間の線形関係を捉えます。SGD オプティマイザーなどのハイパーパラメータの使用と val_loss の間に有意な関係があるかどうかという質問に答えます（この場合の答えはイエスです）。相関値の範囲は -1 から 1 で、正の値は正の線形相関を表し、負の値は負の線形相関を表し、0 の値は相関がないことを表します。一般に、どちらかの方向に 0.7 より大きい値は強い相関を表します。

このグラフを使用して、メトリクスとの相関が高い値をさらに調べたり（この場合は、確率的勾配降下法または adam を rmsprop または nadam よりも選択したり）、より多くのエポックでトレーニングしたりできます。

相関は、必ずしも因果関係ではなく、関連性の証拠を示しています。
相関は外れ値に敏感です。特に試行されたハイパーパラメータのサンプルサイズが小さい場合、強い関係を中程度の関係に変える可能性があります。
そして最後に、相関はハイパーパラメータとメトリクスの間の線形関係のみを捉えます。強い多項式関係がある場合、相関によって捉えられません。

重要度と相関の間の格差は、重要度がハイパーパラメータ間の相互作用を考慮するのに対し、相関は個々のハイパーパラメータがメトリクスの値に与える影響のみを測定するという事実に起因します。次に、相関は線形関係のみを捉え、重要度はより複雑な関係を捉えることができます。

ご覧のとおり、重要度と相関はどちらも、ハイパーパラメータがモデルのパフォーマンスにどのように影響するかを理解するための強力な Tool です。

4.1.7 - Compare run metrics

複数の run 間でメトリクスを比較する

Run Comparer を使用して、run間で異なるメトリクスを確認できます。

ページの右上隅にある [Add panels] ボタンを選択します。
表示される左側のパネルで、[Evaluation] ドロップダウンを展開します。
[Run comparer] を選択します。

diff only オプションを切り替えて、run間で値が同じ行を非表示にします。

4.1.8 - Query panels

このページのいくつかの機能はベータ版で、機能フラグの背後に隠されています。関連するすべての機能をアンロックするには、プロフィールページの自己紹介に weave-plot を追加してください。

W&B Weave をお探しですか? 生成 AI アプリケーション構築のための W&B のツールスイートですか? Weave のドキュメントはこちらにあります: wandb.me/weave。

クエリーパネルを使用して、データをクエリーし、インタラクティブに視覚化します。

クエリーパネルの作成

ワークスペースまたはレポート内にクエリーを追加します。

プロジェクトのワークスペースに移動します。
右上隅にある「Add panel（パネルを追加）」をクリックします。
ドロップダウンから「Query panel（クエリーパネル）」を選択します。

「/Query panel（/クエリーパネル）」と入力して選択します。

または、クエリーを一連の Runs に関連付けることもできます。

レポート内で、「/Panel grid（/ パネルグリッド）」と入力して選択します。
「Add panel（パネルを追加）」ボタンをクリックします。
ドロップダウンから「Query panel（クエリーパネル）」を選択します。

クエリーのコンポーネント

式

クエリー式を使用して、Runs、Artifacts、Models、Tables など、W&B に保存されているデータをクエリーします。

例: テーブルのクエリー

W&B Table をクエリーするとします。トレーニングコードで、"cifar10_sample_table"というテーブルをログに記録します。

import wandb
wandb.log({"cifar10_sample_table":<MY_TABLE>})

クエリーパネル内では、次のコードでテーブルをクエリーできます。

runs.summary["cifar10_sample_table"]

これを分解すると次のようになります。

runs は、クエリーパネルがワークスペースにある場合、クエリーパネル式に自動的に挿入される変数です。その「値」は、特定のワークスペースで表示できる Runs のリストです。 run で使用できるさまざまな属性については、こちらをお読みください。
summary は、Run の Summary オブジェクトを返す op です。 Op は mapped です。つまり、この op はリスト内の各 Run に適用され、Summary オブジェクトのリストが生成されます。
["cifar10_sample_table"] は、predictions というパラメータを持つ Pick op（角かっこで示されます）です。 Summary オブジェクトはディクショナリーまたはマップのように動作するため、この操作は各 Summary オブジェクトから predictions フィールドを選択します。

独自のクエリーをインタラクティブに作成する方法については、このレポートを参照してください。

設定

パネルの左上隅にある歯車アイコンを選択して、クエリー設定を展開します。これにより、ユーザーはパネルのタイプと、結果パネルのパラメータを設定できます。

結果パネル

最後に、クエリー結果パネルは、選択したクエリーパネルを使用して、クエリー式の結果をレンダリングし、データをインタラクティブな形式で表示するように設定によって設定されます。次の画像は、同じデータの Table とプロットを示しています。

基本操作

クエリーパネル内で実行できる一般的な操作を次に示します。

並べ替え

列オプションから並べ替えを行います。

フィルター

クエリーで直接フィルターするか、左上隅にあるフィルターボタンを使用できます（2 番目の画像）。

マップ

マップ操作はリストを反復処理し、データ内の各要素に関数を適用します。これは、パネルクエリーで直接行うか、列オプションから新しい列を挿入して行うことができます。

グループ化

クエリーまたは列オプションを使用してグループ化できます。

連結

連結操作を使用すると、2 つのテーブルを連結し、パネル設定から連結または結合できます。

結合

クエリーでテーブルを直接結合することも可能です。次のクエリー式を検討してください。

project("luis_team_test", "weave_example_queries").runs.summary["short_table_0"].table.rows.concat.join(\
project("luis_team_test", "weave_example_queries").runs.summary["short_table_1"].table.rows.concat,\
(row) => row["Label"],(row) => row["Label"], "Table1", "Table2",\
"false", "false")

左側のテーブルは、次のように生成されます。

project("luis_team_test", "weave_example_queries").\
runs.summary["short_table_0"].table.rows.concat.join

右側のテーブルは、次のように生成されます。

project("luis_team_test", "weave_example_queries").\
runs.summary["short_table_1"].table.rows.concat

説明:

(row) => row["Label"] は各テーブルのセレクターであり、結合する列を決定します
"Table1" と "Table2" は、結合時の各テーブルの名前です
true と false は、左側の内部/外部結合設定用です

Runs オブジェクト

クエリーパネルを使用して runs オブジェクトにアクセスします。 Run オブジェクトは、 Experiments のレコードを保存します。詳細については、レポートのこのセクションを参照してください。簡単にまとめると、runs オブジェクトには次のものが含まれます。

summary: Run の結果をまとめた情報のディクショナリー。これは、精度や損失などのスカラー、または大きなファイルにすることができます。デフォルトでは、wandb.log() は Summary をログに記録された時系列の最終値に設定します。 Summary の内容を直接設定できます。 Summary を Run の出力として考えてください。
history: 損失など、モデルのトレーニング中に変化する値を保存するためのディクショナリーのリスト。コマンド wandb.log() はこのオブジェクトに追加されます。
config: トレーニング Run のハイパーパラメーターや、データセット Artifact を作成する Run の前処理メソッドなど、Run の設定情報のディクショナリー。これらを Run の「入力」と考えてください。

Artifacts へのアクセス

Artifacts は W&B の中核となる概念です。これらは、バージョン管理された名前付きのファイルとディレクトリーのコレクションです。 Artifacts を使用して、モデルの重み、データセット、およびその他のファイルまたはディレクトリーを追跡します。 Artifacts は W&B に保存され、ダウンロードしたり、他の Runs で使用したりできます。詳細と例については、レポートのこのセクションを参照してください。 Artifacts には通常、project オブジェクトからアクセスします。

project.artifactVersion(): プロジェクト内の指定された名前とバージョンの特定の Artifact バージョンを返します。
project.artifact(""): プロジェクト内の指定された名前の Artifact を返します。次に、.versions を使用して、この Artifact のすべてのバージョンのリストを取得できます。
project.artifactType(): プロジェクト内の指定された名前の artifactType を返します。次に、.artifacts を使用して、このタイプのすべての Artifacts のリストを取得できます。
project.artifactTypes: プロジェクト下にあるすべての Artifact タイプのリストを返します。

4.1.8.1 - Embed objects

W&B の Embedding Projector を使用すると、PCA、UMAP、t-SNE などの一般的な次元削減アルゴリズムを使用して、多次元埋め込みを 2D 平面にプロットできます。

埋め込みは、オブジェクト（人、画像、投稿、単語など）を数値のリスト、つまり ベクトル で表現するために使用されます。機械学習とデータサイエンスのユースケースでは、埋め込みは、さまざまなアプリケーションでさまざまなアプローチを使用して生成できます。このページでは、読者が埋め込みについてよく理解しており、W&B 内で視覚的に分析することに関心があることを前提としています。

埋め込みの例

Hello World

W&B を使用すると、wandb.Table クラスを使用して埋め込みをログに記録できます。それぞれが 5 次元で構成される 3 つの埋め込みの次の例を考えてみましょう。

import wandb

wandb.init(project="embedding_tutorial")
embeddings = [
    # D1   D2   D3   D4   D5
    [0.2, 0.4, 0.1, 0.7, 0.5],  # 埋め込み 1
    [0.3, 0.1, 0.9, 0.2, 0.7],  # 埋め込み 2
    [0.4, 0.5, 0.2, 0.2, 0.1],  # 埋め込み 3
]
wandb.log(
    {"embeddings": wandb.Table(columns=["D1", "D2", "D3", "D4", "D5"], data=embeddings)}
)
wandb.finish()

上記のコードを実行すると、W&B ダッシュボードにデータを含む新しい Table が表示されます。右上のパネルセレクターから [2D Projection] を選択して、埋め込みを 2 次元でプロットできます。スマートデフォルトが自動的に選択されます。これは、歯車アイコンをクリックしてアクセスできる設定メニューで簡単にオーバーライドできます。この例では、利用可能な 5 つの数値次元すべてを自動的に使用します。

Digits MNIST

上記の例は、埋め込みをログに記録する基本的なメカニズムを示していますが、通常はより多くの次元とサンプルを扱っています。 MNIST Digits データセット(UCI ML 手書き数字データセット s) について考えてみましょう。SciKit-Learn 経由で利用できます。このデータセットには 1797 件のレコードがあり、それぞれに 64 の次元があります。この問題は、10 クラス分類のユースケースです。入力データを画像に変換して、可視化することもできます。

import wandb
from sklearn.datasets import load_digits

wandb.init(project="embedding_tutorial")

# データセットをロードする
ds = load_digits(as_frame=True)
df = ds.data

# 「target」列を作成する
df["target"] = ds.target.astype(str)
cols = df.columns.tolist()
df = df[cols[-1:] + cols[:-1]]

# 「image」列を作成する
df["image"] = df.apply(
    lambda row: wandb.Image(row[1:].values.reshape(8, 8) / 16.0), axis=1
)
cols = df.columns.tolist()
df = df[cols[-1:] + cols[:-1]]

wandb.log({"digits": df})
wandb.finish()

上記のコードを実行すると、再び UI に Table が表示されます。 [2D Projection] を選択すると、埋め込みの定義、色付け、アルゴリズム (PCA、UMAP、t-SNE)、アルゴリズムのパラメータ、さらにはオーバーレイ (この場合は、ポイントにカーソルを合わせると画像が表示されます) を設定できます。この特定のケースでは、これらはすべて「スマートデフォルト」であり、[2D Projection] を 1 回クリックすると、非常によく似たものが表示されます。 (ここをクリックして操作この例を参照してください)。

ログ記録のオプション

埋め込みは、さまざまな形式でログに記録できます。

単一の埋め込み列: 多くの場合、データはすでに「マトリックス」のような形式になっています。この場合、単一の埋め込み列を作成できます。ここで、セル値のデータ型は list[int]、list[float]、または np.ndarray になります。
複数の数値列: 上記の 2 つの例では、このアプローチを使用し、次元ごとに列を作成します。現在、セルには python int または float を使用できます。

Single Embedding Column Many Numeric Columns

さらに、すべてのテーブルと同様に、テーブルの構築方法に関して多くのオプションがあります。

wandb.Table(dataframe=df) を使用して dataframe から直接
wandb.Table(data=[...], columns=[...]) を使用して データのリスト から直接
テーブルを 行ごとに (コードにループがある場合に最適) 段階的に構築 します。 table.add_data(...) を使用してテーブルに行を追加します
テーブルに 埋め込み列 を追加します (埋め込み形式の予測のリストがある場合に最適)。 table.add_col("col_name", ...)
計算された列 を追加します (テーブルにマップする関数または model がある場合に最適)。 table.add_computed_columns(lambda row, ndx: {"embedding": model.predict(row)})

プロットオプション

[2D Projection] を選択した後、歯車アイコンをクリックしてレンダリング設定を編集できます。目的の列を選択することに加えて (上記を参照)、目的のアルゴリズム (および目的のパラメータ) を選択できます。以下に、それぞれ UMAP と t-SNE のパラメータを示します。

注: 現在、3 つのアルゴリズムすべてで、ランダムなサブセットの 1000 行と 50 次元にダウンサンプリングしています。

4.2 - Custom charts

W&B のプロジェクトでカスタムグラフを作成できます。任意のデータのテーブルを記録し、必要な方法で正確に可視化します。Vega の機能を使用して、フォント、色、ツールチップの詳細を制御します。

コード: Colab Colabノートブックの例をお試しください。
動画: 解説動画をご覧ください。
例: KerasとSklearnのデモ notebook

仕組み

データのログ: スクリプトから、config とサマリーデータを記録します。
グラフのカスタマイズ: GraphQL クエリでログに記録されたデータを取得します。強力な可視化文法である Vega を使用して、クエリの結果を可視化します。
グラフのログ: wandb.plot_table() を使用して、スクリプトから独自のプリセットを呼び出します。

期待されるデータが表示されない場合は、探している列が選択された runs に記録されていない可能性があります。グラフを保存し、runs テーブルに戻り、目のアイコンを使用して選択した runs を確認します。

スクリプトからグラフをログ

組み込みプリセット

W&B には、スクリプトから直接ログに記録できる多数の組み込みグラフプリセットがあります。これには、折れ線グラフ、散布図、棒グラフ、ヒストグラム、PR曲線、ROC曲線が含まれます。

wandb.plot.line()

任意の軸 x と y 上の接続された順序付けられた点 (x,y) のリストであるカスタム折れ線グラフをログに記録します。

data = [[x, y] for (x, y) in zip(x_values, y_values)]
table = wandb.Table(data=data, columns=["x", "y"])
wandb.log(
    {
        "my_custom_plot_id": wandb.plot.line(
            table, "x", "y", title="Custom Y vs X Line Plot"
        )
    }
)

折れ線グラフは、任意の2つの次元で曲線をログに記録します。2つの値のリストを互いにプロットする場合、リスト内の値の数は完全に一致する必要があります (たとえば、各ポイントには x と y が必要です)。

レポートの例を参照するか、Google Colabノートブックの例をお試しください。

wandb.plot.scatter()

カスタム散布図 (任意の軸 x と y のペア上の点のリスト (x, y)) をログに記録します。

data = [[x, y] for (x, y) in zip(class_x_prediction_scores, class_y_prediction_scores)]
table = wandb.Table(data=data, columns=["class_x", "class_y"])
wandb.log({"my_custom_id": wandb.plot.scatter(table, "class_x", "class_y")})

これを使用して、任意の2つの次元で散布点をログに記録できます。2つの値のリストを互いにプロットする場合、リスト内の値の数は完全に一致する必要があることに注意してください (たとえば、各ポイントには x と y が必要です)。

レポートの例を参照するか、Google Colabノートブックの例をお試しください。

wandb.plot.bar()

カスタム棒グラフ (ラベル付きの値のリストを棒として) を数行でネイティブにログに記録します。

data = [[label, val] for (label, val) in zip(labels, values)]
table = wandb.Table(data=data, columns=["label", "value"])
wandb.log(
    {
        "my_bar_chart_id": wandb.plot.bar(
            table, "label", "value", title="Custom Bar Chart"
        )
    }
)

これを使用して、任意の棒グラフをログに記録できます。リスト内のラベルと値の数は完全に一致する必要があることに注意してください (たとえば、各データポイントには両方が必要です)。

レポートの例を参照するか、Google Colabノートブックの例をお試しください。

wandb.plot.histogram()

カスタムヒストグラム (値のソートされたリストを、発生のカウント/頻度でビンに分類) を数行でネイティブにログに記録します。予測信頼度スコア (scores) のリストがあり、その分布を可視化するとします。

data = [[s] for s in scores]
table = wandb.Table(data=data, columns=["scores"])
wandb.log({"my_histogram": wandb.plot.histogram(table, "scores", title=None)})

これを使用して、任意のヒストグラムをログに記録できます。data はリストのリストであり、行と列の2D配列をサポートすることを目的としています。

レポートの例を参照するか、Google Colabノートブックの例をお試しください。

wandb.plot.pr_curve()

適合率-再現率曲線を1行で作成します。

plot = wandb.plot.pr_curve(ground_truth, predictions, labels=None, classes_to_plot=None)

wandb.log({"pr": plot})

コードが以下にアクセスできる場合は、いつでもこれをログに記録できます。

例のセットに対するモデルの予測スコア (predictions)
これらの例に対応する正解ラベル (ground_truth)
(オプション) ラベル/クラス名のリスト (labels=["cat", "dog", "bird"...] (ラベルインデックス0がcat、1 = dog、2 = birdなどを意味する場合))
(オプション) プロットで可視化するラベルのサブセット (リスト形式のまま)

レポートの例を参照するか、Google Colabノートブックの例をお試しください。

wandb.plot.roc_curve()

ROC曲線を1行で作成します。

plot = wandb.plot.roc_curve(
    ground_truth, predictions, labels=None, classes_to_plot=None
)

wandb.log({"roc": plot})

コードが以下にアクセスできる場合は、いつでもこれをログに記録できます。

例のセットに対するモデルの予測スコア (predictions)
これらの例に対応する正解ラベル (ground_truth)
(オプション) ラベル/クラス名のリスト (labels=["cat", "dog", "bird"...] (ラベルインデックス0がcat、1 = dog、2 = birdなどを意味する場合))
(オプション) プロットで可視化するこれらのラベルのサブセット (リスト形式のまま)

レポートの例を参照するか、Google Colabノートブックの例をお試しください。

カスタムプリセット

組み込みプリセットを調整するか、新しいプリセットを作成して、グラフを保存します。グラフIDを使用して、スクリプトからそのカスタムプリセットに直接データをログに記録します。Google Colabノートブックの例をお試しください。

# プロットする列を含むテーブルを作成します
table = wandb.Table(data=data, columns=["step", "height"])

# テーブルの列からグラフのフィールドへのマッピング
fields = {"x": "step", "value": "height"}

# テーブルを使用して、新しいカスタムグラフプリセットを作成します
# 独自の保存されたグラフプリセットを使用するには、vega_spec_name を変更します
my_custom_chart = wandb.plot_table(
    vega_spec_name="carey/new_chart",
    data_table=table,
    fields=fields,
)

データのログ

スクリプトから次のデータ型をログに記録し、カスタムグラフで使用できます。

Config: experiment の初期設定 (独立変数)。これには、トレーニングの開始時に wandb.config のキーとしてログに記録した名前付きフィールドが含まれます。例: wandb.config.learning_rate = 0.0001
サマリー: トレーニング中にログに記録された単一の値 (結果または従属変数)。例: wandb.log({"val_acc" : 0.8})。wandb.log() を介してトレーニング中にこのキーに複数回書き込むと、サマリーはそのキーの最終値に設定されます。
履歴: ログに記録されたスカラーの完全な時系列は、history フィールドを介してクエリで使用できます
summaryTable: 複数の値のリストをログに記録する必要がある場合は、wandb.Table() を使用してそのデータを保存し、カスタムパネルでクエリを実行します。
historyTable: 履歴データを確認する必要がある場合は、カスタムグラフパネルで historyTable をクエリします。wandb.Table() を呼び出すか、カスタムグラフをログに記録するたびに、そのステップの履歴に新しいテーブルが作成されます。

カスタムテーブルをログする方法

wandb.Table() を使用して、データを2D配列としてログに記録します。通常、このテーブルの各行は1つのデータポイントを表し、各列はプロットする各データポイントの関連フィールド/次元を示します。カスタムパネルを構成すると、テーブル全体が wandb.log() (custom_data_table below) に渡される名前付きキーを介してアクセスできるようになり、個々のフィールドは列名 (x、y、および z) を介してアクセスできるようになります。 experiment 全体で複数のタイムステップでテーブルをログに記録できます。各テーブルの最大サイズは10,000行です。Google Colab の例をお試しください。

# データのカスタムテーブルをログ
my_custom_data = [[x1, y1, z1], [x2, y2, z2]]
wandb.log(
    {"custom_data_table": wandb.Table(data=my_custom_data, columns=["x", "y", "z"])}
)

グラフのカスタマイズ

新しいカスタムグラフを追加して開始し、クエリを編集して表示されている runs からデータを選択します。クエリは GraphQL を使用して、runs の config、サマリー、および履歴フィールドからデータをフェッチします。

カスタム可視化

右上隅の グラフ を選択して、デフォルトのプリセットから開始します。次に、グラフフィールド を選択して、クエリから取得しているデータをグラフの対応するフィールドにマッピングします。

次の画像は、メトリクスを選択し、それを下の棒グラフフィールドにマッピングする方法の例を示しています。

Vega を編集する方法

パネルの上部にある編集をクリックして、Vega 編集モードに移動します。ここでは、UI でインタラクティブなグラフを作成する Vega 仕様を定義できます。グラフのあらゆる側面を変更できます。たとえば、タイトルを変更したり、別の配色を選択したり、曲線を接続された線としてではなく一連の点として表示したりできます。また、Vega 変換を使用して値の配列をヒストグラムにビン化するなど、データ自体に変更を加えることもできます。パネルプレビューはインタラクティブに更新されるため、Vega 仕様またはクエリを編集するときの変更の効果を確認できます。Vega のドキュメントとチュートリアルを参照してください。

フィールド参照

W&B からグラフにデータをプルするには、Vega 仕様の任意の場所に "${field:<field-name>}" 形式のテンプレート文字列を追加します。これにより、右側の グラフフィールド 領域にドロップダウンが作成され、ユーザーはクエリ結果の列を選択して Vega にマッピングできます。

フィールドのデフォルト値を設定するには、次の構文を使用します: "${field:<field-name>:<placeholder text>}"

グラフプリセットの保存

モーダルの下部にあるボタンを使用して、特定の可視化パネルに変更を適用します。または、Vega 仕様を保存して、プロジェクトの他の場所で使用することもできます。再利用可能なグラフ定義を保存するには、Vega エディターの上部にある 名前を付けて保存 をクリックし、プリセットに名前を付けます。

記事とガイド

一般的なユースケース

エラーバー付きのカスタム棒グラフ
カスタム x-y 座標を必要とするモデル検証メトリクスを表示する (適合率-再現率曲線など)
2つの異なるモデル/ experiment からのデータ分布をヒストグラムとしてオーバーレイする
トレーニング中の複数のポイントでのスナップショットを介してメトリクスの変化を表示する
W&B でまだ利用できない独自の可視化を作成する (そして、うまくいけばそれを世界と共有する)

4.2.1 - Tutorial: Use custom charts

W&B UI でカスタムチャート機能を使用する方法のチュートリアル

カスタムチャートを使用すると、パネルにロードするデータとその可視化を制御できます。

1. データを W&B にログ記録する

まず、スクリプトにデータをログ記録します。トレーニングの開始時に設定された単一のポイント（ハイパーパラメータなど）には、wandb.config を使用します。時間の経過に伴う複数のポイントには、wandb.log() を使用し、wandb.Table() を使用してカスタム 2D 配列をログ記録します。ログに記録されるキーごとに最大 10,000 個のデータポイントをログに記録することをお勧めします。

# データのカスタムテーブルをログ記録する
my_custom_data = [[x1, y1, z1], [x2, y2, z2]]
wandb.log(
  {"custom_data_table": wandb.Table(data=my_custom_data, columns=["x", "y", "z"])}
)

クイックなサンプルノートブックを試してデータテーブルをログに記録してください。次のステップでは、カスタムチャートを設定します。結果として得られるチャートがライブ Reportでどのように見えるかを確認してください。

2. クエリを作成する

可視化するデータをログに記録したら、プロジェクトページに移動し、**+**ボタンをクリックして新しいパネルを追加し、カスタムチャートを選択します。この Workspaceで一緒に操作できます。

クエリを追加する

「summary」をクリックし、「historyTable」を選択して、run の履歴からデータを取得する新しいクエリを設定します。
wandb.Table() をログに記録したキーを入力します。上記のコードスニペットでは、my_custom_table でした。サンプルノートブックでは、キーは pr_curve と roc_curve です。

Vega フィールドを設定する

クエリがこれらの列をロードするようになったので、Vega フィールドのドロップダウンメニューで選択するオプションとして使用できます。

x 軸: runSets_historyTable_r (再現率)
y 軸: runSets_historyTable_p (精度)
色: runSets_historyTable_c (クラスラベル)

3. チャートをカスタマイズする

見た目はかなり良いですが、散布図から折れ線グラフに切り替えたいと思います。「編集」をクリックして、この組み込みチャートの Vega 仕様を変更します。この Workspaceで一緒に操作できます。

Vega 仕様を更新して、可視化をカスタマイズしました。

プロット、凡例、x 軸、および y 軸のタイトルを追加します（各フィールドの「title」を設定します）。
「mark」の値を「point」から「line」に変更します。
使用されていない「size」フィールドを削除します。

これをプリセットとして保存して、このプロジェクトの他の場所で使用できるようにするには、ページの上部にある「名前を付けて保存」をクリックします。結果は次のようになり、ROC 曲線が表示されます。

ボーナス: 複合ヒストグラム

ヒストグラムは、数値分布を可視化して、より大きなデータセットを理解するのに役立ちます。複合ヒストグラムは、同じビンに複数の分布を表示し、異なるモデル間、またはモデル内の異なるクラス間で、2 つ以上のメトリクスを比較できます。運転シーンでオブジェクトを検出するセマンティックセグメンテーションモデルの場合、精度と intersection over union (IOU) の最適化の効果を比較したり、異なるモデルが車（データ内の大きく一般的な領域）と交通標識（はるかに小さく、一般的でない領域）をどの程度検出できるかを知りたい場合があります。デモ Colabでは、10 種類の生物のクラスのうち 2 つの信頼度スコアを比較できます。

カスタム複合ヒストグラムパネルの独自のバージョンを作成するには:

Workspace または Report で新しいカスタムチャートパネルを作成します（「カスタムチャート」可視化を追加することによって）。右上にある「編集」ボタンをクリックして、組み込みのパネルタイプから Vega 仕様を変更します。
その組み込みの Vega 仕様を、Vega の複合ヒストグラムの MVP コードに置き換えます。メインタイトル、軸タイトル、入力ドメイン、およびその他の詳細を、この Vega 仕様で直接Vega 構文を使用して変更できます（色を変更したり、3 番目のヒストグラムを追加したりすることもできます:)
右側のクエリを変更して、wandb ログから正しいデータをロードします。フィールド summaryTable を追加し、対応する tableKey を class_scores に設定して、run によってログに記録された wandb.Table をフェッチします。これにより、class_scores としてログに記録された wandb.Table の列を使用して、ドロップダウンメニューから 2 つのヒストグラムビンセット（red_bins と blue_bins）を設定できます。私の例では、赤いビンの動物クラスの予測スコアと、青いビンの植物の予測スコアを選択しました。
プレビューレンダリングに表示されるプロットに満足するまで、Vega 仕様とクエリの変更を続けることができます。完了したら、上部の「名前を付けて保存」をクリックし、カスタムプロットに名前を付けて再利用できるようにします。次に、「パネルライブラリから適用」をクリックして、プロットを完了します。

これは、非常に簡単な実験からの結果がどのように見えるかです。1 エポックでわずか 1000 個のサンプルでトレーニングすると、ほとんどの画像が植物ではないと非常に確信しており、どの画像が動物である可能性があるかについては非常に不確かなモデルが生成されます。

4.3 - Manage workspace, section, and panel settings

特定のワークスペースページ内には、ワークスペース、セクション、パネルという3つの異なる設定レベルがあります。ワークスペースの設定は、ワークスペース全体に適用されます。セクションの設定は、セクション内のすべてのパネルに適用されます。パネルの設定は、個々のパネルに適用されます。

ワークスペースの設定

ワークスペースの設定は、すべてのセクションと、それらのセクション内のすべてのパネルに適用されます。編集できるワークスペースの設定には、ワークスペースのレイアウト と 折れ線グラフ の2種類があります。ワークスペースのレイアウト はワークスペースの構造を決定し、折れ線グラフ の設定はワークスペース内の折れ線グラフのデフォルト設定を制御します。

このワークスペースの全体的な構造に適用される設定を編集するには:

プロジェクトのワークスペースに移動します。
New report ボタンの横にある歯車アイコンをクリックして、ワークスペースの設定を表示します。
ワークスペースのレイアウトを変更するには Workspace layout を選択し、ワークスペース内の折れ線グラフのデフォルト設定を構成するには Line plots を選択します。

ワークスペースのレイアウトオプション

ワークスペースのレイアウトを構成して、ワークスペースの全体的な構造を定義します。これには、セクション分割ロジックとパネルの構成が含まれます。

ワークスペースのレイアウトオプションページには、ワークスペースがパネルを自動的に生成するか、手動で生成するかが表示されます。ワークスペースのパネル生成モードを調整するには、Panels を参照してください。

次の表は、各ワークスペースのレイアウトオプションについて説明したものです。

ワークスペースの設定	説明
検索時に空のセクションを非表示にする	パネルを検索するときに、パネルを含まないセクションを非表示にします。
パネルをアルファベット順に並べ替える	ワークスペース内のパネルをアルファベット順に並べ替えます。
セクションの構成	既存のすべてのセクションとパネルを削除し、新しいセクション名で再作成します。新しく作成されたセクションを、最初のプレフィックスまたは最後のプレフィックスでグループ化します。

W&B は、最後のプレフィックスでグループ化するのではなく、最初のプレフィックスでセクションを構成することを推奨します。最初のプレフィックスでグループ化すると、セクションの数が減り、パフォーマンスが向上する可能性があります。

折れ線グラフのオプション

Line plots ワークスペースの設定を変更して、ワークスペース内の折れ線グラフのグローバルなデフォルトとカスタムルールを設定します。

Line plots の設定では、Data と Display preferences という2つのメイン設定を編集できます。Data タブには、次の設定が含まれています。

折れ線グラフの設定	説明
X軸	折れ線グラフのX軸のスケール。X軸はデフォルトで Step に設定されています。X軸のオプションのリストについては、次の表を参照してください。
範囲	X軸に表示する最小値と最大値の設定。
Smoothing	折れ線グラフの Smoothing を変更します。Smoothing の詳細については、Smooth line plots を参照してください。
Outliers	デフォルトのプロットの最小スケールと最大スケールから外れ値を排除するためにリスケールします。
Point aggregation method	Data Visualization の精度とパフォーマンスを向上させます。詳細については、Point aggregation を参照してください。
Max number of runs or groups	折れ線グラフに表示される Runs またはグループの数を制限します。

Step に加えて、X軸には次のオプションがあります。

X軸オプション	説明
相対時間 (Wall)	プロセスの開始からのタイムスタンプ。たとえば、run を開始し、翌日にその run を再開するとします。その後、何かを log に記録すると、記録されたポイントは24時間になります。
相対時間 (Process)	実行中のプロセス内のタイムスタンプ。たとえば、run を開始して10秒間続行するとします。翌日にその run を再開します。ポイントは10秒として記録されます。
Wall Time	グラフ上の最初の run の開始からの経過時間 (分)。
Step	`wandb.log()` を呼び出すたびに増分します。

個々の折れ線グラフの編集方法については、折れ線グラフの Edit line panel settings を参照してください。

Display preferences タブでは、次の設定を切り替えることができます。

表示設定	説明
Remove legends from all panels	パネルの凡例を削除します
Display colored run names in tooltips	ツールチップ内に Runs を色付きのテキストとして表示します
Only show highlighted run in companion chart tooltip	チャートのツールチップに強調表示された Runs のみを表示します
Number of runs shown in tooltips	ツールチップに Runs の数を表示します
Display full run names on the primary chart tooltip	チャートのツールチップに run のフルネームを表示します

セクションの設定

セクションの設定は、そのセクション内のすべてのパネルに適用されます。ワークスペースのセクション内では、パネルの並べ替え、パネルの再配置、セクション名の変更を行うことができます。

セクションの設定を変更するには、セクションの右上隅にある3つの水平ドット (…) を選択します。

ドロップダウンから、セクション全体に適用される次の設定を編集できます。

セクションの設定	説明
Rename a section	セクションの名前を変更します
Sort panels A-Z	セクション内のパネルをアルファベット順に並べ替えます
Rearrange panels	セクション内のパネルを選択してドラッグし、パネルを手動で並べ替えます

次のアニメーションは、セクション内のパネルを再配置する方法を示しています。

上記の表で説明されている設定に加えて、Add section below、Add section above、Delete section、Add section to report など、ワークスペースでのセクションの表示方法を編集することもできます。

パネルの設定

個々のパネルの設定をカスタマイズして、同じプロット上に複数の線を比較したり、カスタム軸を計算したり、ラベルの名前を変更したりできます。パネルの設定を編集するには:

編集するパネルにマウスを合わせます。
表示される鉛筆アイコンを選択します。
表示されるモーダル内で、パネルのデータ、表示設定などに関連する設定を編集できます。

パネルに適用できる設定の完全なリストについては、Edit line panel settings を参照してください。

4.4 - Settings

Weights & Biases の設定ページを使用して、個々のユーザープロフィールまたは Team の設定をカスタマイズします。

個々のユーザーアカウント内では、プロフィール画像、表示名、地理的な場所、自己紹介情報、アカウントに関連付けられたメールアドレスを編集したり、runs のアラートを管理したりできます。設定ページを使用して、GitHub リポジトリをリンクしたり、アカウントを削除したりすることもできます。詳細については、ユーザー settings を参照してください。

Team settings ページを使用して、新しいメンバーを Team に招待または削除したり、Team runs のアラートを管理したり、プライバシー設定を変更したり、ストレージの使用状況を表示および管理したりできます。Team settings の詳細については、Team settings を参照してください。

4.4.1 - Manage user settings

プロフィール情報、アカウントのデフォルト、アラート、ベータ版製品への参加、GitHub インテグレーション、ストレージ使用量、アカウントの有効化を管理し、ユーザー設定で Teams を作成します。

ユーザープロファイルページに移動し、右上隅にあるユーザーアイコンを選択します。ドロップダウンから、設定を選択します。

プロフィール

プロフィール セクションでは、アカウント名と所属機関を管理および変更できます。オプションで、略歴、場所、個人または所属機関のウェブサイトへのリンクを追加したり、プロフィール画像をアップロードしたりできます。

イントロダクションを編集する

イントロダクションを編集するには、プロフィールの最上部にある編集をクリックします。開く WYSIWYG エディターは Markdown をサポートしています。

行を編集するには、それをクリックします。時間を節約するために、/ と入力し、リストから Markdown を選択できます。
項目のドラッグハンドルを使用して、移動します。
ブロックを削除するには、ドラッグハンドルをクリックし、削除をクリックします。
変更を保存するには、保存をクリックします。

ソーシャルバッジを追加する

X で @weights_biases アカウントのフォローバッジを追加するには、バッジ画像を指す HTML <img> タグを含む Markdown スタイルのリンクを追加できます。

[<img src="https://img.shields.io/twitter/follow/weights_biases?style=social" alt="X: @weights_biases" >](https://x.com/intent/follow?screen_name=weights_biases)

<img> タグでは、width、height、またはその両方を指定できます。いずれか一方のみを指定した場合、画像のプロポーションは維持されます。

Teams

Team セクションで新しい team を作成します。新しい team を作成するには、新しい team ボタンを選択し、以下を入力します。

Team 名 - team の名前。team 名は一意である必要があります。Team 名は変更できません。
Team タイプ - 仕事または学術ボタンを選択します。
会社/組織 - team の会社または組織の名前を入力します。ドロップダウンメニューを選択して、会社または組織を選択します。オプションで、新しい組織を入力できます。

管理アカウントのみが team を作成できます。

ベータ機能

ベータ機能 セクションでは、オプションで楽しいアドオンや開発中の新製品の先行プレビューを有効にできます。有効にするベータ機能の横にあるトグルスイッチを選択します。

アラート

wandb.alert() で、run がクラッシュまたは終了した場合、またはカスタムアラートを設定した場合に通知を受け取ります。メールまたは Slack で通知を受信します。アラートを受信するイベントタイプの横にあるスイッチを切り替えます。

Runs finished: Weights and Biases の run が正常に終了したかどうか。
Run crashed: run が完了しなかった場合に通知します。

アラートの設定と管理方法の詳細については、wandb.alert でアラートを送信を参照してください。

個人の GitHub integration

個人の Github アカウントを接続します。Github アカウントを接続するには:

Github に接続 ボタンを選択します。これにより、オープン認証 (OAuth) ページにリダイレクトされます。
組織アクセス セクションで、アクセスを許可する組織を選択します。
wandb を認証します。

アカウントを削除する

アカウントを削除 ボタンを選択して、アカウントを削除します。

アカウントの削除は元に戻せません。

ストレージ

ストレージ セクションでは、アカウントが Weights and Biases サーバーで使用した総メモリ使用量を説明します。デフォルトのストレージプランは 100GB です。ストレージと価格の詳細については、価格ページを参照してください。

4.4.2 - Manage billing settings

組織の課金設定を管理

ユーザープロフィールページに移動し、右上隅にあるユーザーアイコンを選択します。ドロップダウンから、Billing を選択するか、Settings を選択し、Billing タブを選択します。

プラン詳細

Plan details セクションでは、組織の現在のプラン、料金、制限、使用状況の概要が示されます。

ユーザーの詳細とリストを表示するには、Manage users をクリックします。
使用状況の詳細を表示するには、View usage をクリックします。
組織が使用するストレージの量（無料と有料の両方）。ここから、追加のストレージを購入したり、現在使用中のストレージを管理したりできます。ストレージの設定の詳細をご覧ください。

ここから、プランを比較したり、営業担当者と話をしたりできます。

プランの使用状況

このセクションでは、現在の使用状況を視覚的にまとめ、今後の使用料金を表示します。月ごとの使用状況の詳細な分析情報を得るには、個々のタイルで View usage をクリックします。カレンダー月、Team、または Project ごとに使用状況をエクスポートするには、Export CSV をクリックします。

使用状況アラート

使用状況アラートは、Enterprise plan では利用できません。

有料プランをご利用の組織の場合、管理者は、特定のしきい値に達すると、1 回の請求期間につき 1 回、メールでアラートを受信します。また、請求管理者の場合は、組織の制限を増やす方法、それ以外の場合は、請求管理者に連絡する方法の詳細も記載されています。Pro plan では、請求管理者のみが使用状況アラートを受信します。

これらのアラートは構成できず、次の場合に送信されます。

組織が、プランに応じた使用量のカテゴリの月間制限に近づいている場合（使用時間の 85%）および制限の 100% に達した場合。
組織の請求期間の累積平均料金が、200 ドル、450 ドル、700 ドル、および 1000 ドルのしきい値を超えた場合。これらの超過料金は、組織が追跡時間、ストレージ、または Weave data ingestion に対して、プランに含まれる量よりも多くの使用量を累積した場合に発生します。

使用状況または請求に関するご質問は、アカウントTeamまたはサポートにお問い合わせください。

支払い方法

このセクションには、組織に登録されている支払い方法が表示されます。支払い方法を追加していない場合は、プランをアップグレードするか、有料ストレージを追加するときに、追加するように求められます。

請求管理者

このセクションには、現在の請求管理者が表示されます。請求管理者は組織の管理者であり、請求関連のすべてのメールを受信し、支払い方法を表示および管理できます。

W&B Dedicated Cloud では、複数のユーザーが請求管理者になることができます。W&B Multi-tenant Cloud では、一度に 1 人のユーザーのみが請求管理者になることができます。

請求管理者を変更するか、ロールを追加のユーザーに割り当てるには、次の手順に従います。

Manage roles をクリックします。
ユーザーを検索します。
そのユーザーの行にある Billing admin フィールドをクリックします。
概要を読んでから、Change billing user をクリックします。

請求書

クレジットカードで支払う場合、このセクションでは毎月の請求書を表示できます。

銀行振込で支払う Enterprise アカウントの場合、このセクションは空白です。ご不明な点がございましたら、アカウントTeamにお問い合わせください。
組織が料金を発生させない場合、請求書は生成されません。

4.4.3 - Manage team settings

Team Settings ページで、 Team のメンバー、アバター、アラート、およびプライバシー設定を管理します。

チーム設定

チームのメンバー、アバター、アラート、プライバシー、利用状況などの設定を変更します。Organization の管理者とチームの管理者は、チームの設定を表示および編集できます。

管理アカウントタイプのみが、チーム設定を変更したり、チームからメンバーを削除したりできます。

メンバー

「メンバー」セクションには、保留中の招待と、チームへの参加招待を承認したメンバーのリストが表示されます。リストに表示される各メンバーには、メンバーの名前、ユーザー名、メールアドレス、チームの役割、および Models と Weave へのアクセス権限が表示されます。これらは Organization から継承されます。標準のチームの役割 Admin 、 Member 、および View-only から選択できます。Organization がカスタムロールを作成している場合は、代わりにカスタムロールを割り当てることができます。

チームの作成方法、チームの管理方法、チームのメンバーシップと役割の管理方法については、チームの追加と管理を参照してください。誰が新しいメンバーを招待できるかを設定し、チームのその他のプライバシー設定を構成するには、プライバシーを参照してください。

アバター

アバターセクションに移動し、画像をアップロードしてアバターを設定します。

アバターを更新を選択して、ファイルダイアログを表示します。
ファイルダイアログから、使用する画像を選択します。

アラート

run がクラッシュ、完了、またはカスタムアラートを設定したときに、チームに通知します。チームは、メールまたは Slack でアラートを受信できます。

アラートを受信するイベントタイプの横にあるスイッチを切り替えます。Weights and Biases は、デフォルトで次のイベントタイプのオプションを提供します。

Runs finished: Weights and Biases の run が正常に完了したかどうか。
Run crashed: run が完了しなかった場合。

アラートの設定と管理方法の詳細については、wandb.alert でアラートを送信を参照してください。

Slack 通知

チームの Automations が、新しい Artifact が作成されたときや、run メトリクスが定義されたしきい値を満たしたときなど、Registry またはプロジェクトでイベントが発生したときに通知を送信できる Slack の送信先を設定します。Slack オートメーションの作成を参照してください。

This feature is available for all Enterprise licenses.

Webhook

チームの Automations が、新しい Artifact が作成されたときや、run メトリクスが定義されたしきい値を満たしたときなど、Registry またはプロジェクトでイベントが発生したときに実行できる Webhook を設定します。Webhook オートメーションの作成を参照してください。

This feature is available for all Enterprise licenses.

プライバシー

プライバシーセクションに移動して、プライバシー設定を変更します。プライバシー設定を変更できるのは、Organization の管理者のみです。

将来のプロジェクトを公開したり、 Reports を公開共有したりする機能をオフにします。
チーム管理者だけでなく、チームメンバーが他のメンバーを招待できるようにします。
コードの保存をデフォルトでオンにするかどうかを管理します。

利用状況

利用状況セクションでは、チームが Weights and Biases サーバーで使用した総メモリ使用量について説明します。デフォルトのストレージプランは 100GB です。ストレージと価格の詳細については、価格ページを参照してください。

ストレージ

ストレージセクションでは、チームのデータに使用されているクラウドストレージバケットの設定について説明します。詳細については、セキュアストレージコネクタを参照するか、セルフホスティングの場合は W&B Server のドキュメントを確認してください。

4.4.4 - Manage email settings

[ 設定 ] ページからメールを管理します。

W&B プロフィールの設定ページで、メールの種類やプライマリメールアドレスの追加、削除、管理ができます。W&B ダッシュボードの右上にあるプロフィールアイコンを選択します。ドロップダウンから、設定を選択します。設定ページ内で、Emails ダッシュボードまでスクロールします。

プライマリメールの管理

プライマリメールは 😎 の絵文字でマークされています。プライマリメールは、W&B アカウントを作成した際に提供したメールアドレスで自動的に定義されます。

ケバブドロップダウンを選択して、Weights And Biases アカウントに関連付けられたプライマリメールを変更します。

検証済みのメールのみをプライマリとして設定できます。

メールの追加

+ Add Email を選択して、メールを追加します。これにより、Auth0 ページに移動します。新しいメールの認証情報を入力するか、シングルサインオン (SSO) を使用して接続できます。

メールの削除

ケバブドロップダウンを選択し、Delete Emails を選択して、W&B アカウントに登録されているメールを削除します。

プライマリメールは削除できません。削除する前に、別のメールをプライマリメールとして設定する必要があります。

ログイン方法

[ログイン方法] 列には、アカウントに関連付けられているログイン方法が表示されます。

W&B アカウントを作成すると、確認メールがメールアカウントに送信されます。メールアカウントは、メールアドレスを確認するまで検証されていないと見なされます。未検証のメールは赤で表示されます。

メールアドレスで再度ログインして、メールアカウントに送信された最初の確認メールが既になくても、2 通目の確認メールを取得してみてください。

アカウントログインの問題については、support@wandb.com までお問い合わせください。

4.4.5 - Manage teams

同僚と共同作業し、結果を共有して、チーム全体のすべての実験を追跡します。

W&B Teams を、より優れたモデルをより迅速に構築するための ML チーム用の一元的なワークスペースとして使用します。

チームが試したすべての実験を追跡し、作業の重複をなくします。
以前にトレーニングしたモデルを保存して再現します。
上司や共同研究者と進捗状況や結果を共有します。
回帰を検出し、パフォーマンスが低下した場合に直ちに警告を受けます。
モデルのパフォーマンスを評価し、モデルのバージョンを比較します。

コラボレーションチームを作成する

無料の W&B アカウントにサインアップまたはログインします。
ナビゲーションバーの [Invite Team（チームを招待）] をクリックします。
チームを作成し、共同研究者を招待します。
チームの設定については、チームの設定を管理を参照してください。

注：新しいチームを作成できるのは、組織の管理者のみです。

チームプロファイルを作成する

チームのプロファイルページをカスタマイズして、イントロダクションを表示したり、一般公開またはチームメンバーに公開されている Reports と Projects を紹介したりできます。 Reports 、 Projects 、および外部リンクを提示します。

最高の公開 Reports を紹介して、最高の research を訪問者にアピールします
最もアクティブな Projects を紹介して、チームメイトが見つけやすくします
会社や research ラボのウェブサイト、および公開した論文への外部リンクを追加して、共同研究者を見つけます

チームメンバーを削除する

チーム管理者は、チームの設定ページを開き、退職するメンバーの名前の横にある削除ボタンをクリックできます。 run は、ユーザーが退席した後もチームに記録されたままになります。

チームの役割と権限を管理する

同僚をチームに招待するときに、チームの役割を選択します。次のチームの役割オプションがあります。

管理者：チーム管理者は、他の管理者またはチームメンバーを追加および削除できます。すべての Projects を変更する権限と、完全な削除権限を持っています。これには、 Runs 、 Projects 、 Artifacts 、および Sweeps の削除が含まれますが、これらに限定されません。
メンバー：チームの通常のメンバー。デフォルトでは、管理者のみがチームメンバーを招待できます。この振る舞いを変更するには、チームの設定を管理を参照してください。

チームメンバーは、自分が作成した run のみ削除できます。メンバー A と B がいるとします。メンバー B は、 run をチーム B の Project からメンバー A が所有する別の Project に移動します。メンバー A は、メンバー B がメンバー A の Project に移動した run を削除できません。管理者は、チームメンバーが作成した Runs と Sweep Runs を管理できます。

表示のみ（エンタープライズ限定機能）：表示のみのメンバーは、 Runs 、 Reports 、 Workspace など、チーム内のアセットを表示できます。 Reports をフォローしてコメントできますが、 Project の概要、 Reports 、 Runs を作成、編集、または削除することはできません。
カスタムロール（エンタープライズ限定機能）：カスタムロールを使用すると、組織管理者は、表示のみまたはメンバーロールのいずれかに基づいて、追加の権限を付与して、きめ細かいアクセス制御を実現する新しいロールを作成できます。次に、チーム管理者は、これらのカスタムロールをそれぞれのチームのユーザーに割り当てることができます。詳細については、W&B Teams のカスタムロールの紹介を参照してください。
サービスアカウント（エンタープライズ限定機能）：サービスアカウントを使用してワークフローを自動化するを参照してください。

W&B は、チームに複数の管理者を持つことを推奨しています。これは、プライマリアドミンが利用できない場合でも、管理操作を継続できるようにするためのベストプラクティスです。

チームの設定

チーム設定を使用すると、チームとそのメンバーの設定を管理できます。これらの権限を使用すると、W&B 内でチームを効果的に監督および整理できます。

権限	表示のみ	チームメンバー	チーム管理者
チームメンバーを追加する			X
チームメンバーを削除する			X
チーム設定を管理する			X

レジストリ

次の表に、特定のチームのすべての Projects に適用される権限を示します。

権限	表示のみ	チームメンバー	レジストリ管理者	チーム管理者
エイリアスを追加する		X	X	X
モデルをレジストリに追加する		X	X	X
レジストリでモデルを表示する	X	X	X	X
モデルをダウンロードする	X	X	X	X
レジストリ管理者を追加または削除する			X	X
保護されたエイリアスを追加または削除する			X

保護されたエイリアスの詳細については、レジストリアクセス制御を参照してください。

Reports

Report 権限は、 Reports を作成、表示、および編集するためのアクセスを許可します。次の表に、特定のチームのすべての Reports に適用される権限を示します。

権限	表示のみ	チームメンバー	チーム管理者
Reports を表示する	X	X	X
Reports を作成する		X	X
Reports を編集する		X （チームメンバーは自分の Reports のみ編集できます）	X
Reports を削除する		X （チームメンバーは自分の Reports のみ編集できます）	X

実験管理

次の表に、特定のチームのすべての実験管理に適用される権限を示します。

権限	表示のみ	チームメンバー	チーム管理者
実験管理メタデータ（履歴メトリクス、システムメトリクス、ファイル、ログを含む）を表示する	X	X	X
実験管理パネルとワークスペースを編集する		X	X
実験管理をログに記録する		X	X
実験管理を削除する		X （チームメンバーは自分が作成した実験管理のみ削除できます）	X
実験管理を停止する		X （チームメンバーは自分が作成した実験管理のみ停止できます）	X

Artifacts

次の表に、特定のチームのすべての Artifacts に適用される権限を示します。

権限	表示のみ	チームメンバー	チーム管理者
Artifacts を表示する	X	X	X
Artifacts を作成する		X	X
Artifacts を削除する		X	X
メタデータを編集する		X	X
エイリアスを編集する		X	X
エイリアスを削除する		X	X
Artifacts をダウンロードする		X	X

システム設定（W&B Server のみ）

システム権限を使用して、チームとそのメンバーを作成および管理し、システム設定を調整します。これらの権限により、W&B インスタンスを効果的に管理および保守できます。

権限	表示のみ	チームメンバー	チーム管理者	システム管理者
システム設定を構成する				X
チームを作成/削除する				X

チームサービスアカウントの振る舞い

トレーニング環境でチームを構成する場合、そのチームのサービスアカウントを使用して、そのチーム内のプライベートまたはパブリック Projects で Runs を記録できます。さらに、環境に WANDB_USERNAME または WANDB_USER_EMAIL 変数が存在し、参照されているユーザーがそのチームに属している場合、それらの Runs をユーザーに帰属させることができます。
トレーニング環境でチームを構成しない場合にサービスアカウントを使用すると、 Runs はそのサービスアカウントの親チーム内の名前付き Project に記録されます。この場合も同様に、環境に WANDB_USERNAME または WANDB_USER_EMAIL 変数が存在し、参照されているユーザーがサービスアカウントの親チームに属している場合、 Runs をユーザーに帰属させることができます。
サービスアカウントは、親チームとは異なるチームのプライベート Project に Runs を記録できません。サービスアカウントは、 Project が Open Project の可視性に設定されている場合にのみ、 Runs を Project に記録できます。

チームトライアル

W&B のプランの詳細については、価格ページを参照してください。ダッシュボード UI またはエクスポート APIを使用して、いつでもすべてのデータをダウンロードできます。

プライバシー設定

チーム設定ページで、すべてのチーム Project のプライバシー設定を確認できます。 app.wandb.ai/teams/your-team-name

高度な設定

セキュアストレージコネクタ

チームレベルのセキュアストレージコネクタを使用すると、チームは W&B で独自のクラウドストレージバケットを使用できます。これにより、機密性の高いデータや厳格なコンプライアンス要件を持つチームに対して、より優れたデータアクセス制御とデータ分離が提供されます。詳細については、セキュアストレージコネクタを参照してください。

4.4.6 - Manage storage

W&B のデータストレージを管理する方法。

ストレージ制限に近づいている、または超過している場合、データを管理するための複数の方法があります。最適な方法は、アカウントの種類と現在のプロジェクトの設定によって異なります。

ストレージ消費量の管理

W&B は、ストレージ消費量を最適化するためのさまざまなメソッドを提供しています。

参照 Artifacts を使用して、W&B ストレージにアップロードする代わりに、W&B システムの外部に保存されたファイルを追跡します。
ストレージに外部クラウドストレージバケットを使用します。（エンタープライズのみ）

データを削除する

ストレージ制限内に収まるように、データを削除することもできます。これを行うには、いくつかの方法があります。

アプリ UI を使用してインタラクティブにデータを削除します。
Artifacts に TTL ポリシーを設定して、自動的に削除されるようにします。

4.4.7 - System metrics

W&B によって自動的にログされるメトリクス。

このページでは、W&B SDK によって追跡されるシステムメトリクスの詳細な情報を提供します。

wandb は、システムメトリクスを15秒ごとに自動的にログに記録します。

CPU

プロセスの CPU 使用率 (%) (CPU)

利用可能な CPU 数で正規化された、プロセスによる CPU 使用率の割合。

W&B は、このメトリクスに cpu タグを割り当てます。

プロセスの CPU スレッド数

プロセスで使用されるスレッドの数。

W&B は、このメトリクスに proc.cpu.threads タグを割り当てます。

Disk

デフォルトでは、使用状況メトリクスは / パスに対して収集されます。監視するパスを構成するには、次の設定を使用します。

run = wandb.init(
    settings=wandb.Settings(
        x_stats_disk_paths=("/System/Volumes/Data", "/home", "/mnt/data"),
    ),
)

ディスク使用率 (%)

指定されたパスの合計システムディスク使用量をパーセンテージで表します。

W&B は、このメトリクスに disk.{path}.usagePercent タグを割り当てます。

ディスク使用量

指定されたパスの合計システムディスク使用量をギガバイト (GB) で表します。アクセス可能なパスがサンプリングされ、各パスのディスク使用量 (GB 単位) がサンプルに追加されます。

W&B は、このメトリクスに disk.{path}.usageGB タグを割り当てます。

Disk In

合計システムディスクの読み取り量をメガバイト (MB) で示します。最初のサンプルが取得されると、最初のディスク読み取りバイト数が記録されます。後続のサンプルでは、現在の読み取りバイト数と初期値の差が計算されます。

W&B は、このメトリクスに disk.in タグを割り当てます。

Disk Out

合計システムディスクの書き込み量をメガバイト (MB) で表します。 Disk In と同様に、最初のサンプルが取得されると、最初のディスク書き込みバイト数が記録されます。後続のサンプルでは、現在の書き込みバイト数と初期値の差が計算されます。

W&B は、このメトリクスに disk.out タグを割り当てます。

Memory

プロセスのメモリ RSS

プロセスのメモリ常駐セットサイズ (RSS) をメガバイト (MB) で表します。RSS は、メインメモリ (RAM) に保持されているプロセスによって占有されているメモリの部分です。

W&B は、このメトリクスに proc.memory.rssMB タグを割り当てます。

プロセスのメモリ使用率 (%)

利用可能な合計メモリに対するプロセスのメモリ使用量をパーセンテージで示します。

W&B は、このメトリクスに proc.memory.percent タグを割り当てます。

メモリ使用率 (%)

利用可能な合計メモリに対する合計システムメモリ使用量をパーセンテージで表します。

W&B は、このメトリクスに memory_percent タグを割り当てます。

利用可能なメモリ

利用可能な合計システムメモリをメガバイト (MB) で示します。

W&B は、このメトリクスに proc.memory.availableMB タグを割り当てます。

Network

ネットワーク送信

ネットワーク経由で送信された合計バイト数を表します。最初のバイト送信は、メトリクスが最初に初期化されたときに記録されます。後続のサンプルでは、現在のバイト送信数と初期値の差が計算されます。

W&B は、このメトリクスに network.sent タグを割り当てます。

ネットワーク受信

ネットワーク経由で受信した合計バイト数を示します。ネットワーク送信と同様に、最初のバイト受信は、メトリクスが最初に初期化されたときに記録されます。後続のサンプルでは、現在のバイト受信数と初期値の差が計算されます。

W&B は、このメトリクスに network.recv タグを割り当てます。

NVIDIA GPU

以下に説明するメトリクスに加えて、プロセスまたはその子孫が特定の GPU を使用する場合、W&B は対応するメトリクスを gpu.process.{gpu_index}.{metric_name} としてキャプチャします。

GPU メモリ使用率

各 GPU の GPU メモリ使用率をパーセントで表します。

W&B は、このメトリクスに gpu.{gpu_index}.memory タグを割り当てます。

GPU 割り当て済みメモリ

各 GPU の利用可能な合計メモリに対する GPU 割り当て済みメモリをパーセンテージで示します。

W&B は、このメトリクスに gpu.{gpu_index}.memoryAllocated タグを割り当てます。

GPU 割り当て済みメモリ (バイト単位)

各 GPU の GPU 割り当て済みメモリをバイト単位で指定します。

W&B は、このメトリクスに gpu.{gpu_index}.memoryAllocatedBytes タグを割り当てます。

GPU 使用率

各 GPU の GPU 使用率をパーセントで反映します。

W&B は、このメトリクスに gpu.{gpu_index}.gpu タグを割り当てます。

GPU 温度

各 GPU の GPU 温度を摂氏で示します。

W&B は、このメトリクスに gpu.{gpu_index}.temp タグを割り当てます。

GPU 消費電力 (ワット単位)

各 GPU の GPU 消費電力をワット単位で示します。

W&B は、このメトリクスに gpu.{gpu_index}.powerWatts タグを割り当てます。

GPU 消費電力 (%)

各 GPU の電力容量に対する GPU 消費電力をパーセンテージで反映します。

W&B は、このメトリクスに gpu.{gpu_index}.powerPercent タグを割り当てます。

GPU SM クロック速度

GPU 上のストリーミングマルチプロセッサ (SM) のクロック速度を MHz で表します。このメトリクスは、計算タスクを担当する GPU コア内の処理速度を示します。

W&B は、このメトリクスに gpu.{gpu_index}.smClock タグを割り当てます。

GPU メモリクロック速度

GPU メモリのクロック速度を MHz で表します。これは、GPU メモリとプロセッシングコア間のデータ転送速度に影響します。

W&B は、このメトリクスに gpu.{gpu_index}.memoryClock タグを割り当てます。

GPU グラフィックスクロック速度

GPU 上のグラフィックスレンダリング操作のベースクロック速度を MHz で表します。このメトリクスは、可視化またはレンダリングタスク中のパフォーマンスを反映することがよくあります。

W&B は、このメトリクスに gpu.{gpu_index}.graphicsClock タグを割り当てます。

GPU 修正済みメモリエラー

W&B がエラーチェックプロトコルによって自動的に修正する GPU 上のメモリエラーの数を追跡します。これは、回復可能なハードウェアの問題を示します。

W&B は、このメトリクスに gpu.{gpu_index}.correctedMemoryErrors タグを割り当てます。

GPU 未修正メモリエラー

W&B が修正しなかった GPU 上のメモリエラーの数を追跡します。これは、処理の信頼性に影響を与える可能性のある回復不能なエラーを示します。

W&B は、このメトリクスに gpu.{gpu_index}.unCorrectedMemoryErrors タグを割り当てます。

GPU エンコーダー使用率

GPU のビデオエンコーダーの使用率をパーセンテージで表します。これは、エンコードタスク (ビデオレンダリングなど) の実行時にエンコーダーの負荷を示します。

W&B は、このメトリクスに gpu.{gpu_index}.encoderUtilization タグを割り当てます。

AMD GPU

W&B は、AMD が提供する rocm-smi ツール (rocm-smi -a --json) の出力からメトリクスを抽出します。

ROCm 6.x (最新) および 5.x 形式がサポートされています。ROCm 形式の詳細については、AMD ROCm ドキュメントを参照してください。新しい形式には、より詳細な情報が含まれています。

AMD GPU 使用率

各 AMD GPU デバイスの GPU 使用率をパーセントで表します。

W&B は、このメトリクスに gpu.{gpu_index}.gpu タグを割り当てます。

AMD GPU 割り当て済みメモリ

各 AMD GPU デバイスの利用可能な合計メモリに対する GPU 割り当て済みメモリをパーセンテージで示します。

W&B は、このメトリクスに gpu.{gpu_index}.memoryAllocated タグを割り当てます。

AMD GPU 温度

各 AMD GPU デバイスの GPU 温度を摂氏で示します。

W&B は、このメトリクスに gpu.{gpu_index}.temp タグを割り当てます。

AMD GPU 消費電力 (ワット単位)

各 AMD GPU デバイスの GPU 消費電力をワット単位で示します。

W&B は、このメトリクスに gpu.{gpu_index}.powerWatts タグを割り当てます。

AMD GPU 消費電力 (%)

各 AMD GPU デバイスの電力容量に対する GPU 消費電力をパーセンテージで反映します。

W&B は、このメトリクスに gpu.{gpu_index}.powerPercent タグを割り当てます。

Apple ARM Mac GPU

Apple GPU 使用率

特に ARM Mac 上の Apple GPU デバイスの GPU 使用率をパーセントで示します。

W&B は、このメトリクスに gpu.0.gpu タグを割り当てます。

Apple GPU 割り当て済みメモリ

ARM Mac 上の Apple GPU デバイスの利用可能な合計メモリに対する GPU 割り当て済みメモリをパーセンテージで示します。

W&B は、このメトリクスに gpu.0.memoryAllocated タグを割り当てます。

Apple GPU 温度

ARM Mac 上の Apple GPU デバイスの GPU 温度を摂氏で示します。

W&B は、このメトリクスに gpu.0.temp タグを割り当てます。

Apple GPU 消費電力 (ワット単位)

ARM Mac 上の Apple GPU デバイスの GPU 消費電力をワット単位で示します。

W&B は、このメトリクスに gpu.0.powerWatts タグを割り当てます。

Apple GPU 消費電力 (%)

ARM Mac 上の Apple GPU デバイスの電力容量に対する GPU 消費電力をパーセンテージで示します。

W&B は、このメトリクスに gpu.0.powerPercent タグを割り当てます。

Graphcore IPU

Graphcore IPU (Intelligence Processing Units) は、機械学習タスク専用に設計された独自のハードウェアアクセラレータです。

IPU デバイスメトリクス

これらのメトリクスは、特定の IPU デバイスのさまざまな統計を表します。各メトリクスには、デバイス ID (device_id) と、それを識別するためのメトリックキー (metric_key) があります。W&B は、このメトリクスに ipu.{device_id}.{metric_key} タグを割り当てます。

メトリクスは、Graphcore の gcipuinfo バイナリと対話する独自の gcipuinfo ライブラリを使用して抽出されます。sample メソッドは、プロセス ID (pid) に関連付けられた各 IPU デバイスのこれらのメトリクスを取得します。時間の経過とともに変化するメトリクス、またはデバイスのメトリクスが初めて取得された場合にのみ、冗長なデータのログ記録を回避するためにログに記録されます。

各メトリクスについて、メソッド parse_metric が使用されて、メトリクスの値をその生の文字列表現から抽出します。次に、メトリクスは aggregate メソッドを使用して複数のサンプルに集約されます。

以下に、利用可能なメトリクスとその単位を示します。

ボードの平均温度 (average board temp (C)): IPU ボードの温度 (摂氏)。
ダイの平均温度 (average die temp (C)): IPU ダイの温度 (摂氏)。
クロック速度 (clock (MHz)): IPU のクロック速度 (MHz)。
IPU 電力 (ipu power (W)): IPU の消費電力 (ワット)。
IPU 使用率 (ipu utilisation (%)): IPU 使用率 (パーセント)。
IPU セッション使用率 (ipu utilisation (session) (%)): 現在のセッションに固有の IPU 使用率 (パーセント)。
データリンク速度 (speed (GT/s)): データ伝送速度 (ギガ転送/秒)。

Google Cloud TPU

Tensor Processing Units (TPU) は、機械学習ワークロードを高速化するために使用される Google 独自のカスタム開発 ASIC (特定用途向け集積回路) です。

TPU メモリ使用量

TPU コアあたりの現在の高帯域幅メモリ使用量 (バイト単位)。

W&B は、このメトリクスに tpu.{tpu_index}.memoryUsageBytes タグを割り当てます。

TPU メモリ使用量 (%)

TPU コアあたりの現在の高帯域幅メモリ使用量 (パーセント)。

W&B は、このメトリクスに tpu.{tpu_index}.memoryUsageBytes タグを割り当てます。

TPU デューティサイクル

TPU デバイスあたりの TensorCore デューティサイクル (%)。アクセラレータ TensorCore がアクティブに処理していたサンプル期間中の時間の割合を追跡します。値が大きいほど、TensorCore の使用率が高いことを意味します。

W&B は、このメトリクスに tpu.{tpu_index}.dutyCycle タグを割り当てます。

AWS Trainium

AWS Trainium は、AWS が提供する特殊なハードウェアプラットフォームで、機械学習ワークロードの高速化に重点を置いています。AWS の neuron-monitor ツールは、AWS Trainium メトリクスをキャプチャするために使用されます。

Trainium Neuron Core 使用率

NeuronCore ごとの使用率 (%) (コアごとに報告)。

W&B は、このメトリクスに trn.{core_index}.neuroncore_utilization タグを割り当てます。

Trainium ホストメモリ使用量、合計

ホスト上の合計メモリ消費量 (バイト単位)。

W&B は、このメトリクスに trn.host_total_memory_usage タグを割り当てます。

Trainium Neuron デバイスの合計メモリ使用量

Neuron デバイス上の合計メモリ使用量 (バイト単位)。

W&B は、このメトリクスに trn.neuron_device_total_memory_usage) タグを割り当てます。

Trainium ホストメモリ使用量の内訳:

以下は、ホスト上のメモリ使用量の内訳です。

アプリケーションメモリ (trn.host_total_memory_usage.application_memory): アプリケーションで使用されるメモリ。
定数 (trn.host_total_memory_usage.constants): 定数に使用されるメモリ。
DMA バッファ (trn.host_total_memory_usage.dma_buffers): ダイレクトメモリアクセスバッファに使用されるメモリ。
テンソル (trn.host_total_memory_usage.tensors): テンソルに使用されるメモリ。

Trainium Neuron Core メモリ使用量の内訳

NeuronCore ごとの詳細なメモリ使用量情報:

定数 (trn.{core_index}.neuroncore_memory_usage.constants)
モデルコード (trn.{core_index}.neuroncore_memory_usage.model_code)
モデル共有スクラッチパッド (trn.{core_index}.neuroncore_memory_usage.model_shared_scratchpad)
ランタイムメモリ (trn.{core_index}.neuroncore_memory_usage.runtime_memory)
テンソル (trn.{core_index}.neuroncore_memory_usage.tensors)

OpenMetrics

OpenMetrics / Prometheus 互換のデータを公開する外部エンドポイントからメトリクスをキャプチャしてログに記録します。消費されるエンドポイントに適用されるカスタム正規表現ベースのメトリクスフィルタをサポートします。

このレポートを参照して、NVIDIA DCGM-Exporter を使用して GPU クラスターのパフォーマンスを監視する特定のケースで、この機能を使用する方法の詳細な例を確認してください。

4.4.8 - Anonymous mode

W&B アカウントなしでデータをログおよび可視化する

誰でも簡単に実行できるようにしたいコードを公開していますか？匿名モードを使用すると、W&B のアカウントを最初に作成しなくても、誰でもあなたのコードを実行し、W&B のダッシュボードを確認し、結果を可視化できます。

匿名モードで結果を記録できるようにするには、以下のようにします。

import wandb

wandb.init(anonymous="allow")

たとえば、次のコードスニペットは、W&B で Artifacts を作成およびログに記録する方法を示しています。

import wandb

run = wandb.init(anonymous="allow")

artifact = wandb.Artifact(name="art1", type="foo")
artifact.add_file(local_path="path/to/file")
run.log_artifact(artifact)

run.finish()

ノートブックの例を試して、匿名モードの動作を確認してください。

W&B Models

1 - Experiments

仕組み

はじめに

ベストプラクティス と ヒント

1.1 - Create an experiment

W&B の 実験 を作成する方法

W&B run の初期化

ハイパーパラメーター の 辞書 をキャプチャ

トレーニング ループ 内で メトリクス を ログ 記録

W&B に アーティファクト を ログ 記録

まとめ

次の ステップ ： 実験 を視覚化する

ベストプラクティス

1.2 - Configure experiments

実験設定の構成

初期化時に設定を構成する

argparse で設定を構成する

スクリプト全体で設定を構成する

Run の完了後に設定を構成する

absl.FLAGS

ファイルベースの Configs

ファイルベースの Configs のユースケース例

TensorFlow v1 フラグ

1.3 - Projects

Overview タブ

Workspace タブ

パネルのセクションを追加する

セクション間でパネルを移動する

パネルのサイズを変更する

メトリクスを検索する

Runs タブ

Reports タブ

Sweeps タブ

Artifacts タブ

Overview パネル

Metadata パネル

Usage パネル

Files パネル

Lineage パネル

Action History Audit タブ

Versions タブ

project にスターを付ける

project を削除する

project にメモを追加する

説明の概要を project に追加する

Create reports to create descriptive notes comparing runs

run ワークスペースにメモを追加する

1.4 - View experiments results

Workspace の種類

保存された workspace view

新しい保存済み workspace view を作成する

保存された workspace view を 更新 する

保存された workspace view を 削除 する

workspace view を共有する

プログラムで workspace を作成する

Workspace API をインストールする

プログラムで workspace view を定義して保存する

既存の view を 編集 する

workspace の saved view を別の workspace にコピーする

1.5 - What are runs?

run を初期化する

Notebook users

Run の 状態

一意の run 識別子

自動生成された run ID

カスタム run ID

run に名前を付ける

run にメモを追加する

run を停止する

ログに記録された run を表示する

Overviewタブ

Workspaceタブ

Runsタブ

Systemタブ

Logsタブ

Filesタブ

Artifactsタブ

run を削除する

run を整理する

ベストプラクティスとヒント

W&B の実験を作成する方法

ハイパーパラメーターの辞書をキャプチャ

トレーニングループ内でメトリクスをログ記録

W&B にアーティファクトをログ記録

次のステップ：実験を視覚化する

`absl.FLAGS`

保存された workspace view を更新する

保存された workspace view を削除する

既存の view を編集する

workspace の `saved view` を別の workspace にコピーする

Run の状態

run にグループまたはジョブタイプを割り当てる

1. W&B ユーザー設定でアラートをオンにする

2. `run.alert()` を code に追加する

方法 1: 単一プロセス

方法 2: 多数のプロセス

W&B Service を使用して、一般的な分散トレーニングの問題を回避する