What are runs?

W&B の基本的な構成要素である Runs について学びましょう。

8 minute read

run は、W&B によってログされる計算の単一の単位です。W&B の run は、プロジェクト全体の原子要素と考えることができます。つまり、各 run は、モデルのトレーニングと結果のログ、ハイパーパラメーターのスイープなど、特定の計算の記録です。

run を開始する一般的なパターンには、以下が含まれますが、これらに限定されません。

モデルのトレーニング
ハイパーパラメーターを変更して新しい実験を行う
異なるモデルで新しい機械学習実験を行う
W&B Artifact としてデータまたはモデルをログする
W&B Artifact をダウンロードする

W&B は、作成した run を プロジェクト に保存します。run とそのプロパティは、W&B App UI の run のプロジェクトワークスペース内で表示できます。また、wandb.Api.Run オブジェクトを使用して、プログラムで run のプロパティにアクセスすることもできます。

run.log でログするものはすべて、その run に記録されます。次のコードスニペットを検討してください。

import wandb

run = wandb.init(entity="nico", project="awesome-project")
run.log({"accuracy": 0.9, "loss": 0.1})

最初の行は、W&B Python SDK をインポートします。2 行目は、エンティティ nico の下のプロジェクト awesome-project で run を初期化します。3 行目は、モデルの精度と損失をその run にログします。

ターミナル内で、W&B は以下を返します。

wandb: Syncing run earnest-sunset-1
wandb: ⭐️ View project at https://wandb.ai/nico/awesome-project
wandb: 🚀 View run at https://wandb.ai/nico/awesome-project/runs/1jx1ud12
wandb:                                                                                
wandb: 
wandb: Run history:
wandb: accuracy  
wandb:     loss  
wandb: 
wandb: Run summary:
wandb: accuracy 0.9
wandb:     loss 0.5
wandb: 
wandb: 🚀 View run earnest-sunset-1 at: https://wandb.ai/nico/awesome-project/runs/1jx1ud12
wandb: ⭐️ View project at: https://wandb.ai/nico/awesome-project
wandb: Synced 6 W&B file(s), 0 media file(s), 0 artifact file(s) and 0 other file(s)
wandb: Find logs at: ./wandb/run-20241105_111006-1jx1ud12/logs

ターミナルで W&B が返す URL は、W&B App UI の run のワークスペースにリダイレクトします。ワークスペースで生成されるパネルは、単一のポイントに対応していることに注意してください。

単一の時点でのメトリクスのログは、それほど役に立たない場合があります。判別モデルのトレーニングの場合のより現実的な例は、一定の間隔でメトリクスをログすることです。たとえば、次のコードスニペットを検討してください。

epochs = 10
lr = 0.01

run = wandb.init(
    entity="nico",
    project="awesome-project",
    config={
        "learning_rate": lr,
        "epochs": epochs,
    },
)

offset = random.random() / 5

# simulating a training run
for epoch in range(epochs):
    acc = 1 - 2**-epoch - random.random() / (epoch + 1) - offset
    loss = 2**-epoch + random.random() / (epoch + 1) + offset
    print(f"epoch={epoch}, accuracy={acc}, loss={loss}")
    run.log({"accuracy": acc, "loss": loss})

これにより、次の出力が返されます。

wandb: Syncing run jolly-haze-4
wandb: ⭐️ View project at https://wandb.ai/nico/awesome-project
wandb: 🚀 View run at https://wandb.ai/nico/awesome-project/runs/pdo5110r
lr: 0.01
epoch=0, accuracy=-0.10070974957523078, loss=1.985328507123956
epoch=1, accuracy=0.2884687745057535, loss=0.7374362314407752
epoch=2, accuracy=0.7347387967382066, loss=0.4402409835486663
epoch=3, accuracy=0.7667969248039795, loss=0.26176963846423457
epoch=4, accuracy=0.7446848791003173, loss=0.24808611724405083
epoch=5, accuracy=0.8035095836268268, loss=0.16169791827329466
epoch=6, accuracy=0.861349032371624, loss=0.03432578493587426
epoch=7, accuracy=0.8794926436276016, loss=0.10331872172219471
epoch=8, accuracy=0.9424839917077272, loss=0.07767793473500445
epoch=9, accuracy=0.9584880427028566, loss=0.10531971149250456
wandb: 🚀 View run jolly-haze-4 at: https://wandb.ai/nico/awesome-project/runs/pdo5110r
wandb: Find logs at: wandb/run-20241105_111816-pdo5110r/logs

トレーニングスクリプトは run.log を 10 回呼び出します。スクリプトが run.log を呼び出すたびに、W&B はそのエポックの精度と損失をログします。W&B が前の出力から出力する URL を選択すると、W&B App UI の run のワークスペースに移動します。

スクリプトが wandb.init メソッドを 1 回だけ呼び出すため、W&B はシミュレートされたトレーニングループを jolly-haze-4 という単一の run 内でキャプチャすることに注意してください。

別の例として、sweep 中に、W&B は指定したハイパーパラメーター探索空間を探索します。W&B は、sweep が作成する新しいハイパーパラメーターの組み合わせを、一意の run として実装します。

run を初期化する

wandb.init() を使用して W&B run を初期化します。次のコードスニペットは、W&B Python SDK をインポートして run を初期化する方法を示しています。

山かっこ (< >) で囲まれた値を、自分の値に置き換えてください。

import wandb

run = wandb.init(entity="<entity>", project="<project>")

run を初期化すると、W&B はプロジェクトフィールドに指定したプロジェクト (wandb.init(project="<project>" に run をログします。W&B は、プロジェクトがまだ存在しない場合は、新しいプロジェクトを作成します。プロジェクトがすでに存在する場合は、W&B はそのプロジェクトに run を保存します。

プロジェクト名を指定しない場合、W&B は run を Uncategorized というプロジェクトに保存します。

W&B の各 run には、run ID と呼ばれる一意の識別子があります。一意の ID を指定するか、W&B に ID をランダムに生成させることができます。

各 run には、人間が読める run 名 としても知られる一意でない識別子もあります。run の名前を指定するか、W&B にランダムに生成させることができます。

たとえば、次のコードスニペットを考えてみましょう。

import wandb

run = wandb.init(entity="wandbee", project="awesome-project")

コードスニペットは、次の出力を生成します。

🚀 View run exalted-darkness-6 at: 
https://wandb.ai/nico/awesome-project/runs/pgbn9y21
Find logs at: wandb/run-20241106_090747-pgbn9y21/logs

上記のコードが id パラメータの引数を指定しなかったため、W&B は一意の run ID を作成します。nico は run をログしたエンティティ、awesome-project は run がログされるプロジェクトの名前、exalted-darkness-6 は run の名前、pgbn9y21 は run ID です。

Notebook users

run の最後に run.finish() を指定して、run が完了したことを示します。これにより、run がプロジェクトに適切にログされ、バックグラウンドで継続されないようになります。

import wandb

run = wandb.init(entity="<entity>", project="<project>")
# Training code, logging, and so forth
run.finish()

各 run には、run の現在のステータスを記述する状態があります。可能な run の状態の完全なリストについては、Run の状態を参照してください。

Run の状態

次のテーブルは、run がとりうる状態を記述しています。

状態	説明
Finished	run が終了し、完全にデータが同期されたか、`wandb.finish()` が呼び出されました
Failed	run が 0 以外の終了ステータスで終了しました
Crashed	run が内部プロセスでハートビートの送信を停止しました。これは、マシンがクラッシュした場合に発生する可能性があります
Running	run はまだ実行中で、最近ハートビートを送信しました

一意の run 識別子

Run ID は、run の一意の識別子です。デフォルトでは、新しい run を初期化すると、W&B がランダムで一意の run ID を生成します。run を初期化するときに、独自の一意の run ID を指定することもできます。

自動生成された run ID

run を初期化するときに run ID を指定しない場合、W&B はランダムな run ID を生成します。run の一意の ID は、W&B App UI で確認できます。

https://wandb.ai/home の W&B App UI に移動します。
run の初期化時に指定した W&B プロジェクトに移動します。
プロジェクトのワークスペース内で、[Runs] タブを選択します。
[Overview] タブを選択します。

W&B は、[Run パス] フィールドに一意の run ID を表示します。run パスは、チームの名前、プロジェクトの名前、run ID で構成されます。一意の ID は、run パスの最後の部分です。

たとえば、次の図では、一意の run ID は 9mxi1arc です。

カスタム run ID

wandb.init メソッドに id パラメータを渡すことで、独自の run ID を指定できます。

import wandb

run = wandb.init(entity="<project>", project="<project>", id="<run-id>")

run の一意の ID を使用して、W&B App UI で run の Overview ページに直接移動できます。次のセルは、特定の run の URL パスを示しています。

https://wandb.ai/<entity>/<project>/<run-id>

山かっこ (< >) で囲まれた値は、エンティティ、プロジェクト、run ID の実際の値のプレースホルダーです。

run に名前を付ける

run の名前は、人間が読める一意でない識別子です。

デフォルトでは、W&B は新しい run を初期化するときにランダムな run 名を生成します。run の名前は、プロジェクトのワークスペース内と、run の Overview ページの上部に表示されます。

run 名は、プロジェクトワークスペースで run をすばやく識別する方法として使用します。

wandb.init メソッドに name パラメータを渡すことで、run の名前を指定できます。

import wandb

run = wandb.init(entity="<project>", project="<project>", name="<run-name>")

run にメモを追加する

特定の run に追加するメモは、[Overview] タブの run ページと、プロジェクトページの run のテーブルに表示されます。

W&B プロジェクトに移動します
プロジェクトサイドバーから [Workspace] タブを選択します
run セレクターからメモを追加する run を選択します
[Overview] タブを選択します
[Description] フィールドの横にある鉛筆アイコンを選択し、メモを追加します

run を停止する

W&B App またはプログラムで run を停止します。

run を初期化したターミナルまたはコードエディタに移動します。
Ctrl+D を押して run を停止します。

たとえば、上記の手順に従うと、ターミナルは次のようになります。

KeyboardInterrupt
wandb: 🚀 View run legendary-meadow-2 at: https://wandb.ai/nico/history-blaster-4/runs/o8sdbztv
wandb: Synced 5 W&B file(s), 0 media file(s), 0 artifact file(s) and 1 other file(s)
wandb: Find logs at: ./wandb/run-20241106_095857-o8sdbztv/logs

W&B App UI に移動して、run がアクティブでなくなったことを確認します。

run がログされているプロジェクトに移動します。
run の名前を選択します。

停止する run の名前は、ターミナルまたはコードエディタの出力から確認できます。たとえば、上記の例では、run の名前は legendary-meadow-2 です。

3. プロジェクトサイドバーから [**Overview**] タブを選択します。

[State] フィールドの横で、run の状態が running から Killed に変わります。

run がログされているプロジェクトに移動します。
run セレクター内で停止する run を選択します。
プロジェクトサイドバーから [Overview] タブを選択します。
[State] フィールドの横にある上部のボタンを選択します。

[State] フィールドの横で、run の状態が running から Killed に変わります。

可能な run の状態の完全なリストについては、State フィールドを参照してください。

ログに記録された run を表示する

run の状態、run にログされた Artifacts、run 中に記録されたログファイルなど、特定の run に関する情報を表示します。

特定の run を表示するには:

https://wandb.ai/home の W&B App UI に移動します。
run の初期化時に指定した W&B プロジェクトに移動します。
プロジェクトサイドバー内で、[Workspace] タブを選択します。
run セレクター内で、表示する run をクリックするか、run 名の一部を入力して、一致する run をフィルターします。

デフォルトでは、長い run 名は読みやすくするために中央で切り捨てられます。代わりに、run 名を先頭または末尾で切り捨てるには、run のリストの上部にあるアクション ... メニューをクリックし、[Run 名のトリミング] を設定して、末尾、中央、または先頭をトリミングします。

特定の run の URL パスには、次の形式があることに注意してください。

https://wandb.ai/<team-name>/<project-name>/runs/<run-id>

山かっこ (< >) で囲まれた値は、チーム名、プロジェクト名、run ID の実際の値のプレースホルダーです。

Overviewタブ

[Overview] タブを使用して、プロジェクト内の特定の run 情報について学習します。次に例を示します。

Author: run を作成する W&B エンティティ。
Command: run を初期化するコマンド。
Description: 提供した run の説明。run の作成時に説明を指定しない場合、このフィールドは空です。W&B App UI を使用するか、Python SDK でプログラムで説明を run に追加できます。
Duration: run がアクティブに計算またはデータをログしている時間。一時停止または待機は除きます。
Git リポジトリ: run に関連付けられている git リポジトリ。git を有効にするして、このフィールドを表示する必要があります。
Host name: W&B が run を計算する場所。マシンでローカルに run を初期化する場合は、マシンの名前が表示されます。
Name: run の名前。
OS: run を初期化するオペレーティングシステム。
Python 実行可能ファイル: run を開始するコマンド。
Python バージョン: run を作成する Python バージョンを指定します。
Run パス: entity/project/run-ID の形式で一意の run 識別子を識別します。
Runtime: run の開始から終了までの合計時間を測定します。これは、run のウォールクロック時間です。Runtime には、run が一時停止している時間またはリソースを待機している時間が含まれますが、Duration は含まれません。
Start time: run を初期化するタイムスタンプ。
State: run の状態。
System hardware: W&B が run の計算に使用するハードウェア。
Tags: 文字列のリスト。タグは、関連する run をまとめて編成したり、baseline や production などの一時的なラベルを適用したりするのに役立ちます。
W&B CLI バージョン: run コマンドをホストしたマシンにインストールされている W&B CLI バージョン。

W&B は、概要セクションの下に次の情報を保存します。

Artifact Outputs: run によって生成された Artifacts 出力。
Config: wandb.config で保存された config パラメータのリスト。
Summary: wandb.log() で保存された summary パラメータのリスト。デフォルトでは、W&B はこの値を最後にログされた値に設定します。

プロジェクトの概要の例はこちらをご覧ください。

Workspaceタブ

[Workspace] タブを使用して、自動生成されたカスタムプロット、システムメトリクスなど、可視化を表示、検索、グループ化、および配置します。

プロジェクトワークスペースの例はこちらをご覧ください

Runsタブ

[Runs] タブを使用して、run をフィルター、グループ化、および並べ替えます。

次のタブは、[Runs] タブで実行できる一般的なアクションの一部を示しています。

[Runs] タブには、プロジェクト内の run に関する詳細が表示されます。デフォルトでは、多数の列が表示されます。

表示されているすべての列を表示するには、ページを水平方向にスクロールします。
列の順序を変更するには、列を左または右にドラッグします。
列をピン留めするには、列名の上にカーソルを置き、表示されるアクションメニュー ... をクリックし、[Pin column] をクリックします。ピン留めされた列は、[Name] 列の後、ページの左側の近くに表示されます。ピン留めされた列のピン留めを解除するには、[Unpin column] を選択します
列を非表示にするには、列名の上にカーソルを置き、表示されるアクションメニュー ... をクリックし、[Hide column] をクリックします。現在非表示になっているすべての列を表示するには、[Columns] をクリックします。
複数の列を一度に表示、非表示、ピン留め、およびピン留め解除するには、[Columns] をクリックします。
- 非表示の列の名前をクリックして、非表示を解除します。
- 表示されている列の名前をクリックして、非表示にします。
- 表示されている列の横にあるピンアイコンをクリックしてピン留めします。

[Runs] タブをカスタマイズすると、カスタマイズはWorkspace タブの [Runs] セレクターにも反映されます。

指定された列の値でテーブル内のすべての行を並べ替えます。

マウスを列タイトルの上に移動します。ケバブメニュー (3 つの垂直ドット) が表示されます。
ケバブメニュー (3 つの垂直ドット) を選択します。
[Sort Asc] または [Sort Desc] を選択して、行をそれぞれ昇順または降順に並べ替えます。

See the digits for which the model most confidently guessed '0'.

上の図は、val_acc という名前のテーブル列の並べ替えオプションを表示する方法を示しています。

ダッシュボードの上にある [Filter] ボタンを使用して、式ですべての行をフィルターします。

See only examples which the model gets wrong.

[Add filter] を選択して、1 つまたは複数のフィルターを行に追加します。3 つのドロップダウンメニューが表示されます。左から右へのフィルタータイプは、列名、オペレーター、および値に基づいています

	列名	二項関係	値
受け入れられる値	文字列	=, ≠, ≤, ≥, IN, NOT IN,	整数, float, 文字列, タイムスタンプ , null

式エディターには、列名のオートコンプリートと論理述語構造を使用して、各項のオプションのリストが表示されます。「and」または「or」(および場合によっては括弧 ) を使用して、複数の論理述語を 1 つの式に接続できます。

上の図は、`val_loss` 列に基づくフィルターを示しています。このフィルターは、検証損失が 1 以下の run を表示します。

ダッシュボードの上にある [Group by] ボタンを使用して、特定の列の値で行をグループ化します。

The truth distribution shows small errors: 8s and 2s are confused for 7s and 9s for 2s.

デフォルトでは、これにより、他の数値列が、そのグループ全体の列の値の分布を示すヒストグラムに変わります。グループ化は、データのより高レベルのパターンを理解するのに役立ちます。

Systemタブ

[System タブ] には、CPU 使用率、システムメモリ、ディスク I/O、ネットワークトラフィック、GPU 使用率など、特定の run に対して追跡されるシステムメトリクスが表示されます。

W&B が追跡するシステムメトリクスの完全なリストについては、System メトリクスを参照してください。

システムタブの例はこちらをご覧ください。

Logsタブ

[Log タブ] には、コマンドラインに出力された出力 (標準出力 (stdout) や標準エラー (stderr) など) が表示されます。

右上隅にある [Download] ボタンを選択して、ログファイルをダウンロードします。

ログタブの例はこちらをご覧ください。

Filesタブ

[Files タブ] を使用して、モデルチェックポイント、検証セットの例など、特定の run に関連付けられたファイルを表示します

ファイルタブの例はこちらをご覧ください。

Artifactsタブ

[Artifacts] タブには、指定された run の入力および出力アーティファクトが一覧表示されます。

アーティファクトタブの例はこちらをご覧ください。

run を削除する

W&B App を使用して、プロジェクトから 1 つまたは複数の run を削除します。

削除する run が含まれているプロジェクトに移動します。
プロジェクトサイドバーから [Runs] タブを選択します。
削除する run の横にあるチェックボックスをオンにします。
テーブルの上にある [Delete] ボタン ( ゴミ箱アイコン ) を選択します。
表示されるモーダルから、[Delete] を選択します。

特定の ID を持つ run が削除されると、その ID を再度使用できなくなる場合があります。以前に削除された ID で run を開始しようとすると、エラーが表示され、開始が防止されます。

多数の run を含むプロジェクトの場合、検索バーを使用して正規表現を使用して削除する run をフィルターするか、フィルターボタンを使用して、ステータス、タグ、またはその他のプロパティに基づいて run をフィルターできます。

run を整理する

このセクションでは、グループとジョブタイプを使用して run を整理する方法について説明します。run をグループ (たとえば、実験名) に割り当て、ジョブタイプ (たとえば、前処理、トレーニング、評価、デバッグ ) を指定することで、ワークフローを効率化し、モデルの比較を改善できます。

run にグループまたはジョブタイプを割り当てる

W&B の各 run は、[グループ] と [ジョブタイプ] で分類できます。

グループ: 実験の広範なカテゴリで、run の整理とフィルターに使用されます。
ジョブタイプ: preprocessing、training、evaluation など、run の機能。

次のワークスペースの例では、Fashion-MNIST データセットから増え続ける量のデータを使用してベースラインモデルをトレーニングします。ワークスペースでは、使用されるデータ量を色で表します。

黄色から濃い緑は、ベースラインモデルのデータ量が増加していることを示します。
水色からバイオレット、マゼンタは、追加のパラメータを持つ、より複雑な「double」モデルのデータ量を示します。

W&B のフィルターオプションと検索バーを使用して、特定の条件に基づいて run を比較します。次に例を示します。

同じデータセットでのトレーニング。
同じテストセットでの評価。

フィルターを適用すると、[Table] ビューが自動的に更新されます。これにより、モデル間のパフォーマンスの違いを特定できます。たとえば、一方のモデルで他方のモデルよりも大幅に困難なクラスを特定できます。

[i18n] feedback_title

[i18n] feedback_question

Glad to hear it! Please tell us how we can improve.

Sorry to hear that. Please tell us how we can improve.

最終更新 April 3, 2025

ページの編集ドキュメントのissueを作成セクション全体を印刷

What are runs?

run を初期化する

Notebook users

Run の状態

一意の run 識別子

自動生成された run ID

カスタム run ID

run に名前を付ける

run にメモを追加する

run を停止する

ログに記録された run を表示する

Overviewタブ

Workspaceタブ

Runsタブ

Systemタブ

Logsタブ

Filesタブ

Artifactsタブ

run を削除する

run を整理する

run にグループまたはジョブタイプを割り当てる

Add labels to runs with tags

Filter and search runs

Fork a run

Group runs into experiments

Move runs

Resume a run

Rewind a run

Send an alert

[i18n] feedback_title

What are runs?

run を初期化する

Notebook users

Run の 状態

一意の run 識別子

自動生成された run ID

カスタム run ID

run に名前を付ける

run にメモを追加する

run を停止する

ログに記録された run を表示する

Overviewタブ

Workspaceタブ

Runsタブ

Systemタブ

Logsタブ

Filesタブ

Artifactsタブ

run を削除する

run を整理する

run に グループ または ジョブタイプ を割り当てる

[i18n] feedback_title

Run の状態

run にグループまたはジョブタイプを割り当てる