Experiments limits and performance

推奨される範囲内でログを記録することで、W&B のページをより速く、より応答性の高い状態に保つことができます。

4 minute read

以下の推奨範囲内でログを記録することで、W&B 内のページをより高速かつ応答性の高い状態に保つことができます。

ログ記録に関する考慮事項

wandb.log を使用して実験メトリクスを追跡します。記録されたメトリクスは、グラフを生成し、テーブルに表示されます。ログに記録するデータが多すぎると、アプリケーションの動作が遅くなる可能性があります。

個別のメトリクス数

パフォーマンスを向上させるには、プロジェクト内の個別のメトリクスの合計数を 10,000 未満に抑えてください。

import wandb

wandb.log(
    {
        "a": 1,  # "a" は個別のメトリクス
        "b": {
            "c": "hello",  # "b.c" は個別のメトリクス
            "d": [1, 2, 3],  # "b.d" は個別のメトリクス
        },
    }
)

W&B は、ネストされた値を自動的にフラット化します。つまり、辞書を渡すと、W&B はそれをドットで区切られた名前に変換します。 config 値の場合、W&B は名前に 3 つのドットをサポートします。 summary 値の場合、W&B は 4 つのドットをサポートします。

ワークスペースの動作が突然遅くなった場合は、最近の runs が意図せずに数千もの新しいメトリクスを記録していないか確認してください。（これは、数千ものプロットがあるセクションで、表示されている run が 1 つまたは 2 つしかないことで簡単に見つけることができます。）記録されている場合は、それらの runs を削除し、目的のメトリクスで再作成することを検討してください。

値の幅

ログに記録する単一の値のサイズを 1 MB 未満に、単一の wandb.log 呼び出しの合計サイズを 25 MB 未満に制限します。この制限は、wandb.Image、wandb.Audio などの wandb.Media タイプには適用されません。

# ❌ 推奨されません
wandb.log({"wide_key": range(10000000)})

# ❌ 推奨されません
with f as open("large_file.json", "r"):
    large_data = json.load(f)
    wandb.log(large_data)

幅の広い値は、幅の広い値を持つメトリクスだけでなく、run 内のすべてのメトリクスのプロットの読み込み時間に影響を与える可能性があります。

推奨量よりも幅の広い値をログに記録した場合でも、データは保存および追跡されます。ただし、プロットの読み込みが遅くなる可能性があります。

メトリクスの頻度

ログに記録するメトリクスに適切なログ記録頻度を選択してください。一般的な経験則として、メトリクスの幅が広いほど、ログに記録する頻度を低くする必要があります。W&B は以下を推奨します。

スカラー: メトリクスごとに <100,000 ログポイント
メディア: メトリクスごとに <50,000 ログポイント
ヒストグラム: メトリクスごとに <10,000 ログポイント

# 合計 100 万ステップのトレーニングループ
for step in range(1000000):
    # ❌ 推奨されません
    wandb.log(
        {
            "scalar": step,  # 100,000 スカラー
            "media": wandb.Image(...),  # 100,000 画像
            "histogram": wandb.Histogram(...),  # 100,000 ヒストグラム
        }
    )

    # ✅ 推奨
    if step % 1000 == 0:
        wandb.log(
            {
                "histogram": wandb.Histogram(...),  # 10,000 ヒストグラム
            },
            commit=False,
        )
    if step % 200 == 0:
        wandb.log(
            {
                "media": wandb.Image(...),  # 50,000 画像
            },
            commit=False,
        )
    if step % 100 == 0:
        wandb.log(
            {
                "scalar": step,  # 100,000 スカラー
            },
            commit=True,
        )  # バッチ処理されたステップごとのメトリクスをまとめてコミット

ガイドラインを超えても、W&B はログに記録されたデータを受け入れ続けますが、ページの読み込みが遅くなる場合があります。

Config サイズ

run config の合計サイズを 10 MB 未満に制限します。大きい値をログに記録すると、プロジェクトワークスペースと runs テーブルの操作が遅くなる可能性があります。

# ✅ 推奨
wandb.init(
    config={
        "lr": 0.1,
        "batch_size": 32,
        "epochs": 4,
    }
)

# ❌ 推奨されません
wandb.init(
    config={
        "steps": range(10000000),
    }
)

# ❌ 推奨されません
with f as open("large_config.json", "r"):
    large_config = json.load(f)
    wandb.init(config=large_config)

ワークスペースに関する考慮事項

Run count

読み込み時間を短縮するには、単一のプロジェクト内の runs の合計数を以下に抑えてください。

SaaS Cloud で 100,000
専用クラウドまたは自己管理で 10,000

これらのしきい値を超える run カウントは、プロジェクトワークスペースまたは runs テーブルを含む操作、特に runs のグルーピング時、または runs 中に多数の個別のメトリクスを収集する場合に、速度が低下する可能性があります。メトリクス数セクションも参照してください。

チームが頻繁に同じ runs のセット（最近の runs のセットなど）にアクセスする場合は、あまり頻繁に使用されない runs をまとめて移動することを検討して、新しい「アーカイブ」プロジェクトに移動し、作業プロジェクトにはより少ない runs のセットを残します。

ワークスペースのパフォーマンス

このセクションでは、ワークスペースのパフォーマンスを最適化するためのヒントを紹介します。

パネル数

デフォルトでは、ワークスペースは自動であり、ログに記録されたキーごとに標準パネルを生成します。大規模なプロジェクトのワークスペースに、ログに記録された多くのキーのパネルが含まれている場合、ワークスペースの読み込みと使用に時間がかかる場合があります。パフォーマンスを向上させるには、次のことができます。

ワークスペースを手動モードにリセットします。これには、デフォルトでパネルが含まれていません。
クイック追加を使用して、視覚化する必要があるログに記録されたキーのパネルを選択的に追加します。

未使用のパネルを 1 つずつ削除しても、パフォーマンスへの影響はほとんどありません。代わりに、ワークスペースをリセットし、必要なパネルのみを選択的に追加し直します。

ワークスペースの構成の詳細については、パネルを参照してください。

セクション数

ワークスペース内に数百ものセクションがあると、パフォーマンスが低下する可能性があります。メトリクスの高レベルのグルーピングに基づいてセクションを作成し、メトリクスごとに 1 つのセクションというアンチパターンを避けることを検討してください。

セクションが多すぎてパフォーマンスが低下している場合は、サフィックスではなくプレフィックスでセクションを作成するようにワークスペース設定を検討してください。これにより、セクションの数が減り、パフォーマンスが向上する可能性があります。

メトリクス数

run あたり 5000 ～ 100,000 個のメトリクスをログに記録する場合は、W&B は手動ワークスペースを使用することをお勧めします。手動モードでは、さまざまなメトリクスのセットを探索するために、必要に応じてパネルを簡単に追加および削除できます。より集中的なプロットのセットを使用すると、ワークスペースの読み込みが速くなります。プロットされていないメトリクスは、通常どおり収集および保存されます。

ワークスペースを手動モードにリセットするには、ワークスペースのアクション ... メニューをクリックし、ワークスペースのリセット をクリックします。ワークスペースをリセットしても、runs の保存されたメトリクスには影響しません。ワークスペースの管理の詳細をご覧ください。

ファイル数

単一の run でアップロードされるファイルの総数を 1,000 未満に抑えてください。多数のファイルをログに記録する必要がある場合は、W&B Artifacts を使用できます。単一の run で 1,000 個を超えるファイルがあると、run ページの速度が低下する可能性があります。

Reports とワークスペース

レポートは、パネル、テキスト、メディアの任意の配置を自由に構成できるため、同僚と洞察を簡単に共有できます。

対照的に、ワークスペースでは、数百から数十万もの runs にわたって、数十から数千ものメトリクスを高密度かつ高性能に分析できます。ワークスペースには、 Reports と比較して、最適化されたキャッシュ、クエリ、および読み込み機能があります。ワークスペースは、主にプレゼンテーションではなく分析に使用されるプロジェクト、または 20 個以上のプロットをまとめて表示する必要がある場合にお勧めです。

Python スクリプトのパフォーマンス

Python スクリプトのパフォーマンスが低下する原因はいくつかあります。

データのサイズが大きすぎる。データサイズが大きいと、トレーニングループに 1 ミリ秒を超えるオーバーヘッドが発生する可能性があります。
ネットワークの速度と、W&B バックエンドの構成方法
wandb.log を 1 秒間に数回以上呼び出す。これは、wandb.log が呼び出されるたびに、トレーニングループにわずかな遅延が追加されるためです。

頻繁なログ記録により、トレーニング runs が遅くなっていませんか？ログ記録戦略を変更してパフォーマンスを向上させる方法については、この Colab を参照してください。

W&B は、レート制限を超える制限は一切主張しません。W&B Python SDK は、制限を超える要求に対して、指数関数的な「バックオフ」および「再試行」要求を自動的に完了します。W&B Python SDK は、コマンドラインで「ネットワーク障害」で応答します。無償アカウントの場合、W&B は、使用量が合理的なしきい値を超える極端な場合に連絡する場合があります。

レート制限

W&B SaaS Cloud API は、システムの整合性を維持し、可用性を確保するために、レート制限を実装しています。この対策により、単一のユーザーが共有インフラストラクチャーで利用可能なリソースを独占することを防ぎ、すべてのユーザーがサービスにアクセスできる状態を維持します。さまざまな理由で、より低いレート制限が発生する可能性があります。

レート制限は変更される可能性があります。

レート制限 HTTP ヘッダー

上記のテーブルは、レート制限 HTTP ヘッダーを示しています。

ヘッダー名	説明
RateLimit-Limit	1 つの時間枠で使用可能なクォータ量。0 ～ 1000 の範囲でスケーリングされます。
RateLimit-Remaining	現在のレート制限ウィンドウのクォータ量。0 ～ 1000 の範囲でスケーリングされます。
RateLimit-Reset	現在のクォータがリセットされるまでの秒数

メトリクスログ記録 API のレート制限

スクリプト内の wandb.log 呼び出しは、メトリクスログ記録 API を利用して、トレーニングデータを W&B にログ記録します。この API は、オンラインまたはオフライン同期のいずれかを通じて実行されます。いずれの場合も、ローリングタイムウィンドウでレート制限クォータ制限が課されます。これには、合計リクエストサイズとリクエストレートの制限が含まれます。後者は、ある時間の長さにおけるリクエスト数を示します。

W&B は、W&B プロジェクトごとにレート制限を適用します。したがって、チームに 3 つのプロジェクトがある場合、各プロジェクトには独自のレート制限クォータがあります。チームおよびエンタープライズプランのユーザーは、無料プランのユーザーよりも高いレート制限があります。

メトリクスログ記録 API の使用中にレート制限に達すると、標準出力にエラーを示す関連メッセージが表示されます。

メトリクスログ記録 API レート制限を下回るための推奨事項

レート制限を超えると、レート制限がリセットされるまで run.finish() が遅延する可能性があります。これを回避するには、次の戦略を検討してください。

W&B Python SDK バージョンを更新する: 最新バージョンの W&B Python SDK を使用していることを確認します。W&B Python SDK は定期的に更新され、要求を正常に再試行し、クォータの使用を最適化するための拡張メカニズムが含まれています。
メトリクスログ記録頻度を下げる: クォータを節約するために、メトリクスのログ記録頻度を最小限に抑えます。たとえば、epoch ごとにメトリクスをログ記録するのではなく、5 epoch ごとにログ記録するようにコードを変更できます。

if epoch % 5 == 0:  # 5 epoch ごとにメトリクスをログ記録する
    wandb.log({"acc": accuracy, "loss": loss})

手動データ同期: レート制限されている場合、W&B は run データをローカルに保存します。コマンド wandb sync <run-file-path> を使用して、データを手動で同期できます。詳細については、wandb sync リファレンスを参照してください。

GraphQL API のレート制限

W&B Models UI および SDK のパブリック API は、GraphQL リクエストをサーバーに送信して、データのクエリと変更を行います。SaaS Cloud 内のすべての GraphQL リクエストについて、W&B は、承認されていないリクエストの場合は IP アドレスごとに、承認されているリクエストの場合はユーザーごとにレート制限を適用します。制限は、固定された時間枠内のリクエストレート（1 秒あたりのリクエスト数）に基づいており、料金プランによってデフォルトの制限が決定されます。プロジェクトパス（たとえば、 Reports 、 runs 、 Artifacts ）を指定する関連 SDK リクエストの場合、W&B はプロジェクトごとにレート制限を適用します。これは、データベースのクエリ時間によって測定されます。

チームおよびエンタープライズプランのユーザーは、無料プランのユーザーよりも高いレート制限を受け取ります。 W&B Models SDK のパブリック API の使用中にレート制限に達すると、標準出力にエラーを示す関連メッセージが表示されます。

GraphQL API レート制限を下回るための推奨事項

W&B Models SDK のパブリック API を使用して大量のデータをフェッチする場合は、リクエストの間に少なくとも 1 秒待機することを検討してください。429 ステータスコードを受信した場合、または応答ヘッダーに RateLimit-Remaining=0 が表示された場合は、再試行する前に RateLimit-Reset で指定された秒数待機します。

ブラウザに関する考慮事項

W&B アプリはメモリを大量に消費する可能性があり、Chrome で最高のパフォーマンスを発揮します。コンピューターのメモリに応じて、W&B を 3 つ以上のタブで同時にアクティブにすると、パフォーマンスが低下する可能性があります。予期しないパフォーマンスの低下が発生した場合は、他のタブまたはアプリケーションを閉じることを検討してください。

W&B へのパフォーマンス問題の報告

W&B はパフォーマンスを重視しており、遅延のすべてのレポートを調査します。調査を迅速化するために、読み込み時間が遅いことを報告する場合は、主要なメトリクスとパフォーマンスイベントをキャプチャする W&B の組み込みパフォーマンスロガーの呼び出しを検討してください。読み込みが遅いページに URL パラメータ &PERF_LOGGING を追加し、コンソールの出力をアカウントチームまたはサポートと共有します。

[i18n] feedback_title

[i18n] feedback_question

Glad to hear it! Please tell us how we can improve.

Sorry to hear that. Please tell us how we can improve.

最終更新 April 3, 2025

ページの編集ドキュメントのissueを作成セクション全体を印刷

Experiments limits and performance

ログ記録に関する考慮事項

個別のメトリクス数

値 の幅

メトリクス の頻度

Config サイズ

ワークスペース に関する考慮事項

Run count

ワークスペース のパフォーマンス

パネル 数

セクション 数

メトリクス 数

ファイル 数

Reports と ワークスペース

Python スクリプト のパフォーマンス