PaddleOCR

PaddleOCR と W&B を統合する方法。

PaddleOCR は、多言語に対応した、素晴らしい、最先端の、そして実用的なOCRツールを開発し、PaddlePaddle で実装されたモデルのトレーニングをより良く行い、実際に活用できるようにすることを目的としています。PaddleOCR は、OCRに関連する様々な最先端のアルゴリズムをサポートし、産業ソリューションを開発しました。PaddleOCR には、トレーニング と評価メトリクスを、対応するメタデータ と共にモデル のチェックポイント をログ記録するための Weights & Biases のインテグレーションが付属しています。

ブログ と Colab の例

ICDAR2015 データセット で PaddleOCR を使用してモデル をトレーニングする方法については、こちら を参照してください。また、Google Colab もあり、対応するライブの W&B ダッシュボードは こちら から入手できます。このブログ の中国語版もあります: W&B对您的OCR模型进行训练和调试

サインアップ して APIキー を作成する

APIキー は、W&B に対してお客様のマシン を認証します。APIキー は、ユーザー プロファイル から生成できます。

  1. 右上隅にあるユーザー プロファイル アイコン をクリックします。
  2. [User Settings] を選択し、[API Keys] セクション までスクロールします。
  3. [Reveal] をクリックします。表示された APIキー をコピーします。APIキー を非表示にするには、ページ をリロードします。

wandb ライブラリ をインストール してログイン する

wandb ライブラリ をローカル にインストール してログイン するには:

  1. WANDB_API_KEY 環境変数 を APIキー に設定します。

    export WANDB_API_KEY=<your_api_key>
    
  2. wandb ライブラリ をインストール してログイン します。

    pip install wandb
    
    wandb login
    
pip install wandb
import wandb
wandb.login()
!pip install wandb

import wandb
wandb.login()

config.yml ファイル に wandb を追加する

PaddleOCR では、yaml ファイル を使用して構成変数 を指定する必要があります。構成 yaml ファイル の末尾に次のスニペット を追加すると、すべてのトレーニング と検証メトリクス が、モデル チェックポイント と共に W&B ダッシュボード に自動的に記録されます。

Global:
    use_wandb: True

wandb.init に渡したい追加のオプション の 引数 は、yaml ファイル の wandb ヘッダー の下に追加することもできます。

wandb:  
    project: CoolOCR  # (オプション) これは wandb プロジェクト名 です
    entity: my_team   # (オプション) wandb team を使用している場合は、ここに team 名を渡すことができます
    name: MyOCRModel  # (オプション) これは wandb run の名前です

config.yml ファイル を train.py に渡す

yaml ファイル は、PaddleOCR リポジトリ で利用可能な トレーニング スクリプト への 引数 として提供されます。

python tools/train.py -c config.yml

Weights & Biases をオンにして train.py ファイル を実行すると、W&B ダッシュボード に移動するためのリンク が生成されます。

W&B Dashboard for the Text Detection Model

フィードバック または問題点

Weights & Biases のインテグレーションに関するフィードバック や問題がある場合は、PaddleOCR GitHub で issue をオープン するか、support@wandb.com にメール でご連絡ください。