Path: blob/main/transformers_doc/ja/image_to_image.ipynb
4522 views
Image-to-Image Task Guide
Image-to-Image タスクは、アプリケーションが画像を受信し、別の画像を出力するタスクです。これには、画像強化 (超解像度、低光量強化、ディレインなど)、画像修復などを含むさまざまなサブタスクがあります。
このガイドでは、次の方法を説明します。
超解像度タスクに画像間のパイプラインを使用します。
パイプラインを使用せずに、同じタスクに対してイメージ間モデルを実行します。
このガイドがリリースされた時点では、image-to-image
パイプラインは超解像度タスクのみをサポートしていることに注意してください。
必要なライブラリをインストールすることから始めましょう。
Swin2SR モデル を使用してパイプラインを初期化できるようになりました。次に、イメージを使用してパイプラインを呼び出すことで、パイプラインを推論できます。現時点では、Swin2SR モデル のみがこのパイプラインでサポートされています。
では、画像を読み込みましょう。

これで、パイプラインを使用して推論を実行できるようになりました。猫の画像の拡大バージョンを取得します。
パイプラインを使用せずに自分で推論を実行したい場合は、トランスフォーマーの Swin2SRForImageSuperResolution
クラスと Swin2SRImageProcessor
クラスを使用できます。これには同じモデルのチェックポイントを使用します。モデルとプロセッサを初期化しましょう。
pipeline
」は、自分で行う必要がある前処理と後処理のステップを抽象化するので、画像を前処理しましょう。画像をプロセッサに渡してから、ピクセル値を GPU に移動します。
これで、ピクセル値をモデルに渡すことで画像を推測できるようになりました。
出力は、以下のような ImageSuperResolutionOutput
タイプのオブジェクトです 👇
reconstruction
を取得し、それを視覚化するために後処理する必要があります。どのように見えるか見てみましょう。
出力を圧縮して軸 0 を削除し、値をクリップしてから、それを numpy float に変換する必要があります。次に、軸を [1072, 880] の形状になるように配置し、最後に出力を範囲 [0, 255] に戻します。
