Skip to content

haruotsu/ProdDiffuser

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

ProdDiffuser

ProdDiffuserは、製品画像と背景画像を組み合わせて、プロンプトに基づいた背景生成を行うPythonアプリケーションです。

  • 背景画像が用意されている場合:

    • assetsディレクトリに背景画像を配置すると、製品画像と指定された背景画像が合成されます。
  • 背景画像が用意されていない場合:

メモ

改善PRじゃんじゃんお待ちしてます!

test_movie.mp4

機能

  • 製品画像と背景画像の合成
  • プロンプトに基づく背景生成
  • 画像のリサイズとパディング

必要条件

  • ローカルPython環境
  • Docker
  • NVIDIA GPU(オプション、GPUを使用する場合)

セットアップ

ローカルで実行する場合

GPUを使う場合は以下を参考にCUDAをインストールしてください。 https://qiita.com/YokoPhys-h/items/274aecc84a7c42b1efb2

pip install -r requirements.txt
python src/main.py

Dockerを使用する場合

GPUを使う場合 以下を参考にしてください。 https://qiita.com/YokoPhys-h/items/274aecc84a7c42b1efb2

  1. Dockerイメージのビルド

    プロジェクトのルートディレクトリで以下のコマンドを実行してDockerイメージをビルドします。

    docker build -t prod_diffuser .
  2. Dockerコンテナの実行

    GPUを使用する場合は以下のコマンドを実行します。

    docker run --rm -it --gpus all prod_diffuser

    GPUがなくても動作します。GPUがない場合でも、以下のコマンドで実行可能です。

    docker run --rm -it prod_diffuser

ファイルについて

  1. assetsディレクトリに製品画像と背景画像を配置します。
  2. src/main.py内のパラメータを必要に応じて変更します。
  3. 上記の手順でDockerコンテナを実行し、生成された画像がoutputディレクトリに保存されます。

パラメータの説明

  • product_image_path: 製品画像のパスを指定します。
  • background_image_path: 背景画像のパスを指定します。背景画像がない場合は、プロンプトに基づいて生成されます。
  • output_path: 生成された画像の保存先パスを指定します。
  • prompt: 背景生成に使用するプロンプトを指定します。背景画像がない場合に使用されます。
  • target_size: 出力画像のサイズを指定します(幅, 高さ)。
  • scale: 製品画像のスケールを指定します。1.0で元のサイズ、0.5で半分のサイズになります。
  • position: 製品画像を配置する位置を指定します。Noneの場合は中央に配置されます。
  • seed: 画像生成のランダムシードを指定します。再現性のある結果を得るために使用します。
  • num_inference_steps: 画像生成の推論ステップ数を指定します。ステップ数が多いほど詳細な画像が生成されます。
  • controlnet_conditioning_scale: ControlNetの条件付けスケールを指定します。生成画像の制御に影響を与えます。

About

ProdDiffuserは、製品画像と背景画像を組み合わせて合成を行うアプリケーションです。背景画像がある場合にはそれと合成し、ない場合にはプロンプトに基づいた背景生成を行います

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors