Denoising Diffusion Probabilistic Model

This project implements Denoising Diffusion Probabilistic Models (DDPM) with fine-grained covariate control for generating realistic landscape images. The model allows precise manipulation of image characteristics like brightness, contrast, texture, and noise level during generation.

Key Features

Covariate Control: Control image attributes (brightness, contrast, texture, noise) during generation
Classifier-Free Guidance: Enables conditional and unconditional generation with smooth interpolation
Preset Landscape Styles: Pre-defined covariate combinations for different landscape types
Interactive Generation: Real-time control over image characteristics
Comprehensive Analysis Tools: Dataset analysis and covariate visualization
Flexible Training: Support for both extracted and synthetic covariates

Installation

Prerequisites

Python 3.8+
PyTorch 1.9+
CUDA-capable GPU (recommended)

Dependencies

pip install -r requirements.txt

Quick Start

Training

Train a covariate-controlled diffusion model on your landscape dataset:

python usage.py --mode train --dataset_path ./landscape_dataset --epochs 200 --batch_size 8

Generation

Generate landscape samples using a trained model:

python usage.py --mode generate --model_path models/trained_model.pt --num_samples 16

Interactive Generation

Launch interactive mode for real-time control:

python usage.py --mode interactive --model_path models/trained_model.pt

Dataset Analysis

Analyze covariate distributions in your dataset:

python usage.py --mode analyze --dataset_path ./landscape_dataset

Model Architecture

Enhanced UNet with Covariate Conditioning

The project extends the standard DDPM UNet architecture with:

Covariate Embedding: MLP that encodes continuous covariates into the diffusion process
Classifier-Free Guidance: Supports both conditional and unconditional generation
Self-Attention Layers: Improved spatial relationships in generated images
Flexible Conditioning: Compatible with both class labels and continuous covariates

Key Components

UNet_Covariate: Base model with covariate conditioning
UNet_Conditional_Covariate: Supports both class labels and covariates
CovariateAwareDiffusion: Enhanced sampling with covariate control
EnhancedDataset: Automated covariate extraction and augmentation

Covariate Control

The model controls four image attributes:

Brightness (-1.0 to 1.0): Overall image luminance
Contrast (0.5 to 1.5): Difference between dark and light areas
Texture (0.0 to 1.0): Surface roughness and detail level
Noise (0.0 to 0.2): Amount of high-frequency noise

Preset Landscape Styles

The model includes pre-defined covariate combinations for various landscape types:

Natural Lighting

golden_hour, blue_hour, midday_sun, overcast

Terrain Types

smooth_plains, rocky_mountains, dense_forest, desert_dunes

Weather Conditions

clear_skies, stormy_weather, misty_morning, foggy_valley

Artistic Styles

high_contrast, soft_dreamy, dramatic_dark, vibrant_colors

Advanced Features

Covariate Interpolation

Create smooth transitions between different landscape styles:

from utils import interpolate_covariates

start_cov = presets["golden_hour"]
end_cov = presets["blue_hour"]
interpolated = interpolate_covariates(start_cov, end_cov, steps=10)

Custom Covariate Ranges

from modules import CovariateUtils

# Sample random covariates
covariates = CovariateUtils.sample_covariates(batch_size=4, device=device)

# Create specific covariate values
covariates = CovariateUtils.create_specific_covariates(
    batch_size=4, 
    brightness=0.5, 
    contrast=1.2, 
    texture=0.7, 
    noise_level=0.05
)

File Structure

Core Files

ddpm.py: Main implementation of covariate-controlled diffusion with training loops, sampling algorithms, and utility functions.
modules.py: Neural network architectures including covariate-conditioned UNet variants and attention mechanisms.
utils.py: Dataset handling, covariate analysis, visualization utilities, and preset management.
usage.py: Comprehensive example script demonstrating training, generation, analysis, and interactive modes.

Training Parameters

# Example training configuration
python usage.py --mode train \
    --dataset_path ./datasets/landscapes \
    --epochs 500 \
    --batch_size 8 \
    --image_size 64 \
    --learning_rate 3e-4 \
    --use_real_covariates  # Extract covariates from real images

Generation Options

# Generate with specific styles
python usage.py --mode generate \
    --model_path models/final_model.pt \
    --num_samples 8 \
    --cfg_scale 3.0  # Classifier-free guidance scale

# Create covariate control grids
python ddpm.py --model_path models/final_model.pt --mode grid

Dataset Preparation

Supported Formats

Folder structure with landscape images
Common image formats (JPEG, PNG, etc.)
Recommended minimum size: 64x64 pixels

Covariate Extraction

The dataset handler automatically extracts covariates from images:

from utils import LandscapeDataset

dataset = LandscapeDataset(
    root_dir="./landscapes",
    extract_covariates=True,    # Auto-extract brightness, contrast, etc.
    augment_covariates=False    # Add noise to covariates for robustness
)

Performance Tips

Training Optimization

Use smaller image sizes (64x64) for faster experimentation
Enable mixed precision training for GPU acceleration
Use larger batch sizes when memory permits

Generation Quality

Higher CFG scales (3.0-7.0) for more conditional control
More diffusion steps (1000) for better quality
Experiment with different covariate combinations

Troubleshooting

Common Issues

CUDA Out of Memory: Reduce batch size or image dimensions
Slow Training: Enable mixed precision or reduce model complexity
Poor Generation Quality: Increase training epochs or adjust learning rate
Covariate Overfitting: Increase CFG drop probability during training

Performance Monitoring

Use TensorBoard to monitor training progress:

tensorboard --logdir runs/

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
src		src
README.md		README.md
requirements.txt		requirements.txt

Folders and files

Latest commit

History

Repository files navigation

Denoising Diffusion Probabilistic Model

Key Features

Installation

Prerequisites

Dependencies

Quick Start

Training

Generation

Interactive Generation

Dataset Analysis

Model Architecture

Enhanced UNet with Covariate Conditioning

Key Components

Covariate Control

Preset Landscape Styles

Natural Lighting

Terrain Types

Weather Conditions

Artistic Styles

Advanced Features

Covariate Interpolation

Custom Covariate Ranges

File Structure

Core Files

Training Parameters

Generation Options

Dataset Preparation

Supported Formats

Covariate Extraction

Performance Tips

Training Optimization

Generation Quality

Troubleshooting

Common Issues

Performance Monitoring

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages