From 743ed373d0740c309c5fdf8f1ca798a829b3856f Mon Sep 17 00:00:00 2001
From: gayathrivijayakumar <gayathri@zipstack.com>
Date: Mon, 5 Jan 2026 20:24:30 +0530
Subject: [PATCH 01/22] Lookups firstcut

---
 backend/lookup/__init__.py                    |   0
 backend/lookup/apps.py                        |  11 +
 backend/lookup/constants.py                   |  28 +
 backend/lookup/exceptions.py                  |  60 ++
 backend/lookup/integrations/__init__.py       |   8 +
 .../integrations/file_storage_client.py       |  86 ++
 backend/lookup/integrations/llm_provider.py   | 311 ++++++
 .../integrations/llmwhisperer_client.py       | 334 +++++++
 backend/lookup/integrations/redis_cache.py    | 384 ++++++++
 backend/lookup/integrations/storage_client.py | 281 ++++++
 .../integrations/unstract_llm_client.py       | 113 +++
 backend/lookup/migrations/0001_initial.py     | 886 +++++++++++++++++
 backend/lookup/migrations/__init__.py         |   1 +
 backend/lookup/models/__init__.py             |  24 +
 backend/lookup/models/lookup_data_source.py   | 192 ++++
 .../lookup/models/lookup_execution_audit.py   | 134 +++
 backend/lookup/models/lookup_index_manager.py | 188 ++++
 .../lookup/models/lookup_profile_manager.py   | 157 +++
 backend/lookup/models/lookup_project.py       | 177 ++++
 .../lookup/models/lookup_prompt_template.py   | 178 ++++
 .../models/prompt_studio_lookup_link.py       | 128 +++
 backend/lookup/serializers.py                 | 333 +++++++
 backend/lookup/services/__init__.py           |  29 +
 backend/lookup/services/audit_logger.py       | 310 ++++++
 .../services/document_indexing_service.py     | 141 +++
 backend/lookup/services/enrichment_merger.py  | 174 ++++
 backend/lookup/services/indexing_service.py   | 471 +++++++++
 backend/lookup/services/llm_cache.py          | 186 ++++
 backend/lookup/services/lookup_executor.py    | 285 ++++++
 .../lookup/services/lookup_index_helper.py    | 190 ++++
 .../lookup/services/lookup_orchestrator.py    | 306 ++++++
 backend/lookup/services/mock_clients.py       | 157 +++
 .../lookup/services/reference_data_loader.py  | 267 +++++
 backend/lookup/services/variable_resolver.py  | 147 +++
 backend/lookup/tests/__init__.py              |   1 +
 backend/lookup/tests/test_api/__init__.py     |   3 +
 .../tests/test_api/test_execution_api.py      | 309 ++++++
 .../lookup/tests/test_api/test_linking_api.py | 260 +++++
 .../test_api/test_profile_manager_api.py      | 397 ++++++++
 .../lookup/tests/test_api/test_project_api.py | 215 ++++
 .../tests/test_api/test_template_api.py       | 175 ++++
 .../tests/test_integrations/__init__.py       |   3 +
 .../test_integrations/test_llm_integration.py | 239 +++++
 .../test_llmwhisperer_integration.py          | 297 ++++++
 .../test_redis_cache_integration.py           | 272 ++++++
 .../test_storage_integration.py               | 247 +++++
 backend/lookup/tests/test_migrations.py       | 286 ++++++
 .../tests/test_services/test_audit_logger.py  | 455 +++++++++
 .../test_services/test_enrichment_merger.py   | 547 +++++++++++
 .../tests/test_services/test_llm_cache.py     | 322 ++++++
 .../test_services/test_lookup_executor.py     | 418 ++++++++
 .../test_services/test_lookup_orchestrator.py | 521 ++++++++++
 .../test_reference_data_loader.py             | 565 +++++++++++
 .../lookup/tests/test_variable_resolver.py    | 289 ++++++
 backend/lookup/urls.py                        |  34 +
 backend/lookup/views.py                       | 924 ++++++++++++++++++
 frontend/src/assets/lookups.svg               |   6 +
 .../combined-output/CombinedOutput.css        |  43 +-
 .../combined-output/CombinedOutput.jsx        |  96 +-
 .../custom-tools/combined-output/JsonView.jsx |  80 +-
 .../combined-output/JsonViewBody.jsx          |  38 +
 .../CreateProjectModal.jsx                    |  92 ++
 .../components/lookups/debug-tab/DebugTab.css |   8 +
 .../components/lookups/debug-tab/DebugTab.jsx | 249 +++++
 .../ExecutionHistoryTab.css                   |  17 +
 .../ExecutionHistoryTab.jsx                   | 283 ++++++
 .../linked-projects-tab/LinkedProjectsTab.css |  17 +
 .../linked-projects-tab/LinkedProjectsTab.jsx | 376 +++++++
 .../ProfileFormModal.css                      |  17 +
 .../ProfileFormModal.jsx                      | 433 ++++++++
 .../ProfileManagementTab.css                  |  42 +
 .../ProfileManagementTab.jsx                  | 293 ++++++
 .../project-detail/LookUpProjectDetail.css    |  39 +
 .../project-detail/LookUpProjectDetail.jsx    | 321 ++++++
 .../project-list/LookUpProjectList.css        |  15 +
 .../project-list/LookUpProjectList.jsx        | 278 ++++++
 .../reference-data-tab/ReferenceDataTab.css   |  17 +
 .../reference-data-tab/ReferenceDataTab.jsx   | 342 +++++++
 .../lookups/template-tab/TemplateTab.css      |   8 +
 .../lookups/template-tab/TemplateTab.jsx      | 391 ++++++++
 .../navigations/side-nav-bar/SideNavBar.jsx   |   9 +
 .../src/layouts/menu-layout/MenuLayout.css    |   9 +-
 frontend/src/pages/LookUpsPage.jsx            |  23 +
 frontend/src/routes/useLookUpsRoutes.js       |  13 +
 frontend/src/routes/useMainAppRoutes.js       |  39 +-
 lookup/services/__init__.py                   |   0
 lookup/tests/test_services/__init__.py        |   0
 87 files changed, 17010 insertions(+), 40 deletions(-)
 create mode 100644 backend/lookup/__init__.py
 create mode 100644 backend/lookup/apps.py
 create mode 100644 backend/lookup/constants.py
 create mode 100644 backend/lookup/exceptions.py
 create mode 100644 backend/lookup/integrations/__init__.py
 create mode 100644 backend/lookup/integrations/file_storage_client.py
 create mode 100644 backend/lookup/integrations/llm_provider.py
 create mode 100644 backend/lookup/integrations/llmwhisperer_client.py
 create mode 100644 backend/lookup/integrations/redis_cache.py
 create mode 100644 backend/lookup/integrations/storage_client.py
 create mode 100644 backend/lookup/integrations/unstract_llm_client.py
 create mode 100644 backend/lookup/migrations/0001_initial.py
 create mode 100644 backend/lookup/migrations/__init__.py
 create mode 100644 backend/lookup/models/__init__.py
 create mode 100644 backend/lookup/models/lookup_data_source.py
 create mode 100644 backend/lookup/models/lookup_execution_audit.py
 create mode 100644 backend/lookup/models/lookup_index_manager.py
 create mode 100644 backend/lookup/models/lookup_profile_manager.py
 create mode 100644 backend/lookup/models/lookup_project.py
 create mode 100644 backend/lookup/models/lookup_prompt_template.py
 create mode 100644 backend/lookup/models/prompt_studio_lookup_link.py
 create mode 100644 backend/lookup/serializers.py
 create mode 100644 backend/lookup/services/__init__.py
 create mode 100644 backend/lookup/services/audit_logger.py
 create mode 100644 backend/lookup/services/document_indexing_service.py
 create mode 100644 backend/lookup/services/enrichment_merger.py
 create mode 100644 backend/lookup/services/indexing_service.py
 create mode 100644 backend/lookup/services/llm_cache.py
 create mode 100644 backend/lookup/services/lookup_executor.py
 create mode 100644 backend/lookup/services/lookup_index_helper.py
 create mode 100644 backend/lookup/services/lookup_orchestrator.py
 create mode 100644 backend/lookup/services/mock_clients.py
 create mode 100644 backend/lookup/services/reference_data_loader.py
 create mode 100644 backend/lookup/services/variable_resolver.py
 create mode 100644 backend/lookup/tests/__init__.py
 create mode 100644 backend/lookup/tests/test_api/__init__.py
 create mode 100644 backend/lookup/tests/test_api/test_execution_api.py
 create mode 100644 backend/lookup/tests/test_api/test_linking_api.py
 create mode 100644 backend/lookup/tests/test_api/test_profile_manager_api.py
 create mode 100644 backend/lookup/tests/test_api/test_project_api.py
 create mode 100644 backend/lookup/tests/test_api/test_template_api.py
 create mode 100644 backend/lookup/tests/test_integrations/__init__.py
 create mode 100644 backend/lookup/tests/test_integrations/test_llm_integration.py
 create mode 100644 backend/lookup/tests/test_integrations/test_llmwhisperer_integration.py
 create mode 100644 backend/lookup/tests/test_integrations/test_redis_cache_integration.py
 create mode 100644 backend/lookup/tests/test_integrations/test_storage_integration.py
 create mode 100644 backend/lookup/tests/test_migrations.py
 create mode 100644 backend/lookup/tests/test_services/test_audit_logger.py
 create mode 100644 backend/lookup/tests/test_services/test_enrichment_merger.py
 create mode 100644 backend/lookup/tests/test_services/test_llm_cache.py
 create mode 100644 backend/lookup/tests/test_services/test_lookup_executor.py
 create mode 100644 backend/lookup/tests/test_services/test_lookup_orchestrator.py
 create mode 100644 backend/lookup/tests/test_services/test_reference_data_loader.py
 create mode 100644 backend/lookup/tests/test_variable_resolver.py
 create mode 100644 backend/lookup/urls.py
 create mode 100644 backend/lookup/views.py
 create mode 100644 frontend/src/assets/lookups.svg
 create mode 100644 frontend/src/components/lookups/create-project-modal/CreateProjectModal.jsx
 create mode 100644 frontend/src/components/lookups/debug-tab/DebugTab.css
 create mode 100644 frontend/src/components/lookups/debug-tab/DebugTab.jsx
 create mode 100644 frontend/src/components/lookups/execution-history-tab/ExecutionHistoryTab.css
 create mode 100644 frontend/src/components/lookups/execution-history-tab/ExecutionHistoryTab.jsx
 create mode 100644 frontend/src/components/lookups/linked-projects-tab/LinkedProjectsTab.css
 create mode 100644 frontend/src/components/lookups/linked-projects-tab/LinkedProjectsTab.jsx
 create mode 100644 frontend/src/components/lookups/profile-management-tab/ProfileFormModal.css
 create mode 100644 frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx
 create mode 100644 frontend/src/components/lookups/profile-management-tab/ProfileManagementTab.css
 create mode 100644 frontend/src/components/lookups/profile-management-tab/ProfileManagementTab.jsx
 create mode 100644 frontend/src/components/lookups/project-detail/LookUpProjectDetail.css
 create mode 100644 frontend/src/components/lookups/project-detail/LookUpProjectDetail.jsx
 create mode 100644 frontend/src/components/lookups/project-list/LookUpProjectList.css
 create mode 100644 frontend/src/components/lookups/project-list/LookUpProjectList.jsx
 create mode 100644 frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.css
 create mode 100644 frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.jsx
 create mode 100644 frontend/src/components/lookups/template-tab/TemplateTab.css
 create mode 100644 frontend/src/components/lookups/template-tab/TemplateTab.jsx
 create mode 100644 frontend/src/pages/LookUpsPage.jsx
 create mode 100644 frontend/src/routes/useLookUpsRoutes.js
 create mode 100644 lookup/services/__init__.py
 create mode 100644 lookup/tests/test_services/__init__.py

diff --git a/backend/lookup/__init__.py b/backend/lookup/__init__.py
new file mode 100644
index 0000000000..e69de29bb2
diff --git a/backend/lookup/apps.py b/backend/lookup/apps.py
new file mode 100644
index 0000000000..ddaf2e194a
--- /dev/null
+++ b/backend/lookup/apps.py
@@ -0,0 +1,11 @@
+"""Lookup app configuration."""
+
+from django.apps import AppConfig
+
+
+class LookupConfig(AppConfig):
+    """Configuration for the Lookup application."""
+
+    default_auto_field = "django.db.models.BigAutoField"
+    name = "lookup"
+    verbose_name = "Look-Up System"
diff --git a/backend/lookup/constants.py b/backend/lookup/constants.py
new file mode 100644
index 0000000000..f41cc62bfc
--- /dev/null
+++ b/backend/lookup/constants.py
@@ -0,0 +1,28 @@
+"""Constants for the Look-Up system."""
+
+
+class LookupProfileManagerKeys:
+    """Keys used in LookupProfileManager serialization."""
+
+    CREATED_BY = "created_by"
+    MODIFIED_BY = "modified_by"
+    LOOKUP_PROJECT = "lookup_project"
+    PROFILE_NAME = "profile_name"
+    LLM = "llm"
+    VECTOR_STORE = "vector_store"
+    EMBEDDING_MODEL = "embedding_model"
+    X2TEXT = "x2text"
+    CHUNK_SIZE = "chunk_size"
+    CHUNK_OVERLAP = "chunk_overlap"
+    SIMILARITY_TOP_K = "similarity_top_k"
+    IS_DEFAULT = "is_default"
+    REINDEX = "reindex"
+
+
+class LookupProfileManagerErrors:
+    """Error messages for LookupProfileManager operations."""
+
+    SERIALIZATION_FAILED = "Data serialization failed."
+    PROFILE_NAME_EXISTS = "A profile with this name already exists for this project."
+    DUPLICATE_API = "It appears that a duplicate call may have been made."
+    NO_DEFAULT_PROFILE = "No default profile found for this project."
diff --git a/backend/lookup/exceptions.py b/backend/lookup/exceptions.py
new file mode 100644
index 0000000000..70d09a4bb3
--- /dev/null
+++ b/backend/lookup/exceptions.py
@@ -0,0 +1,60 @@
+"""Custom exceptions for the Look-Up system.
+
+This module defines custom exceptions specific to the Look-Up functionality.
+"""
+
+
+class LookupError(Exception):
+    """Base exception for Look-Up system errors."""
+
+    pass
+
+
+class ExtractionNotCompleteError(LookupError):
+    """Raised when attempting to use reference data before extraction is complete.
+
+    This exception is raised when trying to load reference data for a project
+    where one or more data sources have not completed extraction processing.
+    """
+
+    def __init__(self, failed_files=None):
+        """Initialize the exception.
+
+        Args:
+            failed_files: List of file names that failed or are pending extraction
+        """
+        self.failed_files = failed_files or []
+        message = "Reference data extraction not complete"
+        if failed_files:
+            message += f" for files: {', '.join(failed_files)}"
+        super().__init__(message)
+
+
+class TemplateNotFoundError(LookupError):
+    """Raised when a Look-Up project has no associated template.
+
+    This exception is raised when attempting to execute a Look-Up
+    that doesn't have a prompt template configured.
+    """
+
+    pass
+
+
+class ParseError(LookupError):
+    """Raised when LLM response cannot be parsed.
+
+    This exception is raised when the LLM returns a response that
+    cannot be parsed as valid JSON or doesn't match expected format.
+    """
+
+    pass
+
+
+class DefaultProfileError(LookupError):
+    """Raised when default profile is not found for a Look-Up project.
+
+    This exception is raised when attempting to get the default profile
+    for a Look-Up project that doesn't have one configured.
+    """
+
+    pass
diff --git a/backend/lookup/integrations/__init__.py b/backend/lookup/integrations/__init__.py
new file mode 100644
index 0000000000..53383fb10c
--- /dev/null
+++ b/backend/lookup/integrations/__init__.py
@@ -0,0 +1,8 @@
+"""Integration modules for Look-Up functionality.
+
+This package contains integrations with external services:
+- Object Storage (S3-compatible)
+- LLM Providers (OpenAI, Anthropic, etc.)
+- LLMWhisperer (Document extraction)
+- Redis Cache
+"""
diff --git a/backend/lookup/integrations/file_storage_client.py b/backend/lookup/integrations/file_storage_client.py
new file mode 100644
index 0000000000..28870c19e8
--- /dev/null
+++ b/backend/lookup/integrations/file_storage_client.py
@@ -0,0 +1,86 @@
+"""File Storage Client for Look-Up reference data.
+
+This module provides integration with Unstract's file storage
+for loading extracted reference data content.
+"""
+
+import logging
+
+from utils.file_storage.constants import FileStorageKeys
+
+from unstract.sdk1.file_storage.constants import StorageType
+from unstract.sdk1.file_storage.env_helper import EnvHelper
+
+logger = logging.getLogger(__name__)
+
+
+class FileStorageClient:
+    """Storage client implementation using Unstract's file storage.
+
+    This client uses the actual platform file storage to read
+    extracted reference data content.
+    """
+
+    def __init__(self):
+        """Initialize the file storage client."""
+        self.fs_instance = EnvHelper.get_storage(
+            storage_type=StorageType.PERMANENT,
+            env_name=FileStorageKeys.PERMANENT_REMOTE_STORAGE,
+        )
+
+    def get(self, path: str) -> str:
+        """Retrieve file content from storage.
+
+        Args:
+            path: Storage path to the file
+
+        Returns:
+            File content as string
+
+        Raises:
+            FileNotFoundError: If file doesn't exist
+            Exception: If reading fails
+        """
+        try:
+            if not self.fs_instance.exists(path):
+                logger.error(f"File not found: {path}")
+                raise FileNotFoundError(f"File not found: {path}")
+
+            # Use read() method with text mode
+            content = self.fs_instance.read(path, mode="r", encoding="utf-8")
+            logger.debug(f"Read {len(content)} chars from {path}")
+            return content
+
+        except FileNotFoundError:
+            raise
+        except Exception as e:
+            logger.error(f"Failed to read file {path}: {e}")
+            raise Exception(f"Failed to read file: {str(e)}")
+
+    def exists(self, path: str) -> bool:
+        """Check if path exists in storage.
+
+        Args:
+            path: Storage path
+
+        Returns:
+            True if exists
+        """
+        return self.fs_instance.exists(path)
+
+    def get_text_content(self, path: str) -> str | None:
+        """Get text content from storage (alias for get).
+
+        Args:
+            path: Storage path
+
+        Returns:
+            Text content or None if not found
+        """
+        try:
+            return self.get(path)
+        except FileNotFoundError:
+            return None
+        except Exception as e:
+            logger.warning(f"Error reading {path}: {e}")
+            return None
diff --git a/backend/lookup/integrations/llm_provider.py b/backend/lookup/integrations/llm_provider.py
new file mode 100644
index 0000000000..ca16d9b235
--- /dev/null
+++ b/backend/lookup/integrations/llm_provider.py
@@ -0,0 +1,311 @@
+"""LLM Provider integration for Look-Up enrichment.
+
+This module provides integration with various LLM providers
+(OpenAI, Anthropic, etc.) for generating enrichment data.
+"""
+
+import json
+import logging
+import os
+import time
+from typing import Any
+
+from ..protocols import LLMClient
+
+logger = logging.getLogger(__name__)
+
+
+class UnstractLLMClient(LLMClient):
+    """Implementation of LLMClient using Unstract's LLM abstraction.
+
+    This client integrates with the Unstract platform's LLM providers
+    to generate enrichment data for Look-Ups.
+    """
+
+    def __init__(self, provider: str | None = None, model: str | None = None):
+        """Initialize the LLM client.
+
+        Args:
+            provider: LLM provider name (e.g., 'openai', 'anthropic')
+            model: Model name (e.g., 'gpt-4', 'claude-2')
+        """
+        self.default_provider = provider or os.getenv(
+            "LOOKUP_DEFAULT_LLM_PROVIDER", "openai"
+        )
+        self.default_model = model or os.getenv("LOOKUP_DEFAULT_LLM_MODEL", "gpt-4")
+
+        # Import Unstract LLM utilities
+        try:
+            from unstract.llmbox import LLMBox
+            from unstract.llmbox.llm import LLM
+
+            self.LLMBox = LLMBox
+            self.LLM = LLM
+            self.llm_available = True
+        except ImportError:
+            logger.warning("Unstract LLMBox not available, using fallback implementation")
+            self.llm_available = False
+
+    def _get_llm_instance(self, config: dict[str, Any]):
+        """Get an LLM instance based on configuration.
+
+        Args:
+            config: LLM configuration
+
+        Returns:
+            LLM instance
+        """
+        if not self.llm_available:
+            raise RuntimeError("LLM integration not available")
+
+        provider = config.get("provider", self.default_provider)
+        model = config.get("model", self.default_model)
+
+        # Create LLM instance using Unstract's LLMBox
+        # This would integrate with the actual Unstract LLM abstraction
+        # For now, we'll use a simplified approach
+
+        # Map provider to Unstract's LLM types
+        provider_map = {
+            "openai": "OpenAI",
+            "anthropic": "Anthropic",
+            "azure_openai": "AzureOpenAI",
+            "gemini": "Gemini",
+            "vertex_ai": "VertexAI",
+        }
+
+        llm_provider = provider_map.get(provider, "OpenAI")
+
+        # Create configuration for the provider
+        llm_config = {
+            "provider": llm_provider,
+            "model": model,
+            "temperature": config.get("temperature", 0.7),
+            "max_tokens": config.get("max_tokens", 1000),
+        }
+
+        # Add API keys based on provider
+        if provider == "openai":
+            llm_config["api_key"] = os.getenv("OPENAI_API_KEY")
+        elif provider == "anthropic":
+            llm_config["api_key"] = os.getenv("ANTHROPIC_API_KEY")
+        elif provider == "azure_openai":
+            llm_config["api_key"] = os.getenv("AZURE_OPENAI_API_KEY")
+            llm_config["endpoint"] = os.getenv("AZURE_OPENAI_ENDPOINT")
+
+        # For now, return a mock implementation
+        # In production, this would create actual LLM instance
+        return llm_config
+
+    def generate(self, prompt: str, config: dict[str, Any], timeout: int = 30) -> str:
+        """Generate LLM response for Look-Up enrichment.
+
+        Args:
+            prompt: The prompt text with resolved variables
+            config: LLM configuration (provider, model, temperature, etc.)
+            timeout: Request timeout in seconds
+
+        Returns:
+            JSON-formatted string with enrichment data
+
+        Raises:
+            RuntimeError: If LLM call fails
+        """
+        start_time = time.time()
+
+        try:
+            if self.llm_available:
+                # Use actual Unstract LLM integration
+                llm_config = self._get_llm_instance(config)
+
+                # In production, this would make actual LLM call
+                # For now, simulate the call
+                response = self._simulate_llm_call(prompt, llm_config)
+            else:
+                # Fallback implementation
+                response = self._fallback_generate(prompt, config)
+
+            # Validate response is JSON
+            try:
+                json.loads(response)
+            except json.JSONDecodeError:
+                # Try to extract JSON from response
+                response = self._extract_json(response)
+
+            elapsed_time = time.time() - start_time
+            logger.info(f"LLM generation completed in {elapsed_time:.2f}s")
+
+            return response
+
+        except Exception as e:
+            logger.error(f"LLM generation failed: {e}")
+            raise RuntimeError(f"LLM generation failed: {str(e)}")
+
+    def _simulate_llm_call(self, prompt: str, config: dict[str, Any]) -> str:
+        """Simulate LLM call for development/testing.
+
+        In production, this would be replaced with actual LLM API calls.
+        """
+        # Simulate some processing
+        time.sleep(0.5)
+
+        # Generate mock response based on prompt content
+        if "vendor" in prompt.lower():
+            return json.dumps(
+                {
+                    "canonical_vendor": "Sample Vendor Inc.",
+                    "vendor_category": "SaaS",
+                    "vendor_type": "Software",
+                    "confidence": 0.95,
+                }
+            )
+        elif "product" in prompt.lower():
+            return json.dumps(
+                {
+                    "product_name": "Sample Product",
+                    "product_category": "Enterprise Software",
+                    "product_type": "Cloud Service",
+                    "confidence": 0.92,
+                }
+            )
+        else:
+            return json.dumps({"enriched_data": "Sample enrichment", "confidence": 0.88})
+
+    def _fallback_generate(self, prompt: str, config: dict[str, Any]) -> str:
+        """Fallback generation when LLM integration is not available.
+
+        This is primarily for testing and development.
+        """
+        logger.warning("Using fallback LLM generation")
+
+        # Simple pattern matching for testing
+        response_data = {
+            "status": "fallback",
+            "message": "LLM integration not available",
+            "confidence": 0.5,
+        }
+
+        # Add some basic enrichment based on prompt
+        if "vendor" in prompt.lower():
+            response_data["canonical_vendor"] = "Unknown Vendor"
+            response_data["vendor_category"] = "Unknown"
+        elif "product" in prompt.lower():
+            response_data["product_name"] = "Unknown Product"
+            response_data["product_category"] = "Unknown"
+
+        return json.dumps(response_data)
+
+    def _extract_json(self, response: str) -> str:
+        """Extract JSON from LLM response if wrapped in text.
+
+        Args:
+            response: Raw LLM response
+
+        Returns:
+            Extracted JSON string
+        """
+        # Try to find JSON in the response
+        import re
+
+        # Look for JSON object pattern
+        json_pattern = r"\{[^{}]*\}"
+        matches = re.findall(json_pattern, response)
+
+        if matches:
+            # Try to parse each match
+            for match in matches:
+                try:
+                    json.loads(match)
+                    return match
+                except json.JSONDecodeError:
+                    continue
+
+        # If no valid JSON found, create a basic response
+        return json.dumps(
+            {
+                "raw_response": response[:500],  # Truncate if too long
+                "confidence": 0.3,
+                "warning": "Could not extract structured data",
+            }
+        )
+
+    def validate_response(self, response: str) -> bool:
+        """Validate that the LLM response is properly formatted.
+
+        Args:
+            response: LLM response string
+
+        Returns:
+            True if valid JSON with required fields
+        """
+        try:
+            data = json.loads(response)
+
+            # Check for confidence score
+            if "confidence" not in data:
+                logger.warning("Response missing confidence score")
+                return False
+
+            # Check confidence is valid
+            confidence = data.get("confidence", 0)
+            if not (0 <= confidence <= 1):
+                logger.warning(f"Invalid confidence score: {confidence}")
+                return False
+
+            return True
+
+        except json.JSONDecodeError:
+            logger.error("Response is not valid JSON")
+            return False
+
+    def get_token_count(self, text: str, model: str = None) -> int:
+        """Estimate token count for the given text.
+
+        Args:
+            text: Input text
+            model: Model name for accurate counting
+
+        Returns:
+            Estimated token count
+        """
+        # Simple estimation: ~4 characters per token
+        # In production, use tiktoken or model-specific tokenizer
+        return len(text) // 4
+
+
+class OpenAILLMClient(UnstractLLMClient):
+    """OpenAI-specific LLM client implementation."""
+
+    def __init__(self):
+        """Initialize OpenAI client."""
+        super().__init__(provider="openai", model="gpt-4")
+
+    def generate(self, prompt: str, config: dict[str, Any], timeout: int = 30) -> str:
+        """Generate using OpenAI API."""
+        # Override config with OpenAI defaults
+        config = {
+            **config,
+            "provider": "openai",
+            "model": config.get("model", "gpt-4"),
+            "temperature": config.get("temperature", 0.7),
+        }
+        return super().generate(prompt, config, timeout)
+
+
+class AnthropicLLMClient(UnstractLLMClient):
+    """Anthropic-specific LLM client implementation."""
+
+    def __init__(self):
+        """Initialize Anthropic client."""
+        super().__init__(provider="anthropic", model="claude-2")
+
+    def generate(self, prompt: str, config: dict[str, Any], timeout: int = 30) -> str:
+        """Generate using Anthropic API."""
+        # Override config with Anthropic defaults
+        config = {
+            **config,
+            "provider": "anthropic",
+            "model": config.get("model", "claude-2"),
+            "temperature": config.get("temperature", 0.7),
+        }
+        return super().generate(prompt, config, timeout)
diff --git a/backend/lookup/integrations/llmwhisperer_client.py b/backend/lookup/integrations/llmwhisperer_client.py
new file mode 100644
index 0000000000..5445196e97
--- /dev/null
+++ b/backend/lookup/integrations/llmwhisperer_client.py
@@ -0,0 +1,334 @@
+"""LLMWhisperer integration for document text extraction.
+
+This module provides integration with LLMWhisperer service
+for extracting text from various document formats.
+"""
+
+import logging
+import time
+from enum import Enum
+from typing import Any
+
+import requests
+from django.conf import settings
+
+logger = logging.getLogger(__name__)
+
+
+class ExtractionStatus(Enum):
+    """Status of document extraction."""
+
+    PENDING = "pending"
+    PROCESSING = "processing"
+    COMPLETE = "complete"
+    FAILED = "failed"
+    NOT_REQUIRED = "not_required"
+
+
+class LLMWhispererClient:
+    """Client for integrating with LLMWhisperer document extraction service.
+
+    LLMWhisperer extracts text from PDFs, images, and other document formats
+    for use as reference data in Look-Ups.
+    """
+
+    def __init__(self):
+        """Initialize LLMWhisperer client with configuration."""
+        self.base_url = getattr(
+            settings, "LLMWHISPERER_BASE_URL", "https://api.llmwhisperer.com"
+        )
+        self.api_key = getattr(settings, "LLMWHISPERER_API_KEY", "")
+
+        if not self.api_key:
+            logger.warning("LLMWhisperer API key not configured")
+
+        self.session = requests.Session()
+        self.session.headers.update(
+            {
+                "Content-Type": "application/json",
+                "Authorization": f"Bearer {self.api_key}",
+            }
+        )
+
+    def extract_text(
+        self,
+        file_content: bytes,
+        file_name: str,
+        extraction_config: dict[str, Any] | None = None,
+    ) -> tuple[str, str]:
+        """Extract text from a document using LLMWhisperer.
+
+        Args:
+            file_content: File content as bytes
+            file_name: Original file name
+            extraction_config: Optional extraction configuration
+
+        Returns:
+            Tuple of (extraction_id, status)
+        """
+        if not self.api_key:
+            logger.error("LLMWhisperer API key not configured")
+            return "", ExtractionStatus.FAILED.value
+
+        try:
+            # Prepare extraction request
+            config = extraction_config or self._get_default_config()
+
+            # Create extraction job
+            url = f"{self.base_url}/v1/extract"
+
+            # Prepare multipart form data
+            files = {"file": (file_name, file_content)}
+
+            # Add configuration as form data
+            data = {
+                "processing_mode": config.get("processing_mode", "ocr"),
+                "output_format": config.get("output_format", "text"),
+                "page_separator": config.get("page_separator", "\n---\n"),
+                "force_text_processing": str(
+                    config.get("force_text_processing", True)
+                ).lower(),
+                "line_splitter": config.get("line_splitter", "line"),
+                "horizontal_stretch": str(config.get("horizontal_stretch", 1.0)),
+                "vertical_stretch": str(config.get("vertical_stretch", 1.0)),
+            }
+
+            # Remove JSON content type for multipart
+            headers = {"Authorization": f"Bearer {self.api_key}"}
+
+            response = requests.post(
+                url, files=files, data=data, headers=headers, timeout=30
+            )
+
+            if response.status_code == 200:
+                result = response.json()
+                extraction_id = result.get("extraction_id", "")
+                logger.info(f"Started extraction job: {extraction_id}")
+                return extraction_id, ExtractionStatus.PROCESSING.value
+            else:
+                logger.error(
+                    f"Extraction failed with status {response.status_code}: {response.text}"
+                )
+                return "", ExtractionStatus.FAILED.value
+
+        except requests.exceptions.RequestException as e:
+            logger.error(f"LLMWhisperer extraction request failed: {e}")
+            return "", ExtractionStatus.FAILED.value
+        except Exception as e:
+            logger.error(f"Unexpected error during extraction: {e}")
+            return "", ExtractionStatus.FAILED.value
+
+    def check_extraction_status(self, extraction_id: str) -> tuple[str, str | None]:
+        """Check the status of an extraction job.
+
+        Args:
+            extraction_id: Extraction job ID
+
+        Returns:
+            Tuple of (status, extracted_text)
+        """
+        if not extraction_id:
+            return ExtractionStatus.FAILED.value, None
+
+        try:
+            url = f"{self.base_url}/v1/status/{extraction_id}"
+
+            response = self.session.get(url, timeout=10)
+
+            if response.status_code == 200:
+                result = response.json()
+                status = result.get("status", "unknown")
+
+                if status == "completed":
+                    # Get extracted text
+                    text = self._get_extracted_text(extraction_id)
+                    return ExtractionStatus.COMPLETE.value, text
+                elif status == "processing":
+                    return ExtractionStatus.PROCESSING.value, None
+                elif status == "failed":
+                    error_msg = result.get("error", "Unknown error")
+                    logger.error(f"Extraction {extraction_id} failed: {error_msg}")
+                    return ExtractionStatus.FAILED.value, None
+                else:
+                    logger.warning(f"Unknown extraction status: {status}")
+                    return ExtractionStatus.PENDING.value, None
+            else:
+                logger.error(f"Status check failed with code {response.status_code}")
+                return ExtractionStatus.FAILED.value, None
+
+        except Exception as e:
+            logger.error(f"Error checking extraction status: {e}")
+            return ExtractionStatus.FAILED.value, None
+
+    def _get_extracted_text(self, extraction_id: str) -> str | None:
+        """Retrieve extracted text for a completed job.
+
+        Args:
+            extraction_id: Extraction job ID
+
+        Returns:
+            Extracted text or None
+        """
+        try:
+            url = f"{self.base_url}/v1/result/{extraction_id}"
+
+            response = self.session.get(url, timeout=30)
+
+            if response.status_code == 200:
+                # Response is the extracted text
+                return response.text
+            else:
+                logger.error(f"Failed to get extraction result: {response.status_code}")
+                return None
+
+        except Exception as e:
+            logger.error(f"Error retrieving extracted text: {e}")
+            return None
+
+    def wait_for_extraction(
+        self, extraction_id: str, max_wait_seconds: int = 300, poll_interval: int = 5
+    ) -> tuple[str, str | None]:
+        """Wait for extraction to complete with polling.
+
+        Args:
+            extraction_id: Extraction job ID
+            max_wait_seconds: Maximum time to wait
+            poll_interval: Seconds between status checks
+
+        Returns:
+            Tuple of (final_status, extracted_text)
+        """
+        start_time = time.time()
+
+        while time.time() - start_time < max_wait_seconds:
+            status, text = self.check_extraction_status(extraction_id)
+
+            if status == ExtractionStatus.COMPLETE.value:
+                logger.info(f"Extraction {extraction_id} completed successfully")
+                return status, text
+            elif status == ExtractionStatus.FAILED.value:
+                logger.error(f"Extraction {extraction_id} failed")
+                return status, None
+            elif status == ExtractionStatus.PROCESSING.value:
+                logger.debug(f"Extraction {extraction_id} still processing...")
+                time.sleep(poll_interval)
+            else:
+                logger.warning(f"Unexpected status for {extraction_id}: {status}")
+                time.sleep(poll_interval)
+
+        logger.error(
+            f"Extraction {extraction_id} timed out after {max_wait_seconds} seconds"
+        )
+        return ExtractionStatus.FAILED.value, None
+
+    def extract_and_wait(
+        self,
+        file_content: bytes,
+        file_name: str,
+        extraction_config: dict[str, Any] | None = None,
+        max_wait_seconds: int = 300,
+    ) -> tuple[bool, str | None]:
+        """Extract text and wait for completion.
+
+        Args:
+            file_content: File content
+            file_name: File name
+            extraction_config: Extraction configuration
+            max_wait_seconds: Maximum wait time
+
+        Returns:
+            Tuple of (success, extracted_text)
+        """
+        # Start extraction
+        extraction_id, status = self.extract_text(
+            file_content, file_name, extraction_config
+        )
+
+        if status == ExtractionStatus.FAILED.value:
+            return False, None
+
+        # Wait for completion
+        final_status, text = self.wait_for_extraction(extraction_id, max_wait_seconds)
+
+        return final_status == ExtractionStatus.COMPLETE.value, text
+
+    def _get_default_config(self) -> dict[str, Any]:
+        """Get default extraction configuration.
+
+        Returns:
+            Default configuration dictionary
+        """
+        return {
+            "processing_mode": "ocr",  # 'ocr' or 'text'
+            "output_format": "text",  # 'text' or 'markdown'
+            "page_separator": "\n---\n",
+            "force_text_processing": True,
+            "line_splitter": "line",  # 'line' or 'paragraph'
+            "horizontal_stretch": 1.0,
+            "vertical_stretch": 1.0,
+            "pages": "",  # Empty for all pages
+            "timeout": 300,
+            "store_metadata": False,
+        }
+
+    def is_extraction_needed(self, file_name: str) -> bool:
+        """Check if extraction is needed for the file type.
+
+        Args:
+            file_name: File name with extension
+
+        Returns:
+            True if extraction is needed
+        """
+        # File types that need extraction
+        extractable_extensions = {
+            ".pdf",
+            ".png",
+            ".jpg",
+            ".jpeg",
+            ".tiff",
+            ".bmp",
+            ".docx",
+            ".doc",
+            ".pptx",
+            ".ppt",
+            ".xlsx",
+            ".xls",
+        }
+
+        # Check file extension
+        import os
+
+        _, ext = os.path.splitext(file_name.lower())
+        return ext in extractable_extensions
+
+    def get_extraction_config_for_file(self, file_name: str) -> dict[str, Any]:
+        """Get optimal extraction configuration based on file type.
+
+        Args:
+            file_name: File name with extension
+
+        Returns:
+            Extraction configuration
+        """
+        import os
+
+        _, ext = os.path.splitext(file_name.lower())
+
+        config = self._get_default_config()
+
+        # Optimize based on file type
+        if ext in [".pdf"]:
+            config["processing_mode"] = "ocr"
+            config["force_text_processing"] = True
+        elif ext in [".png", ".jpg", ".jpeg", ".tiff", ".bmp"]:
+            config["processing_mode"] = "ocr"
+            config["force_text_processing"] = False
+        elif ext in [".docx", ".doc"]:
+            config["processing_mode"] = "text"
+            config["output_format"] = "markdown"
+        elif ext in [".xlsx", ".xls"]:
+            config["processing_mode"] = "text"
+            config["line_splitter"] = "paragraph"
+
+        return config
diff --git a/backend/lookup/integrations/redis_cache.py b/backend/lookup/integrations/redis_cache.py
new file mode 100644
index 0000000000..976164a6ac
--- /dev/null
+++ b/backend/lookup/integrations/redis_cache.py
@@ -0,0 +1,384 @@
+"""Redis cache implementation for Look-Up LLM responses.
+
+This module provides a Redis-based cache for storing and retrieving
+LLM responses to improve performance and reduce API costs.
+"""
+
+import hashlib
+import logging
+import time
+from typing import Any
+
+try:
+    import redis
+    from redis.exceptions import RedisError
+
+    REDIS_AVAILABLE = True
+except ImportError:
+    REDIS_AVAILABLE = False
+
+from django.conf import settings
+
+logger = logging.getLogger(__name__)
+
+
+class RedisLLMCache:
+    """Redis-based cache for LLM responses.
+
+    Provides persistent caching with TTL support and
+    automatic failover to in-memory cache if Redis is unavailable.
+    """
+
+    def __init__(
+        self,
+        ttl_hours: int = 24,
+        key_prefix: str = "lookup:llm:",
+        fallback_to_memory: bool = True,
+    ):
+        """Initialize Redis cache.
+
+        Args:
+            ttl_hours: Time-to-live for cache entries in hours
+            key_prefix: Prefix for all cache keys
+            fallback_to_memory: Use in-memory cache if Redis unavailable
+        """
+        self.ttl_seconds = ttl_hours * 3600
+        self.key_prefix = key_prefix
+        self.fallback_to_memory = fallback_to_memory
+
+        # Initialize Redis connection
+        self.redis_client = self._init_redis()
+
+        # Fallback in-memory cache
+        if self.fallback_to_memory:
+            from ..services.llm_cache import LLMResponseCache
+
+            self.memory_cache = LLMResponseCache(ttl_hours)
+        else:
+            self.memory_cache = None
+
+    def _init_redis(self) -> Any | None:
+        """Initialize Redis connection.
+
+        Returns:
+            Redis client or None if unavailable
+        """
+        if not REDIS_AVAILABLE:
+            logger.warning("Redis package not installed, using fallback cache")
+            return None
+
+        try:
+            # Get Redis configuration from settings
+            redis_host = getattr(settings, "REDIS_HOST", "localhost")
+            redis_port = getattr(settings, "REDIS_PORT", 6379)
+            redis_db = getattr(settings, "REDIS_CACHE_DB", 1)
+            redis_password = getattr(settings, "REDIS_PASSWORD", None)
+
+            # Create Redis client
+            client = redis.Redis(
+                host=redis_host,
+                port=redis_port,
+                db=redis_db,
+                password=redis_password,
+                decode_responses=True,
+                socket_connect_timeout=5,
+                socket_timeout=5,
+            )
+
+            # Test connection
+            client.ping()
+            logger.info(f"Connected to Redis at {redis_host}:{redis_port}/{redis_db}")
+            return client
+
+        except Exception as e:
+            logger.warning(f"Failed to connect to Redis: {e}")
+            return None
+
+    def generate_cache_key(self, prompt: str, reference_data: str) -> str:
+        """Generate a cache key from prompt and reference data.
+
+        Args:
+            prompt: The resolved prompt
+            reference_data: The reference data content
+
+        Returns:
+            SHA256 hash as cache key
+        """
+        combined = f"{prompt}{reference_data}"
+        hash_obj = hashlib.sha256(combined.encode("utf-8"))
+        return f"{self.key_prefix}{hash_obj.hexdigest()}"
+
+    def get(self, key: str) -> str | None:
+        """Get cached response.
+
+        Args:
+            key: Cache key
+
+        Returns:
+            Cached response or None if not found/expired
+        """
+        # Try Redis first
+        if self.redis_client:
+            try:
+                value = self.redis_client.get(key)
+                if value:
+                    logger.debug(f"Redis cache hit for key: {key[:20]}...")
+                    self._update_stats("hits")
+                    return value
+                else:
+                    logger.debug(f"Redis cache miss for key: {key[:20]}...")
+                    self._update_stats("misses")
+            except RedisError as e:
+                logger.error(f"Redis get error: {e}")
+                # Fall through to memory cache
+
+        # Fallback to memory cache
+        if self.memory_cache:
+            # Remove prefix for memory cache
+            memory_key = key.replace(self.key_prefix, "")
+            value = self.memory_cache.get(memory_key)
+            if value:
+                logger.debug(f"Memory cache hit for key: {key[:20]}...")
+            return value
+
+        return None
+
+    def set(self, key: str, value: str, ttl: int | None = None) -> bool:
+        """Set cache value.
+
+        Args:
+            key: Cache key
+            value: Response to cache
+            ttl: Optional TTL override in seconds
+
+        Returns:
+            True if successful
+        """
+        ttl = ttl or self.ttl_seconds
+
+        # Try Redis first
+        if self.redis_client:
+            try:
+                self.redis_client.setex(name=key, time=ttl, value=value)
+                logger.debug(f"Cached to Redis with key: {key[:20]}... (TTL: {ttl}s)")
+                self._update_stats("sets")
+                return True
+            except RedisError as e:
+                logger.error(f"Redis set error: {e}")
+                # Fall through to memory cache
+
+        # Fallback to memory cache
+        if self.memory_cache:
+            # Remove prefix for memory cache
+            memory_key = key.replace(self.key_prefix, "")
+            self.memory_cache.set(memory_key, value)
+            logger.debug(f"Cached to memory with key: {key[:20]}...")
+            return True
+
+        return False
+
+    def delete(self, key: str) -> bool:
+        """Delete a cache entry.
+
+        Args:
+            key: Cache key
+
+        Returns:
+            True if deleted
+        """
+        deleted = False
+
+        # Try Redis
+        if self.redis_client:
+            try:
+                result = self.redis_client.delete(key)
+                if result > 0:
+                    deleted = True
+                    logger.debug(f"Deleted from Redis: {key[:20]}...")
+            except RedisError as e:
+                logger.error(f"Redis delete error: {e}")
+
+        # Also delete from memory cache
+        if self.memory_cache:
+            memory_key = key.replace(self.key_prefix, "")
+            if memory_key in self.memory_cache.cache:
+                del self.memory_cache.cache[memory_key]
+                deleted = True
+                logger.debug(f"Deleted from memory: {key[:20]}...")
+
+        return deleted
+
+    def clear_pattern(self, pattern: str) -> int:
+        """Clear all cache entries matching a pattern.
+
+        Args:
+            pattern: Pattern to match (e.g., "lookup:llm:project_*")
+
+        Returns:
+            Number of entries cleared
+        """
+        count = 0
+
+        # Clear from Redis
+        if self.redis_client:
+            try:
+                # Use SCAN to find matching keys
+                cursor = 0
+                while True:
+                    cursor, keys = self.redis_client.scan(
+                        cursor=cursor, match=pattern, count=100
+                    )
+                    if keys:
+                        count += self.redis_client.delete(*keys)
+                    if cursor == 0:
+                        break
+
+                logger.info(f"Cleared {count} entries from Redis matching: {pattern}")
+            except RedisError as e:
+                logger.error(f"Redis clear pattern error: {e}")
+
+        # Clear from memory cache
+        if self.memory_cache:
+            # Remove prefix from pattern
+            memory_pattern = pattern.replace(self.key_prefix, "")
+            keys_to_delete = [
+                k
+                for k in self.memory_cache.cache.keys()
+                if self._match_pattern(k, memory_pattern)
+            ]
+            for key in keys_to_delete:
+                del self.memory_cache.cache[key]
+                count += 1
+
+            logger.info(f"Cleared {len(keys_to_delete)} entries from memory")
+
+        return count
+
+    def _match_pattern(self, key: str, pattern: str) -> bool:
+        """Simple pattern matching for memory cache.
+
+        Args:
+            key: Key to check
+            pattern: Pattern with * wildcards
+
+        Returns:
+            True if matches
+        """
+        import fnmatch
+
+        return fnmatch.fnmatch(key, pattern)
+
+    def get_stats(self) -> dict[str, Any]:
+        """Get cache statistics.
+
+        Returns:
+            Dictionary of cache statistics
+        """
+        stats = {
+            "backend": "redis" if self.redis_client else "memory",
+            "ttl_hours": self.ttl_seconds // 3600,
+            "key_prefix": self.key_prefix,
+        }
+
+        # Get Redis stats
+        if self.redis_client:
+            try:
+                info = self.redis_client.info("stats")
+                stats["redis"] = {
+                    "total_connections": info.get("total_connections_received", 0),
+                    "keyspace_hits": info.get("keyspace_hits", 0),
+                    "keyspace_misses": info.get("keyspace_misses", 0),
+                    "hit_rate": self._calculate_hit_rate(
+                        info.get("keyspace_hits", 0), info.get("keyspace_misses", 0)
+                    ),
+                }
+
+                # Get key count
+                dbinfo = self.redis_client.info("keyspace")
+                db_key = f"db{self.redis_client.connection_pool.connection_kwargs.get('db', 0)}"
+                if db_key in dbinfo:
+                    stats["redis"]["total_keys"] = dbinfo[db_key].get("keys", 0)
+
+            except RedisError as e:
+                logger.error(f"Failed to get Redis stats: {e}")
+                stats["redis"] = {"error": str(e)}
+
+        # Get memory cache stats
+        if self.memory_cache:
+            stats["memory"] = {
+                "entries": len(self.memory_cache.cache),
+                "size_estimate": sum(
+                    len(k) + len(v[0]) for k, v in self.memory_cache.cache.items()
+                ),
+            }
+
+        return stats
+
+    def _calculate_hit_rate(self, hits: int, misses: int) -> float:
+        """Calculate cache hit rate."""
+        total = hits + misses
+        return (hits / total) if total > 0 else 0.0
+
+    def _update_stats(self, stat_type: str) -> None:
+        """Update internal statistics.
+
+        Args:
+            stat_type: Type of stat to update ('hits', 'misses', 'sets')
+        """
+        # This could be extended to track more detailed statistics
+        pass
+
+    def cleanup_expired(self) -> int:
+        """Clean up expired entries.
+
+        For Redis, this happens automatically with TTL.
+        For memory cache, we clean up lazily.
+
+        Returns:
+            Number of entries cleaned up
+        """
+        count = 0
+
+        # Redis handles expiration automatically
+        if self.redis_client:
+            logger.debug("Redis handles expiration automatically")
+
+        # Clean memory cache
+        if self.memory_cache:
+            current_time = time.time()
+            keys_to_delete = []
+
+            for key, (value, expiry) in list(self.memory_cache.cache.items()):
+                if current_time >= expiry:
+                    keys_to_delete.append(key)
+
+            for key in keys_to_delete:
+                del self.memory_cache.cache[key]
+                count += 1
+
+            if count > 0:
+                logger.info(f"Cleaned up {count} expired entries from memory cache")
+
+        return count
+
+    def warmup(self, project_id: str, preload_data: dict[str, str]) -> int:
+        """Warm up cache with preloaded data.
+
+        Args:
+            project_id: Project ID for namespacing
+            preload_data: Dictionary of prompt->response to preload
+
+        Returns:
+            Number of entries preloaded
+        """
+        count = 0
+
+        for prompt, response in preload_data.items():
+            # Generate key with project namespace
+            key = f"{self.key_prefix}project:{project_id}:{hashlib.md5(prompt.encode()).hexdigest()}"
+
+            if self.set(key, response):
+                count += 1
+
+        logger.info(f"Warmed up cache with {count} entries for project {project_id}")
+        return count
diff --git a/backend/lookup/integrations/storage_client.py b/backend/lookup/integrations/storage_client.py
new file mode 100644
index 0000000000..816cf72f9c
--- /dev/null
+++ b/backend/lookup/integrations/storage_client.py
@@ -0,0 +1,281 @@
+"""Object Storage integration for Look-Up reference data.
+
+This module provides integration with PERMANENT_REMOTE_STORAGE
+for storing and retrieving reference data files.
+"""
+
+import logging
+from pathlib import Path
+from typing import Any
+from uuid import UUID
+
+from utils.file_storage.constants import FileStorageKeys
+
+from unstract.sdk1.file_storage.constants import StorageType
+from unstract.sdk1.file_storage.env_helper import EnvHelper
+
+from ..protocols import StorageClient
+
+logger = logging.getLogger(__name__)
+
+
+class RemoteStorageClient(StorageClient):
+    """Implementation of StorageClient using PERMANENT_REMOTE_STORAGE.
+
+    This client integrates with the Unstract file storage system
+    to store and retrieve Look-Up reference data.
+    """
+
+    def __init__(self, base_path: str = "lookup/reference_data"):
+        """Initialize the remote storage client.
+
+        Args:
+            base_path: Base path for Look-Up data in storage
+        """
+        self.base_path = base_path
+        self.fs_instance = EnvHelper.get_storage(
+            storage_type=StorageType.PERMANENT,
+            env_name=FileStorageKeys.PERMANENT_REMOTE_STORAGE,
+        )
+
+    def _get_project_path(self, project_id: UUID) -> str:
+        """Get the storage path for a project.
+
+        Args:
+            project_id: Project UUID
+
+        Returns:
+            Storage path string
+        """
+        return str(Path(self.base_path) / str(project_id))
+
+    def _get_file_path(self, project_id: UUID, filename: str) -> str:
+        """Get the full storage path for a file.
+
+        Args:
+            project_id: Project UUID
+            filename: File name
+
+        Returns:
+            Full storage path
+        """
+        return str(Path(self._get_project_path(project_id)) / filename)
+
+    def upload(self, path: str, content: bytes) -> bool:
+        """Upload content to remote storage.
+
+        Args:
+            path: Storage path
+            content: File content as bytes
+
+        Returns:
+            True if successful, False otherwise
+        """
+        try:
+            # Ensure parent directory exists
+            parent_dir = str(Path(path).parent)
+            self.fs_instance.mkdir(parent_dir, create_parents=True)
+
+            # Write content
+            self.fs_instance.write(path=path, mode="wb", data=content)
+            logger.info(f"Successfully uploaded file to {path}")
+            return True
+
+        except Exception as e:
+            logger.error(f"Failed to upload file to {path}: {e}")
+            return False
+
+    def download(self, path: str) -> bytes | None:
+        """Download content from remote storage.
+
+        Args:
+            path: Storage path
+
+        Returns:
+            File content as bytes or None if not found
+        """
+        try:
+            if not self.exists(path):
+                logger.warning(f"File not found at path: {path}")
+                return None
+
+            # Read content
+            content = self.fs_instance.read(path=path, mode="rb")
+            logger.info(f"Successfully downloaded file from {path}")
+            return content
+
+        except Exception as e:
+            logger.error(f"Failed to download file from {path}: {e}")
+            return None
+
+    def delete(self, path: str) -> bool:
+        """Delete content from remote storage.
+
+        Args:
+            path: Storage path
+
+        Returns:
+            True if deleted, False otherwise
+        """
+        try:
+            if not self.exists(path):
+                logger.warning(f"File not found for deletion: {path}")
+                return False
+
+            self.fs_instance.delete(path)
+            logger.info(f"Successfully deleted file at {path}")
+            return True
+
+        except Exception as e:
+            logger.error(f"Failed to delete file at {path}: {e}")
+            return False
+
+    def exists(self, path: str) -> bool:
+        """Check if path exists in storage.
+
+        Args:
+            path: Storage path
+
+        Returns:
+            True if exists, False otherwise
+        """
+        try:
+            return self.fs_instance.exists(path)
+        except Exception as e:
+            logger.error(f"Failed to check existence of {path}: {e}")
+            return False
+
+    def list_files(self, prefix: str) -> list[str]:
+        """List files with given prefix.
+
+        Args:
+            prefix: Path prefix
+
+        Returns:
+            List of matching paths
+        """
+        try:
+            # List all files in the directory
+            files = self.fs_instance.listdir(prefix)
+            return [str(Path(prefix) / f) for f in files if not f.startswith(".")]
+
+        except Exception as e:
+            logger.error(f"Failed to list files with prefix {prefix}: {e}")
+            return []
+
+    def get_text_content(self, path: str) -> str | None:
+        """Get text content from storage.
+
+        Args:
+            path: Storage path
+
+        Returns:
+            Text content or None if not found
+        """
+        content = self.download(path)
+        if content:
+            try:
+                return content.decode("utf-8")
+            except UnicodeDecodeError:
+                logger.error(f"Failed to decode text content from {path}")
+        return None
+
+    def save_text_content(self, path: str, text: str) -> bool:
+        """Save text content to storage.
+
+        Args:
+            path: Storage path
+            text: Text content
+
+        Returns:
+            True if successful
+        """
+        return self.upload(path, text.encode("utf-8"))
+
+    def upload_reference_data(
+        self,
+        project_id: UUID,
+        filename: str,
+        content: bytes,
+        metadata: dict[str, Any] | None = None,
+    ) -> str:
+        """Upload reference data for a Look-Up project.
+
+        Args:
+            project_id: Project UUID
+            filename: Original filename
+            content: File content
+            metadata: Optional metadata
+
+        Returns:
+            Storage path of uploaded file
+        """
+        # Generate storage path
+        storage_path = self._get_file_path(project_id, filename)
+
+        # Upload file
+        if self.upload(storage_path, content):
+            # Store metadata if provided
+            if metadata:
+                meta_path = f"{storage_path}.meta.json"
+                import json
+
+                meta_content = json.dumps(metadata, indent=2)
+                self.save_text_content(meta_path, meta_content)
+
+            return storage_path
+        else:
+            raise Exception(f"Failed to upload reference data to {storage_path}")
+
+    def get_reference_data(self, project_id: UUID, filename: str) -> str | None:
+        """Get reference data text content.
+
+        Args:
+            project_id: Project UUID
+            filename: File name
+
+        Returns:
+            Text content or None
+        """
+        storage_path = self._get_file_path(project_id, filename)
+        return self.get_text_content(storage_path)
+
+    def list_project_files(self, project_id: UUID) -> list[str]:
+        """List all files for a project.
+
+        Args:
+            project_id: Project UUID
+
+        Returns:
+            List of file paths
+        """
+        project_path = self._get_project_path(project_id)
+        return self.list_files(project_path)
+
+    def delete_project_data(self, project_id: UUID) -> bool:
+        """Delete all data for a project.
+
+        Args:
+            project_id: Project UUID
+
+        Returns:
+            True if successful
+        """
+        try:
+            project_path = self._get_project_path(project_id)
+            files = self.list_project_files(project_id)
+
+            # Delete all files
+            for file_path in files:
+                self.delete(file_path)
+
+            # Delete directory
+            if self.exists(project_path):
+                self.fs_instance.rmdir(project_path)
+
+            logger.info(f"Deleted all data for project {project_id}")
+            return True
+
+        except Exception as e:
+            logger.error(f"Failed to delete project data: {e}")
+            return False
diff --git a/backend/lookup/integrations/unstract_llm_client.py b/backend/lookup/integrations/unstract_llm_client.py
new file mode 100644
index 0000000000..48baf8484b
--- /dev/null
+++ b/backend/lookup/integrations/unstract_llm_client.py
@@ -0,0 +1,113 @@
+"""Unstract LLM Client for Look-Up enrichment.
+
+This module provides integration with Unstract's LLM abstraction
+using the SDK's LLM class for generating enrichment data.
+"""
+
+import json
+import logging
+from typing import Any, Protocol
+
+from adapter_processor_v2.models import AdapterInstance
+
+from unstract.sdk1.llm import LLM
+
+logger = logging.getLogger(__name__)
+
+
+class LLMClient(Protocol):
+    """Protocol for LLM client abstraction."""
+
+    def generate(self, prompt: str, config: dict[str, Any]) -> str:
+        """Generate LLM response for the prompt."""
+        ...
+
+
+class UnstractLLMClient(LLMClient):
+    """LLM client implementation using Unstract's SDK LLM class.
+
+    This client uses the actual LLM adapters configured in the platform
+    to generate enrichment data for Look-Ups.
+    """
+
+    def __init__(self, adapter_instance: AdapterInstance):
+        """Initialize the LLM client with an adapter instance.
+
+        Args:
+            adapter_instance: The AdapterInstance model object containing
+                             the LLM configuration
+        """
+        self.adapter_instance = adapter_instance
+        self.adapter_id = adapter_instance.adapter_id
+        self.adapter_metadata = adapter_instance.metadata  # Decrypted metadata
+
+    def generate(self, prompt: str, config: dict[str, Any], timeout: int = 30) -> str:
+        """Generate LLM response for Look-Up enrichment.
+
+        Args:
+            prompt: The prompt text with resolved variables and reference data
+            config: Additional LLM configuration (temperature, etc.)
+            timeout: Request timeout in seconds
+
+        Returns:
+            JSON-formatted string with enrichment data
+
+        Raises:
+            RuntimeError: If LLM call fails
+        """
+        try:
+            # Create LLM instance using SDK
+            llm = LLM(adapter_id=self.adapter_id, adapter_metadata=self.adapter_metadata)
+
+            # Call the LLM
+            logger.debug(f"Calling LLM with prompt length: {len(prompt)}")
+            response = llm.complete(prompt)
+
+            # Extract the response text
+            response_text = response["response"].text
+
+            logger.debug(f"LLM response: {response_text[:500]}...")
+
+            # Validate it's valid JSON
+            try:
+                json.loads(response_text)
+                return response_text
+            except json.JSONDecodeError:
+                # Try to extract JSON from response
+                return self._extract_json(response_text)
+
+        except Exception as e:
+            logger.error(f"LLM generation failed: {e}")
+            raise RuntimeError(f"LLM generation failed: {str(e)}")
+
+    def _extract_json(self, response: str) -> str:
+        """Extract JSON from LLM response if wrapped in text.
+
+        Args:
+            response: Raw LLM response
+
+        Returns:
+            Extracted JSON string
+        """
+        # Look for JSON object pattern (handles nested objects)
+        # Try to find content between first { and last }
+        start_idx = response.find("{")
+        end_idx = response.rfind("}")
+
+        if start_idx != -1 and end_idx != -1 and end_idx > start_idx:
+            potential_json = response[start_idx : end_idx + 1]
+            try:
+                json.loads(potential_json)
+                return potential_json
+            except json.JSONDecodeError:
+                pass
+
+        # If no valid JSON found, create a basic response
+        logger.warning(f"Could not extract JSON from response: {response[:200]}")
+        return json.dumps(
+            {
+                "raw_response": response[:500],
+                "confidence": 0.3,
+                "warning": "Could not extract structured data from LLM response",
+            }
+        )
diff --git a/backend/lookup/migrations/0001_initial.py b/backend/lookup/migrations/0001_initial.py
new file mode 100644
index 0000000000..da583747de
--- /dev/null
+++ b/backend/lookup/migrations/0001_initial.py
@@ -0,0 +1,886 @@
+# Generated by Django - Squashed migration for lookup app
+
+import uuid
+
+import django.db.models.deletion
+from django.conf import settings
+from django.db import migrations, models
+
+
+class Migration(migrations.Migration):
+    """Squashed initial migration for the lookup app.
+
+    This migration creates all lookup-related models:
+    - LookupProject: Main project configuration
+    - LookupPromptTemplate: Prompt templates with variable detection
+    - LookupDataSource: Reference data file management with versioning
+    - LookupProfileManager: Adapter profiles for indexing/querying
+    - LookupIndexManager: Index tracking for vector DB
+    - PromptStudioLookupLink: Links between PS projects and Lookups
+    - LookupExecutionAudit: Execution history and metrics
+    """
+
+    initial = True
+
+    dependencies = [
+        migrations.swappable_dependency(settings.AUTH_USER_MODEL),
+        ("account_v2", "0001_initial"),
+        ("adapter_processor_v2", "0001_initial"),
+    ]
+
+    operations = [
+        # 1. Create LookupProject model
+        migrations.CreateModel(
+            name="LookupProject",
+            fields=[
+                (
+                    "created_at",
+                    models.DateTimeField(
+                        auto_now_add=True,
+                        db_comment="Timestamp when the record was created",
+                    ),
+                ),
+                (
+                    "modified_at",
+                    models.DateTimeField(
+                        auto_now=True,
+                        db_comment="Timestamp when the record was last modified",
+                    ),
+                ),
+                (
+                    "id",
+                    models.UUIDField(
+                        default=uuid.uuid4,
+                        editable=False,
+                        primary_key=True,
+                        serialize=False,
+                    ),
+                ),
+                (
+                    "name",
+                    models.CharField(
+                        help_text="Name of the Look-Up project", max_length=255
+                    ),
+                ),
+                (
+                    "description",
+                    models.TextField(
+                        blank=True,
+                        help_text="Description of the Look-Up project's purpose",
+                        null=True,
+                    ),
+                ),
+                (
+                    "lookup_type",
+                    models.CharField(
+                        choices=[("static_data", "Static Data")],
+                        default="static_data",
+                        help_text="Type of Look-Up (only static_data for POC)",
+                        max_length=50,
+                    ),
+                ),
+                (
+                    "reference_data_type",
+                    models.CharField(
+                        choices=[
+                            ("vendor_catalog", "Vendor Catalog"),
+                            ("product_catalog", "Product Catalog"),
+                            ("customer_database", "Customer Database"),
+                            ("pricing_data", "Pricing Data"),
+                            ("compliance_rules", "Compliance Rules"),
+                            ("custom", "Custom"),
+                        ],
+                        help_text="Category of reference data being stored",
+                        max_length=50,
+                    ),
+                ),
+                (
+                    "is_active",
+                    models.BooleanField(
+                        default=True, help_text="Whether this project is active"
+                    ),
+                ),
+                (
+                    "metadata",
+                    models.JSONField(
+                        blank=True,
+                        default=dict,
+                        help_text="Additional metadata for the project",
+                    ),
+                ),
+                (
+                    "llm_provider",
+                    models.CharField(
+                        blank=True,
+                        choices=[
+                            ("openai", "OpenAI"),
+                            ("anthropic", "Anthropic"),
+                            ("azure", "Azure OpenAI"),
+                            ("custom", "Custom Provider"),
+                        ],
+                        help_text="LLM provider to use for matching",
+                        max_length=50,
+                        null=True,
+                    ),
+                ),
+                (
+                    "llm_model",
+                    models.CharField(
+                        blank=True,
+                        help_text="Specific model name (e.g., gpt-4-turbo, claude-3-opus)",
+                        max_length=100,
+                        null=True,
+                    ),
+                ),
+                (
+                    "llm_config",
+                    models.JSONField(
+                        blank=True,
+                        default=dict,
+                        help_text="Additional LLM configuration (temperature, max_tokens, etc.)",
+                    ),
+                ),
+                (
+                    "created_by",
+                    models.ForeignKey(
+                        help_text="User who created this project",
+                        on_delete=django.db.models.deletion.RESTRICT,
+                        related_name="created_lookup_projects",
+                        to=settings.AUTH_USER_MODEL,
+                    ),
+                ),
+                (
+                    "organization",
+                    models.ForeignKey(
+                        on_delete=django.db.models.deletion.CASCADE,
+                        related_name="lookup_projects",
+                        to="account_v2.organization",
+                    ),
+                ),
+            ],
+            options={
+                "verbose_name": "Look-Up Project",
+                "verbose_name_plural": "Look-Up Projects",
+                "db_table": "lookup_projects",
+                "ordering": ["-created_at"],
+            },
+        ),
+        migrations.AddIndex(
+            model_name="lookupproject",
+            index=models.Index(fields=["organization"], name="lookup_proj_organiz_idx"),
+        ),
+        migrations.AddIndex(
+            model_name="lookupproject",
+            index=models.Index(fields=["created_by"], name="lookup_proj_created_idx"),
+        ),
+        migrations.AddIndex(
+            model_name="lookupproject",
+            index=models.Index(fields=["modified_at"], name="lookup_proj_modifie_idx"),
+        ),
+        # 2. Create LookupPromptTemplate model
+        migrations.CreateModel(
+            name="LookupPromptTemplate",
+            fields=[
+                (
+                    "created_at",
+                    models.DateTimeField(
+                        auto_now_add=True,
+                        db_comment="Timestamp when the record was created",
+                    ),
+                ),
+                (
+                    "modified_at",
+                    models.DateTimeField(
+                        auto_now=True,
+                        db_comment="Timestamp when the record was last modified",
+                    ),
+                ),
+                (
+                    "id",
+                    models.UUIDField(
+                        default=uuid.uuid4,
+                        editable=False,
+                        primary_key=True,
+                        serialize=False,
+                    ),
+                ),
+                (
+                    "name",
+                    models.CharField(
+                        help_text="Template name for identification", max_length=255
+                    ),
+                ),
+                (
+                    "template_text",
+                    models.TextField(help_text="Template with {{variable}} placeholders"),
+                ),
+                (
+                    "llm_config",
+                    models.JSONField(
+                        blank=True,
+                        default=dict,
+                        help_text="LLM configuration including adapter_id",
+                    ),
+                ),
+                (
+                    "is_active",
+                    models.BooleanField(
+                        default=True, help_text="Whether this template is active"
+                    ),
+                ),
+                (
+                    "variable_mappings",
+                    models.JSONField(
+                        blank=True,
+                        default=dict,
+                        help_text="Optional documentation of variable mappings",
+                    ),
+                ),
+                (
+                    "created_by",
+                    models.ForeignKey(
+                        help_text="User who created this template",
+                        on_delete=django.db.models.deletion.RESTRICT,
+                        related_name="created_lookup_templates",
+                        to=settings.AUTH_USER_MODEL,
+                    ),
+                ),
+                (
+                    "project",
+                    models.OneToOneField(
+                        help_text="Parent Look-Up project",
+                        on_delete=django.db.models.deletion.CASCADE,
+                        related_name="prompt_template_link",
+                        to="lookup.lookupproject",
+                    ),
+                ),
+            ],
+            options={
+                "verbose_name": "Look-Up Prompt Template",
+                "verbose_name_plural": "Look-Up Prompt Templates",
+                "db_table": "lookup_prompt_templates",
+                "ordering": ["-modified_at"],
+            },
+        ),
+        # 3. Add template FK to LookupProject (after template is created)
+        migrations.AddField(
+            model_name="lookupproject",
+            name="template",
+            field=models.ForeignKey(
+                blank=True,
+                help_text="Prompt template for this project",
+                null=True,
+                on_delete=django.db.models.deletion.SET_NULL,
+                related_name="projects",
+                to="lookup.lookupprompttemplate",
+            ),
+        ),
+        # 4. Create LookupDataSource model
+        migrations.CreateModel(
+            name="LookupDataSource",
+            fields=[
+                (
+                    "created_at",
+                    models.DateTimeField(
+                        auto_now_add=True,
+                        db_comment="Timestamp when the record was created",
+                    ),
+                ),
+                (
+                    "modified_at",
+                    models.DateTimeField(
+                        auto_now=True,
+                        db_comment="Timestamp when the record was last modified",
+                    ),
+                ),
+                (
+                    "id",
+                    models.UUIDField(
+                        default=uuid.uuid4,
+                        editable=False,
+                        primary_key=True,
+                        serialize=False,
+                    ),
+                ),
+                (
+                    "file_name",
+                    models.CharField(help_text="Original filename", max_length=255),
+                ),
+                ("file_path", models.TextField(help_text="Path in object storage")),
+                ("file_size", models.BigIntegerField(help_text="File size in bytes")),
+                (
+                    "file_type",
+                    models.CharField(
+                        choices=[
+                            ("pdf", "PDF"),
+                            ("xlsx", "Excel"),
+                            ("csv", "CSV"),
+                            ("docx", "Word"),
+                            ("txt", "Text"),
+                            ("json", "JSON"),
+                        ],
+                        help_text="Type of file",
+                        max_length=50,
+                    ),
+                ),
+                (
+                    "extracted_content_path",
+                    models.TextField(
+                        blank=True,
+                        help_text="Path to extracted text in object storage",
+                        null=True,
+                    ),
+                ),
+                (
+                    "extraction_status",
+                    models.CharField(
+                        choices=[
+                            ("pending", "Pending"),
+                            ("processing", "Processing"),
+                            ("completed", "Completed"),
+                            ("failed", "Failed"),
+                        ],
+                        default="pending",
+                        help_text="Status of text extraction",
+                        max_length=20,
+                    ),
+                ),
+                (
+                    "extraction_error",
+                    models.TextField(
+                        blank=True,
+                        help_text="Error details if extraction failed",
+                        null=True,
+                    ),
+                ),
+                (
+                    "version_number",
+                    models.IntegerField(
+                        default=1,
+                        help_text="Version number of this data source (auto-incremented)",
+                    ),
+                ),
+                (
+                    "is_latest",
+                    models.BooleanField(
+                        default=True, help_text="Whether this is the latest version"
+                    ),
+                ),
+                (
+                    "project",
+                    models.ForeignKey(
+                        help_text="Parent Look-Up project",
+                        on_delete=django.db.models.deletion.CASCADE,
+                        related_name="data_sources",
+                        to="lookup.lookupproject",
+                    ),
+                ),
+                (
+                    "uploaded_by",
+                    models.ForeignKey(
+                        help_text="User who uploaded this file",
+                        on_delete=django.db.models.deletion.RESTRICT,
+                        related_name="uploaded_lookup_data",
+                        to=settings.AUTH_USER_MODEL,
+                    ),
+                ),
+            ],
+            options={
+                "verbose_name": "Look-Up Data Source",
+                "verbose_name_plural": "Look-Up Data Sources",
+                "db_table": "lookup_data_sources",
+                "ordering": ["-version_number"],
+                "unique_together": {("project", "version_number")},
+            },
+        ),
+        migrations.AddIndex(
+            model_name="lookupdatasource",
+            index=models.Index(fields=["project"], name="lookup_data_project_idx"),
+        ),
+        migrations.AddIndex(
+            model_name="lookupdatasource",
+            index=models.Index(
+                fields=["project", "is_latest"], name="lookup_data_proj_latest_idx"
+            ),
+        ),
+        migrations.AddIndex(
+            model_name="lookupdatasource",
+            index=models.Index(fields=["created_at"], name="lookup_data_created_idx"),
+        ),
+        migrations.AddIndex(
+            model_name="lookupdatasource",
+            index=models.Index(
+                fields=["extraction_status"], name="lookup_data_extract_idx"
+            ),
+        ),
+        # 5. Create LookupProfileManager model
+        migrations.CreateModel(
+            name="LookupProfileManager",
+            fields=[
+                (
+                    "created_at",
+                    models.DateTimeField(
+                        auto_now_add=True,
+                        db_comment="Timestamp when the record was created",
+                    ),
+                ),
+                (
+                    "modified_at",
+                    models.DateTimeField(
+                        auto_now=True,
+                        db_comment="Timestamp when the record was last modified",
+                    ),
+                ),
+                (
+                    "profile_id",
+                    models.UUIDField(
+                        default=uuid.uuid4,
+                        editable=False,
+                        primary_key=True,
+                        serialize=False,
+                    ),
+                ),
+                ("profile_name", models.TextField(db_comment="Name of the profile")),
+                (
+                    "chunk_size",
+                    models.IntegerField(
+                        db_comment="Size of text chunks for indexing", default=1000
+                    ),
+                ),
+                (
+                    "chunk_overlap",
+                    models.IntegerField(
+                        db_comment="Overlap between consecutive chunks", default=200
+                    ),
+                ),
+                (
+                    "similarity_top_k",
+                    models.IntegerField(
+                        db_comment="Number of top similar chunks to retrieve", default=5
+                    ),
+                ),
+                (
+                    "is_default",
+                    models.BooleanField(
+                        db_comment="Whether this is the default profile for the project",
+                        default=False,
+                    ),
+                ),
+                (
+                    "reindex",
+                    models.BooleanField(
+                        db_comment="Flag to trigger re-indexing of reference data",
+                        default=False,
+                    ),
+                ),
+                (
+                    "lookup_project",
+                    models.ForeignKey(
+                        db_comment="Look-Up project this profile belongs to",
+                        on_delete=django.db.models.deletion.CASCADE,
+                        related_name="profiles",
+                        to="lookup.lookupproject",
+                    ),
+                ),
+                (
+                    "vector_store",
+                    models.ForeignKey(
+                        db_comment="Vector database adapter for storing embeddings",
+                        on_delete=django.db.models.deletion.PROTECT,
+                        related_name="lookup_profiles_vector_store",
+                        to="adapter_processor_v2.adapterinstance",
+                    ),
+                ),
+                (
+                    "embedding_model",
+                    models.ForeignKey(
+                        db_comment="Embedding model adapter for generating vectors",
+                        on_delete=django.db.models.deletion.PROTECT,
+                        related_name="lookup_profiles_embedding_model",
+                        to="adapter_processor_v2.adapterinstance",
+                    ),
+                ),
+                (
+                    "llm",
+                    models.ForeignKey(
+                        db_comment="LLM adapter for query processing and response generation",
+                        on_delete=django.db.models.deletion.PROTECT,
+                        related_name="lookup_profiles_llm",
+                        to="adapter_processor_v2.adapterinstance",
+                    ),
+                ),
+                (
+                    "x2text",
+                    models.ForeignKey(
+                        db_comment="X2Text adapter for extracting text from various file formats",
+                        on_delete=django.db.models.deletion.PROTECT,
+                        related_name="lookup_profiles_x2text",
+                        to="adapter_processor_v2.adapterinstance",
+                    ),
+                ),
+                (
+                    "created_by",
+                    models.ForeignKey(
+                        blank=True,
+                        editable=False,
+                        null=True,
+                        on_delete=django.db.models.deletion.SET_NULL,
+                        related_name="lookup_profile_managers_created",
+                        to=settings.AUTH_USER_MODEL,
+                    ),
+                ),
+                (
+                    "modified_by",
+                    models.ForeignKey(
+                        blank=True,
+                        editable=False,
+                        null=True,
+                        on_delete=django.db.models.deletion.SET_NULL,
+                        related_name="lookup_profile_managers_modified",
+                        to=settings.AUTH_USER_MODEL,
+                    ),
+                ),
+            ],
+            options={
+                "verbose_name": "Lookup Profile Manager",
+                "verbose_name_plural": "Lookup Profile Managers",
+                "db_table": "lookup_profile_manager",
+            },
+        ),
+        migrations.AddConstraint(
+            model_name="lookupprofilemanager",
+            constraint=models.UniqueConstraint(
+                fields=("lookup_project", "profile_name"),
+                name="unique_lookup_project_profile_name_index",
+            ),
+        ),
+        # 6. Create LookupIndexManager model
+        migrations.CreateModel(
+            name="LookupIndexManager",
+            fields=[
+                (
+                    "created_at",
+                    models.DateTimeField(
+                        auto_now_add=True,
+                        db_comment="Timestamp when the record was created",
+                    ),
+                ),
+                (
+                    "modified_at",
+                    models.DateTimeField(
+                        auto_now=True,
+                        db_comment="Timestamp when the record was last modified",
+                    ),
+                ),
+                (
+                    "index_manager_id",
+                    models.UUIDField(
+                        default=uuid.uuid4,
+                        editable=False,
+                        primary_key=True,
+                        serialize=False,
+                    ),
+                ),
+                (
+                    "raw_index_id",
+                    models.CharField(
+                        blank=True,
+                        db_comment="Raw index ID for vector DB",
+                        editable=False,
+                        max_length=255,
+                        null=True,
+                    ),
+                ),
+                (
+                    "index_ids_history",
+                    models.JSONField(
+                        blank=False,
+                        db_comment="List of all index IDs created for this data source",
+                        default=list,
+                        null=False,
+                    ),
+                ),
+                (
+                    "extraction_status",
+                    models.JSONField(
+                        blank=False,
+                        db_comment='Extraction status per X2Text config: {x2text_config_hash: {"extracted": bool, "enable_highlight": bool, "error": str}}',
+                        default=dict,
+                        null=False,
+                    ),
+                ),
+                (
+                    "status",
+                    models.JSONField(
+                        blank=False,
+                        db_comment="Extraction and indexing status",
+                        default=dict,
+                        null=False,
+                    ),
+                ),
+                (
+                    "data_source",
+                    models.ForeignKey(
+                        db_comment="Reference data source being indexed",
+                        editable=False,
+                        on_delete=django.db.models.deletion.CASCADE,
+                        related_name="index_managers",
+                        to="lookup.lookupdatasource",
+                    ),
+                ),
+                (
+                    "profile_manager",
+                    models.ForeignKey(
+                        blank=True,
+                        db_comment="Profile used for indexing this data source",
+                        editable=False,
+                        null=True,
+                        on_delete=django.db.models.deletion.SET_NULL,
+                        related_name="index_managers",
+                        to="lookup.lookupprofilemanager",
+                    ),
+                ),
+                (
+                    "created_by",
+                    models.ForeignKey(
+                        blank=True,
+                        editable=False,
+                        null=True,
+                        on_delete=django.db.models.deletion.SET_NULL,
+                        related_name="lookup_index_managers_created",
+                        to=settings.AUTH_USER_MODEL,
+                    ),
+                ),
+                (
+                    "modified_by",
+                    models.ForeignKey(
+                        blank=True,
+                        editable=False,
+                        null=True,
+                        on_delete=django.db.models.deletion.SET_NULL,
+                        related_name="lookup_index_managers_modified",
+                        to=settings.AUTH_USER_MODEL,
+                    ),
+                ),
+            ],
+            options={
+                "verbose_name": "Lookup Index Manager",
+                "verbose_name_plural": "Lookup Index Managers",
+                "db_table": "lookup_index_manager",
+            },
+        ),
+        migrations.AddConstraint(
+            model_name="lookupindexmanager",
+            constraint=models.UniqueConstraint(
+                fields=("data_source", "profile_manager"),
+                name="unique_data_source_profile_manager_index",
+            ),
+        ),
+        # 7. Create PromptStudioLookupLink model
+        migrations.CreateModel(
+            name="PromptStudioLookupLink",
+            fields=[
+                (
+                    "id",
+                    models.UUIDField(
+                        default=uuid.uuid4,
+                        editable=False,
+                        primary_key=True,
+                        serialize=False,
+                    ),
+                ),
+                (
+                    "prompt_studio_project_id",
+                    models.UUIDField(help_text="UUID of the Prompt Studio project"),
+                ),
+                (
+                    "execution_order",
+                    models.PositiveIntegerField(
+                        default=0,
+                        help_text="Order in which this Look-Up executes (lower numbers first)",
+                    ),
+                ),
+                ("created_at", models.DateTimeField(auto_now_add=True)),
+                (
+                    "lookup_project",
+                    models.ForeignKey(
+                        help_text="Linked Look-Up project",
+                        on_delete=django.db.models.deletion.CASCADE,
+                        related_name="ps_links",
+                        to="lookup.lookupproject",
+                    ),
+                ),
+            ],
+            options={
+                "verbose_name": "Prompt Studio Look-Up Link",
+                "verbose_name_plural": "Prompt Studio Look-Up Links",
+                "db_table": "prompt_studio_lookup_links",
+                "ordering": ["execution_order", "created_at"],
+                "unique_together": {("prompt_studio_project_id", "lookup_project")},
+            },
+        ),
+        migrations.AddIndex(
+            model_name="promptstudiolookuplink",
+            index=models.Index(
+                fields=["prompt_studio_project_id"], name="ps_lookup_link_ps_proj_idx"
+            ),
+        ),
+        migrations.AddIndex(
+            model_name="promptstudiolookuplink",
+            index=models.Index(
+                fields=["lookup_project"], name="ps_lookup_link_lookup_idx"
+            ),
+        ),
+        migrations.AddIndex(
+            model_name="promptstudiolookuplink",
+            index=models.Index(
+                fields=["prompt_studio_project_id", "execution_order"],
+                name="ps_lookup_link_order_idx",
+            ),
+        ),
+        # 8. Create LookupExecutionAudit model
+        migrations.CreateModel(
+            name="LookupExecutionAudit",
+            fields=[
+                (
+                    "id",
+                    models.UUIDField(
+                        default=uuid.uuid4,
+                        editable=False,
+                        primary_key=True,
+                        serialize=False,
+                    ),
+                ),
+                (
+                    "prompt_studio_project_id",
+                    models.UUIDField(
+                        blank=True,
+                        help_text="Associated Prompt Studio project if applicable",
+                        null=True,
+                    ),
+                ),
+                (
+                    "execution_id",
+                    models.UUIDField(
+                        help_text="Groups all Look-Ups in a single execution batch"
+                    ),
+                ),
+                (
+                    "input_data",
+                    models.JSONField(
+                        help_text="Input data from Prompt Studio extraction"
+                    ),
+                ),
+                (
+                    "reference_data_version",
+                    models.IntegerField(help_text="Version of reference data used"),
+                ),
+                (
+                    "enriched_output",
+                    models.JSONField(
+                        blank=True, help_text="Enrichment data produced", null=True
+                    ),
+                ),
+                (
+                    "llm_provider",
+                    models.CharField(help_text="LLM provider used", max_length=50),
+                ),
+                (
+                    "llm_model",
+                    models.CharField(help_text="LLM model used", max_length=100),
+                ),
+                ("llm_prompt", models.TextField(help_text="Full prompt sent to LLM")),
+                (
+                    "llm_response",
+                    models.TextField(blank=True, help_text="Raw LLM response", null=True),
+                ),
+                (
+                    "llm_response_cached",
+                    models.BooleanField(
+                        default=False, help_text="Whether response was from cache"
+                    ),
+                ),
+                (
+                    "execution_time_ms",
+                    models.IntegerField(
+                        blank=True,
+                        help_text="Total execution time in milliseconds",
+                        null=True,
+                    ),
+                ),
+                (
+                    "llm_call_time_ms",
+                    models.IntegerField(
+                        blank=True,
+                        help_text="LLM API call time in milliseconds",
+                        null=True,
+                    ),
+                ),
+                (
+                    "status",
+                    models.CharField(
+                        choices=[
+                            ("success", "Success"),
+                            ("partial", "Partial Success"),
+                            ("failed", "Failed"),
+                        ],
+                        help_text="Execution status",
+                        max_length=20,
+                    ),
+                ),
+                (
+                    "error_message",
+                    models.TextField(
+                        blank=True, help_text="Error details if failed", null=True
+                    ),
+                ),
+                (
+                    "confidence_score",
+                    models.DecimalField(
+                        blank=True,
+                        decimal_places=2,
+                        help_text="Confidence score from LLM (0.00 to 1.00)",
+                        max_digits=3,
+                        null=True,
+                    ),
+                ),
+                (
+                    "executed_at",
+                    models.DateTimeField(
+                        auto_now_add=True, help_text="When the execution occurred"
+                    ),
+                ),
+                (
+                    "lookup_project",
+                    models.ForeignKey(
+                        help_text="Look-Up project that was executed",
+                        on_delete=django.db.models.deletion.CASCADE,
+                        related_name="execution_audits",
+                        to="lookup.lookupproject",
+                    ),
+                ),
+            ],
+            options={
+                "verbose_name": "Look-Up Execution Audit",
+                "verbose_name_plural": "Look-Up Execution Audits",
+                "db_table": "lookup_execution_audit",
+                "ordering": ["-executed_at"],
+            },
+        ),
+        migrations.AddIndex(
+            model_name="lookupexecutionaudit",
+            index=models.Index(fields=["lookup_project"], name="lookup_audit_proj_idx"),
+        ),
+        migrations.AddIndex(
+            model_name="lookupexecutionaudit",
+            index=models.Index(fields=["execution_id"], name="lookup_audit_exec_idx"),
+        ),
+        migrations.AddIndex(
+            model_name="lookupexecutionaudit",
+            index=models.Index(fields=["executed_at"], name="lookup_audit_time_idx"),
+        ),
+        migrations.AddIndex(
+            model_name="lookupexecutionaudit",
+            index=models.Index(fields=["status"], name="lookup_audit_status_idx"),
+        ),
+    ]
diff --git a/backend/lookup/migrations/__init__.py b/backend/lookup/migrations/__init__.py
new file mode 100644
index 0000000000..b98f22cc20
--- /dev/null
+++ b/backend/lookup/migrations/__init__.py
@@ -0,0 +1 @@
+# Lookup migrations package
diff --git a/backend/lookup/models/__init__.py b/backend/lookup/models/__init__.py
new file mode 100644
index 0000000000..4c196dc030
--- /dev/null
+++ b/backend/lookup/models/__init__.py
@@ -0,0 +1,24 @@
+"""Look-Up system models."""
+
+from .lookup_data_source import LookupDataSource, LookupDataSourceManager
+from .lookup_execution_audit import LookupExecutionAudit
+from .lookup_index_manager import LookupIndexManager
+from .lookup_profile_manager import LookupProfileManager
+from .lookup_project import LookupProject
+from .lookup_prompt_template import LookupPromptTemplate
+from .prompt_studio_lookup_link import (
+    PromptStudioLookupLink,
+    PromptStudioLookupLinkManager,
+)
+
+__all__ = [
+    "LookupProject",
+    "LookupDataSource",
+    "LookupDataSourceManager",
+    "LookupPromptTemplate",
+    "LookupProfileManager",
+    "LookupIndexManager",
+    "PromptStudioLookupLink",
+    "PromptStudioLookupLinkManager",
+    "LookupExecutionAudit",
+]
diff --git a/backend/lookup/models/lookup_data_source.py b/backend/lookup/models/lookup_data_source.py
new file mode 100644
index 0000000000..49c1ea0011
--- /dev/null
+++ b/backend/lookup/models/lookup_data_source.py
@@ -0,0 +1,192 @@
+"""LookupDataSource model for managing reference data versions."""
+
+import uuid
+
+from django.contrib.auth import get_user_model
+from django.db import models
+from django.db.models.signals import pre_save
+from django.dispatch import receiver
+from utils.models.base_model import BaseModel
+
+User = get_user_model()
+
+
+class LookupDataSourceManager(models.Manager):
+    """Custom manager for LookupDataSource."""
+
+    def get_latest_for_project(self, project_id: uuid.UUID):
+        """Get the latest data sources for a project.
+
+        Args:
+            project_id: UUID of the lookup project
+
+        Returns:
+            QuerySet of latest data sources
+        """
+        return self.filter(project_id=project_id, is_latest=True)
+
+    def get_ready_for_project(self, project_id: uuid.UUID):
+        """Get all completed latest data sources for a project.
+
+        Args:
+            project_id: UUID of the lookup project
+
+        Returns:
+            QuerySet of completed latest data sources
+        """
+        return self.get_latest_for_project(project_id).filter(
+            extraction_status="completed"
+        )
+
+
+class LookupDataSource(BaseModel):
+    """Represents a reference data source with version management.
+
+    Each upload creates a new version, with automatic version numbering
+    and latest flag management.
+    """
+
+    EXTRACTION_STATUS_CHOICES = [
+        ("pending", "Pending"),
+        ("processing", "Processing"),
+        ("completed", "Completed"),
+        ("failed", "Failed"),
+    ]
+
+    FILE_TYPE_CHOICES = [
+        ("pdf", "PDF"),
+        ("xlsx", "Excel"),
+        ("csv", "CSV"),
+        ("docx", "Word"),
+        ("txt", "Text"),
+        ("json", "JSON"),
+    ]
+
+    id = models.UUIDField(primary_key=True, default=uuid.uuid4, editable=False)
+    project = models.ForeignKey(
+        "lookup.LookupProject",
+        on_delete=models.CASCADE,
+        related_name="data_sources",
+        help_text="Parent Look-Up project",
+    )
+
+    # File Information
+    file_name = models.CharField(max_length=255, help_text="Original filename")
+    file_path = models.TextField(help_text="Path in object storage")
+    file_size = models.BigIntegerField(help_text="File size in bytes")
+    file_type = models.CharField(
+        max_length=50, choices=FILE_TYPE_CHOICES, help_text="Type of file"
+    )
+
+    # Extracted Content
+    extracted_content_path = models.TextField(
+        blank=True, null=True, help_text="Path to extracted text in object storage"
+    )
+    extraction_status = models.CharField(
+        max_length=20,
+        choices=EXTRACTION_STATUS_CHOICES,
+        default="pending",
+        help_text="Status of text extraction",
+    )
+    extraction_error = models.TextField(
+        blank=True, null=True, help_text="Error details if extraction failed"
+    )
+
+    # Version Management
+    version_number = models.IntegerField(
+        default=1, help_text="Version number of this data source (auto-incremented)"
+    )
+    is_latest = models.BooleanField(
+        default=True, help_text="Whether this is the latest version"
+    )
+
+    # Upload Information
+    uploaded_by = models.ForeignKey(
+        User,
+        on_delete=models.RESTRICT,
+        related_name="uploaded_lookup_data",
+        help_text="User who uploaded this file",
+    )
+
+    objects = LookupDataSourceManager()
+
+    class Meta:
+        """Model metadata."""
+
+        db_table = "lookup_data_sources"
+        ordering = ["-version_number"]
+        unique_together = [["project", "version_number"]]
+        verbose_name = "Look-Up Data Source"
+        verbose_name_plural = "Look-Up Data Sources"
+        indexes = [
+            models.Index(fields=["project"]),
+            models.Index(fields=["project", "is_latest"]),
+            models.Index(fields=["created_at"]),
+            models.Index(fields=["extraction_status"]),
+        ]
+
+    def __str__(self) -> str:
+        """String representation."""
+        return f"{self.project.name} - v{self.version_number} - {self.file_name}"
+
+    def get_file_size_display(self) -> str:
+        """Get human-readable file size.
+
+        Returns:
+            Formatted file size string (e.g., "51.2 KB")
+        """
+        size = self.file_size
+        for unit in ["B", "KB", "MB", "GB"]:
+            if size < 1024.0:
+                return f"{size:.1f} {unit}"
+            size /= 1024.0
+        return f"{size:.1f} TB"
+
+    @property
+    def is_extraction_complete(self) -> bool:
+        """Check if extraction is successfully completed."""
+        return self.extraction_status == "completed"
+
+    def get_extracted_content(self) -> str | None:
+        """Load extracted content from object storage.
+
+        Returns:
+            Extracted text content or None if not available.
+
+        Note:
+            This is a placeholder - actual implementation will
+            load from object storage using extracted_content_path.
+        """
+        if not self.extracted_content_path or not self.is_extraction_complete:
+            return None
+
+        # TODO: Implement actual object storage retrieval
+        # For now, return a placeholder
+        return f"[Content from {self.extracted_content_path}]"
+
+
+@receiver(pre_save, sender=LookupDataSource)
+def auto_increment_version_and_update_latest(sender, instance, **kwargs):
+    """Signal to auto-increment version number and manage is_latest flag.
+
+    This signal:
+    1. Auto-increments version_number if not set
+    2. Marks all previous versions as not latest
+    """
+    # If this is a new instance (not updating existing)
+    if not instance.pk:
+        # Get the highest version number for this project
+        max_version = LookupDataSource.objects.filter(project=instance.project).aggregate(
+            max_version=models.Max("version_number")
+        )["max_version"]
+
+        # Always auto-increment version for new instances
+        instance.version_number = (max_version or 0) + 1
+
+        # Mark all previous versions as not latest
+        LookupDataSource.objects.filter(project=instance.project, is_latest=True).update(
+            is_latest=False
+        )
+
+        # Ensure new version is marked as latest
+        instance.is_latest = True
diff --git a/backend/lookup/models/lookup_execution_audit.py b/backend/lookup/models/lookup_execution_audit.py
new file mode 100644
index 0000000000..6bda095155
--- /dev/null
+++ b/backend/lookup/models/lookup_execution_audit.py
@@ -0,0 +1,134 @@
+"""LookupExecutionAudit model for tracking Look-Up execution history."""
+
+import uuid
+from decimal import Decimal
+
+from django.db import models
+
+
+class LookupExecutionAudit(models.Model):
+    """Audit log for Look-Up executions.
+
+    Tracks all execution attempts with detailed metadata for debugging
+    and performance monitoring.
+    """
+
+    STATUS_CHOICES = [
+        ("success", "Success"),
+        ("partial", "Partial Success"),
+        ("failed", "Failed"),
+    ]
+
+    id = models.UUIDField(primary_key=True, default=uuid.uuid4, editable=False)
+
+    # Execution Context
+    lookup_project = models.ForeignKey(
+        "lookup.LookupProject",
+        on_delete=models.CASCADE,
+        related_name="execution_audits",
+        help_text="Look-Up project that was executed",
+    )
+    prompt_studio_project_id = models.UUIDField(
+        null=True, blank=True, help_text="Associated Prompt Studio project if applicable"
+    )
+    execution_id = models.UUIDField(
+        help_text="Groups all Look-Ups in a single execution batch"
+    )
+
+    # Input/Output
+    input_data = models.JSONField(help_text="Input data from Prompt Studio extraction")
+    reference_data_version = models.IntegerField(
+        help_text="Version of reference data used"
+    )
+    enriched_output = models.JSONField(
+        null=True, blank=True, help_text="Enrichment data produced"
+    )
+
+    # LLM Details
+    llm_provider = models.CharField(max_length=50, help_text="LLM provider used")
+    llm_model = models.CharField(max_length=100, help_text="LLM model used")
+    llm_prompt = models.TextField(help_text="Full prompt sent to LLM")
+    llm_response = models.TextField(null=True, blank=True, help_text="Raw LLM response")
+    llm_response_cached = models.BooleanField(
+        default=False, help_text="Whether response was from cache"
+    )
+
+    # Performance Metrics
+    execution_time_ms = models.IntegerField(
+        null=True, blank=True, help_text="Total execution time in milliseconds"
+    )
+    llm_call_time_ms = models.IntegerField(
+        null=True, blank=True, help_text="LLM API call time in milliseconds"
+    )
+
+    # Status & Errors
+    status = models.CharField(
+        max_length=20, choices=STATUS_CHOICES, help_text="Execution status"
+    )
+    error_message = models.TextField(
+        null=True, blank=True, help_text="Error details if failed"
+    )
+    confidence_score = models.DecimalField(
+        max_digits=3,
+        decimal_places=2,
+        null=True,
+        blank=True,
+        validators=[],
+        help_text="Confidence score from LLM (0.00 to 1.00)",
+    )
+
+    # Timestamps
+    executed_at = models.DateTimeField(
+        auto_now_add=True, help_text="When the execution occurred"
+    )
+
+    class Meta:
+        """Model metadata."""
+
+        db_table = "lookup_execution_audit"
+        ordering = ["-executed_at"]
+        verbose_name = "Look-Up Execution Audit"
+        verbose_name_plural = "Look-Up Execution Audits"
+        indexes = [
+            models.Index(fields=["lookup_project"]),
+            models.Index(fields=["execution_id"]),
+            models.Index(fields=["executed_at"]),
+            models.Index(fields=["status"]),
+        ]
+
+    def __str__(self) -> str:
+        """String representation."""
+        return f"{self.lookup_project.name} - {self.status} - {self.executed_at}"
+
+    @property
+    def was_successful(self) -> bool:
+        """Check if execution was successful."""
+        return self.status in ["success", "partial"]
+
+    @property
+    def execution_duration_seconds(self) -> float:
+        """Get execution duration in seconds."""
+        if self.execution_time_ms:
+            return self.execution_time_ms / 1000.0
+        return 0.0
+
+    def clean(self):
+        """Validate the audit record."""
+        super().clean()
+        from django.core.exceptions import ValidationError
+
+        # Validate confidence score range
+        if self.confidence_score is not None:
+            if not (Decimal("0.00") <= self.confidence_score <= Decimal("1.00")):
+                raise ValidationError(
+                    f"Confidence score must be between 0.00 and 1.00, "
+                    f"got {self.confidence_score}"
+                )
+
+        # Ensure error_message is provided for failed status
+        if self.status == "failed" and not self.error_message:
+            raise ValidationError("Error message is required for failed executions")
+
+        # Ensure enriched_output is provided for success status
+        if self.status == "success" and not self.enriched_output:
+            raise ValidationError("Enriched output is required for successful executions")
diff --git a/backend/lookup/models/lookup_index_manager.py b/backend/lookup/models/lookup_index_manager.py
new file mode 100644
index 0000000000..3d483a7a3a
--- /dev/null
+++ b/backend/lookup/models/lookup_index_manager.py
@@ -0,0 +1,188 @@
+"""LookupIndexManager model for tracking indexed reference data."""
+
+import logging
+import uuid
+
+from account_v2.models import User
+from django.db import models
+from django.db.models.signals import pre_delete
+from django.dispatch import receiver
+from utils.models.base_model import BaseModel
+from utils.user_context import UserContext
+
+from unstract.sdk1.constants import LogLevel
+from unstract.sdk1.vector_db import VectorDB
+
+logger = logging.getLogger(__name__)
+
+
+class LookupIndexManager(BaseModel):
+    """Model to store indexing details for Look-Up reference data.
+
+    Tracks which data sources have been indexed with which profile,
+    stores vector DB index IDs, and manages extraction status.
+
+    Follows the same pattern as Prompt Studio's IndexManager.
+    """
+
+    index_manager_id = models.UUIDField(
+        primary_key=True, default=uuid.uuid4, editable=False
+    )
+
+    # Reference to the data source being indexed
+    data_source = models.ForeignKey(
+        "LookupDataSource",
+        on_delete=models.CASCADE,
+        related_name="index_managers",
+        editable=False,
+        null=False,
+        blank=False,
+        db_comment="Reference data source being indexed",
+    )
+
+    # Reference to the profile used for indexing
+    profile_manager = models.ForeignKey(
+        "LookupProfileManager",
+        on_delete=models.SET_NULL,
+        related_name="index_managers",
+        editable=False,
+        null=True,
+        blank=True,
+        db_comment="Profile used for indexing this data source",
+    )
+
+    # Vector DB index ID for this data source (raw index)
+    raw_index_id = models.CharField(
+        max_length=255,
+        db_comment="Raw index ID for vector DB",
+        editable=False,
+        null=True,
+        blank=True,
+    )
+
+    # History of all index IDs (for cleanup on deletion)
+    index_ids_history = models.JSONField(
+        db_comment="List of all index IDs created for this data source",
+        default=list,
+        null=False,
+        blank=False,
+    )
+
+    # Extraction status per X2Text configuration
+    # Format: {x2text_config_hash: {"extracted": bool, "enable_highlight": bool, "error": str|null}}
+    extraction_status = models.JSONField(
+        db_comment='Extraction status per X2Text config: {x2text_config_hash: {"extracted": bool, "enable_highlight": bool, "error": str}}',
+        default=dict,
+        null=False,
+        blank=False,
+    )
+
+    # Overall extraction and indexing status (legacy field, kept for compatibility)
+    # Format: {"extracted": bool, "indexed": bool, "error": str|null}
+    status = models.JSONField(
+        db_comment="Extraction and indexing status", null=False, blank=False, default=dict
+    )
+
+    # Audit fields
+    created_by = models.ForeignKey(
+        User,
+        on_delete=models.SET_NULL,
+        related_name="lookup_index_managers_created",
+        null=True,
+        blank=True,
+        editable=False,
+    )
+
+    modified_by = models.ForeignKey(
+        User,
+        on_delete=models.SET_NULL,
+        related_name="lookup_index_managers_modified",
+        null=True,
+        blank=True,
+        editable=False,
+    )
+
+    class Meta:
+        verbose_name = "Lookup Index Manager"
+        verbose_name_plural = "Lookup Index Managers"
+        db_table = "lookup_index_manager"
+        constraints = [
+            models.UniqueConstraint(
+                fields=["data_source", "profile_manager"],
+                name="unique_data_source_profile_manager_index",
+            ),
+        ]
+
+    def __str__(self):
+        return f"Index for {self.data_source.file_name} with {self.profile_manager.profile_name if self.profile_manager else 'No Profile'}"
+
+
+def delete_from_vector_db(index_ids_history, vector_db_instance_id):
+    """Delete index IDs from vector database.
+
+    Args:
+        index_ids_history: List of index IDs to delete
+        vector_db_instance_id: UUID of the vector DB adapter instance
+    """
+    try:
+        from prompt_studio.prompt_studio_core_v2.prompt_ide_base_tool import (
+            PromptIdeBaseTool,
+        )
+
+        organization_identifier = UserContext.get_organization_identifier()
+        util = PromptIdeBaseTool(log_level=LogLevel.INFO, org_id=organization_identifier)
+
+        vector_db = VectorDB(
+            tool=util,
+            adapter_instance_id=vector_db_instance_id,
+        )
+
+        for index_id in index_ids_history:
+            logger.debug(f"Deleting from VectorDB - index id: {index_id}")
+            try:
+                vector_db.delete(ref_doc_id=index_id)
+            except Exception as e:
+                # Log error and continue with the next index id
+                logger.error(f"Error deleting index: {index_id} - {e}")
+
+    except Exception as e:
+        logger.error(f"Error in delete_from_vector_db: {e}", exc_info=True)
+
+
+# Signal to perform vector DB cleanup on deletion
+@receiver(pre_delete, sender=LookupIndexManager)
+def perform_vector_db_cleanup(sender, instance, **kwargs):
+    """Signal handler to clean up vector DB entries when index is deleted.
+
+    This ensures that when a LookupIndexManager is deleted (e.g., when
+    a data source is deleted or re-indexed), the corresponding vectors
+    are removed from the vector database.
+    """
+    logger.debug(
+        f"Performing vector DB cleanup for data source: "
+        f"{instance.data_source.file_name}"
+    )
+
+    try:
+        # Get the index_ids_history to clean up from the vector db
+        index_ids_history = instance.index_ids_history
+
+        if not index_ids_history:
+            logger.debug("No index IDs to clean up")
+            return
+
+        if instance.profile_manager and instance.profile_manager.vector_store:
+            vector_db_instance_id = str(instance.profile_manager.vector_store.id)
+            delete_from_vector_db(index_ids_history, vector_db_instance_id)
+        else:
+            logger.warning(
+                f"Cannot cleanup vector DB: missing profile or vector store "
+                f"for data source {instance.data_source.file_name}"
+            )
+
+    except Exception as e:
+        logger.warning(
+            f"Error during vector DB cleanup for data source "
+            f"{instance.data_source.file_name}: {e}",
+            exc_info=True,
+        )
diff --git a/backend/lookup/models/lookup_profile_manager.py b/backend/lookup/models/lookup_profile_manager.py
new file mode 100644
index 0000000000..6d1472d23c
--- /dev/null
+++ b/backend/lookup/models/lookup_profile_manager.py
@@ -0,0 +1,157 @@
+"""LookupProfileManager model for managing adapter profiles in Look-Up projects."""
+
+import uuid
+
+from account_v2.models import User
+from adapter_processor_v2.models import AdapterInstance
+from django.db import models
+from utils.models.base_model import BaseModel
+
+from lookup.exceptions import DefaultProfileError
+
+
+class LookupProfileManager(BaseModel):
+    """Model to store adapter configuration profiles for Look-Up projects.
+
+    Each profile defines the set of adapters (X2Text, Embedding, VectorDB, LLM)
+    to use for text extraction, indexing, and lookup operations.
+
+    Follows the same pattern as Prompt Studio's ProfileManager.
+    """
+
+    profile_id = models.UUIDField(primary_key=True, default=uuid.uuid4, editable=False)
+
+    profile_name = models.TextField(
+        blank=False, null=False, db_comment="Name of the profile"
+    )
+
+    # Foreign key to LookupProject
+    lookup_project = models.ForeignKey(
+        "LookupProject",
+        on_delete=models.CASCADE,
+        related_name="profiles",
+        db_comment="Look-Up project this profile belongs to",
+    )
+
+    # Required Adapters - All must be configured
+    vector_store = models.ForeignKey(
+        AdapterInstance,
+        db_comment="Vector database adapter for storing embeddings",
+        blank=False,
+        null=False,
+        on_delete=models.PROTECT,
+        related_name="lookup_profiles_vector_store",
+    )
+
+    embedding_model = models.ForeignKey(
+        AdapterInstance,
+        db_comment="Embedding model adapter for generating vectors",
+        blank=False,
+        null=False,
+        on_delete=models.PROTECT,
+        related_name="lookup_profiles_embedding_model",
+    )
+
+    llm = models.ForeignKey(
+        AdapterInstance,
+        db_comment="LLM adapter for query processing and response generation",
+        blank=False,
+        null=False,
+        on_delete=models.PROTECT,
+        related_name="lookup_profiles_llm",
+    )
+
+    x2text = models.ForeignKey(
+        AdapterInstance,
+        db_comment="X2Text adapter for extracting text from various file formats",
+        blank=False,
+        null=False,
+        on_delete=models.PROTECT,
+        related_name="lookup_profiles_x2text",
+    )
+
+    # Configuration fields
+    chunk_size = models.IntegerField(
+        default=1000,
+        null=False,
+        blank=False,
+        db_comment="Size of text chunks for indexing",
+    )
+
+    chunk_overlap = models.IntegerField(
+        default=200,
+        null=False,
+        blank=False,
+        db_comment="Overlap between consecutive chunks",
+    )
+
+    similarity_top_k = models.IntegerField(
+        default=5,
+        null=False,
+        blank=False,
+        db_comment="Number of top similar chunks to retrieve",
+    )
+
+    # Flags
+    is_default = models.BooleanField(
+        default=False, db_comment="Whether this is the default profile for the project"
+    )
+
+    reindex = models.BooleanField(
+        default=False, db_comment="Flag to trigger re-indexing of reference data"
+    )
+
+    # Audit fields
+    created_by = models.ForeignKey(
+        User,
+        on_delete=models.SET_NULL,
+        related_name="lookup_profile_managers_created",
+        null=True,
+        blank=True,
+        editable=False,
+    )
+
+    modified_by = models.ForeignKey(
+        User,
+        on_delete=models.SET_NULL,
+        related_name="lookup_profile_managers_modified",
+        null=True,
+        blank=True,
+        editable=False,
+    )
+
+    class Meta:
+        verbose_name = "Lookup Profile Manager"
+        verbose_name_plural = "Lookup Profile Managers"
+        db_table = "lookup_profile_manager"
+        constraints = [
+            models.UniqueConstraint(
+                fields=["lookup_project", "profile_name"],
+                name="unique_lookup_project_profile_name_index",
+            ),
+        ]
+
+    def __str__(self):
+        return f"{self.profile_name} ({self.lookup_project.name})"
+
+    @staticmethod
+    def get_default_profile(project):
+        """Get the default profile for a Look-Up project.
+
+        Args:
+            project: LookupProject instance
+
+        Returns:
+            LookupProfileManager: The default profile
+
+        Raises:
+            DefaultProfileError: If no default profile exists
+        """
+        try:
+            return LookupProfileManager.objects.get(
+                lookup_project=project, is_default=True
+            )
+        except LookupProfileManager.DoesNotExist:
+            raise DefaultProfileError(
+                f"No default profile found for project {project.name}"
+            )
diff --git a/backend/lookup/models/lookup_project.py b/backend/lookup/models/lookup_project.py
new file mode 100644
index 0000000000..14b2d4d671
--- /dev/null
+++ b/backend/lookup/models/lookup_project.py
@@ -0,0 +1,177 @@
+"""LookupProject model for Static Data-based Look-Ups."""
+
+import uuid
+
+from django.contrib.auth import get_user_model
+from django.db import models
+from django.urls import reverse
+from utils.models.base_model import BaseModel
+from utils.models.organization_mixin import (
+    DefaultOrganizationMixin,
+)
+
+User = get_user_model()
+
+
+class LookupProject(DefaultOrganizationMixin, BaseModel):
+    """Represents a Look-Up project for static data-based enrichment.
+
+    This model stores the configuration for a Look-Up project including
+    LLM settings and organization association.
+    """
+
+    LOOKUP_TYPE_CHOICES = [
+        ("static_data", "Static Data"),
+    ]
+
+    REFERENCE_DATA_TYPE_CHOICES = [
+        ("vendor_catalog", "Vendor Catalog"),
+        ("product_catalog", "Product Catalog"),
+        ("customer_database", "Customer Database"),
+        ("pricing_data", "Pricing Data"),
+        ("compliance_rules", "Compliance Rules"),
+        ("custom", "Custom"),
+    ]
+
+    LLM_PROVIDER_CHOICES = [
+        ("openai", "OpenAI"),
+        ("anthropic", "Anthropic"),
+        ("azure", "Azure OpenAI"),
+        ("custom", "Custom Provider"),
+    ]
+
+    id = models.UUIDField(primary_key=True, default=uuid.uuid4, editable=False)
+    name = models.CharField(max_length=255, help_text="Name of the Look-Up project")
+    description = models.TextField(
+        blank=True, null=True, help_text="Description of the Look-Up project's purpose"
+    )
+    lookup_type = models.CharField(
+        max_length=50,
+        choices=LOOKUP_TYPE_CHOICES,
+        default="static_data",
+        help_text="Type of Look-Up (only static_data for POC)",
+    )
+    reference_data_type = models.CharField(
+        max_length=50,
+        choices=REFERENCE_DATA_TYPE_CHOICES,
+        help_text="Category of reference data being stored",
+    )
+
+    # Template and status
+    template = models.ForeignKey(
+        "LookupPromptTemplate",
+        on_delete=models.SET_NULL,
+        null=True,
+        blank=True,
+        related_name="projects",
+        help_text="Prompt template for this project",
+    )
+    is_active = models.BooleanField(
+        default=True, help_text="Whether this project is active"
+    )
+    metadata = models.JSONField(
+        default=dict, blank=True, help_text="Additional metadata for the project"
+    )
+
+    # LLM Configuration
+    llm_provider = models.CharField(
+        max_length=50,
+        choices=LLM_PROVIDER_CHOICES,
+        null=True,
+        blank=True,
+        help_text="LLM provider to use for matching",
+    )
+    llm_model = models.CharField(
+        max_length=100,
+        null=True,
+        blank=True,
+        help_text="Specific model name (e.g., gpt-4-turbo, claude-3-opus)",
+    )
+    llm_config = models.JSONField(
+        default=dict,
+        blank=True,
+        help_text="Additional LLM configuration (temperature, max_tokens, etc.)",
+    )
+
+    # Ownership
+    created_by = models.ForeignKey(
+        User,
+        on_delete=models.RESTRICT,
+        related_name="created_lookup_projects",
+        help_text="User who created this project",
+    )
+
+    # Note: created_at and modified_at are inherited from BaseModel
+    # Note: organization ForeignKey is inherited from DefaultOrganizationMixin
+
+    class Meta:
+        """Model metadata."""
+
+        db_table = "lookup_projects"
+        ordering = ["-created_at"]
+        verbose_name = "Look-Up Project"
+        verbose_name_plural = "Look-Up Projects"
+        indexes = [
+            models.Index(fields=["organization"]),
+            models.Index(fields=["created_by"]),
+            models.Index(fields=["modified_at"]),
+        ]
+
+    def __str__(self) -> str:
+        """String representation of the project."""
+        return self.name
+
+    def get_absolute_url(self) -> str:
+        """Get the URL for this project's detail view."""
+        return reverse("lookup:project-detail", kwargs={"pk": self.pk})
+
+    @property
+    def is_ready(self) -> bool:
+        """Check if the project has reference data ready for use.
+
+        Returns:
+            True if all reference data is extracted and ready, False otherwise.
+        """
+        if not hasattr(self, "data_sources"):
+            return False
+
+        latest_sources = self.data_sources.filter(is_latest=True)
+        if not latest_sources.exists():
+            return False
+
+        return all(source.extraction_status == "completed" for source in latest_sources)
+
+    def get_latest_reference_version(self) -> int | None:
+        """Get the latest version number of reference data.
+
+        Returns:
+            Latest version number or None if no data sources exist.
+        """
+        if not hasattr(self, "data_sources"):
+            return None
+
+        latest = self.data_sources.filter(is_latest=True).first()
+        return latest.version_number if latest else None
+
+    def clean(self):
+        """Validate model fields."""
+        super().clean()
+        from django.core.exceptions import ValidationError
+
+        # Validate LLM provider
+        valid_providers = [choice[0] for choice in self.LLM_PROVIDER_CHOICES]
+        if self.llm_provider not in valid_providers:
+            raise ValidationError(
+                f"Invalid LLM provider: {self.llm_provider}. "
+                f"Must be one of: {', '.join(valid_providers)}"
+            )
+
+        # Validate LLM config structure
+        if self.llm_config and not isinstance(self.llm_config, dict):
+            raise ValidationError("LLM config must be a dictionary")
+
+        # Validate lookup_type (only static_data for POC)
+        if self.lookup_type != "static_data":
+            raise ValidationError(
+                "Only 'static_data' lookup type is supported in this POC"
+            )
diff --git a/backend/lookup/models/lookup_prompt_template.py b/backend/lookup/models/lookup_prompt_template.py
new file mode 100644
index 0000000000..62bd7aae5d
--- /dev/null
+++ b/backend/lookup/models/lookup_prompt_template.py
@@ -0,0 +1,178 @@
+"""LookupPromptTemplate model for managing prompt templates."""
+
+import re
+import uuid
+
+from account_v2.models import User
+from django.core.exceptions import ValidationError
+from django.db import models
+from utils.models.base_model import BaseModel
+
+
+class LookupPromptTemplate(BaseModel):
+    """Represents a prompt template with variable detection and validation.
+
+    Each Look-Up project has one template that defines how to construct
+    the LLM prompt with {{variable}} placeholders.
+    """
+
+    VARIABLE_PATTERN = r"\{\{([^}]+)\}\}"
+    RESERVED_PREFIXES = ["_", "_lookup_"]
+
+    id = models.UUIDField(primary_key=True, default=uuid.uuid4, editable=False)
+    project = models.OneToOneField(
+        "lookup.LookupProject",
+        on_delete=models.CASCADE,
+        related_name="prompt_template_link",
+        help_text="Parent Look-Up project",
+    )
+
+    # Template Configuration
+    name = models.CharField(max_length=255, help_text="Template name for identification")
+    template_text = models.TextField(help_text="Template with {{variable}} placeholders")
+    llm_config = models.JSONField(
+        default=dict, blank=True, help_text="LLM configuration including adapter_id"
+    )
+    is_active = models.BooleanField(
+        default=True, help_text="Whether this template is active"
+    )
+    created_by = models.ForeignKey(
+        User,
+        on_delete=models.RESTRICT,
+        related_name="created_lookup_templates",
+        help_text="User who created this template",
+    )
+    variable_mappings = models.JSONField(
+        default=dict, blank=True, help_text="Optional documentation of variable mappings"
+    )
+
+    class Meta:
+        """Model metadata."""
+
+        db_table = "lookup_prompt_templates"
+        ordering = ["-modified_at"]
+        verbose_name = "Look-Up Prompt Template"
+        verbose_name_plural = "Look-Up Prompt Templates"
+
+    def __str__(self) -> str:
+        """String representation."""
+        return f"Template for {self.project.name}"
+
+    def detect_variables(self) -> list[str]:
+        """Detect all {{variable}} references in the template.
+
+        Returns:
+            List of unique variable paths found in the template.
+
+        Example:
+            Template: "Match {{input_data.vendor}} from {{reference_data}}"
+            Returns: ["input_data.vendor", "reference_data"]
+        """
+        if not self.template_text:
+            return []
+
+        matches = re.findall(self.VARIABLE_PATTERN, self.template_text)
+        # Strip whitespace and deduplicate
+        unique_vars = list({m.strip() for m in matches})
+        return sorted(unique_vars)
+
+    def validate_syntax(self) -> bool:
+        """Validate template syntax for matching braces.
+
+        Returns:
+            True if syntax is valid, False otherwise.
+
+        Raises:
+            ValidationError: If syntax is invalid.
+        """
+        # Check for unmatched opening braces
+        open_count = self.template_text.count("{{")
+        close_count = self.template_text.count("}}")
+
+        if open_count != close_count:
+            raise ValidationError(
+                f"Mismatched braces in template: {open_count} opening, "
+                f"{close_count} closing"
+            )
+
+        # Check for nested braces (not allowed)
+        if re.search(r"\{\{[^}]*\{\{", self.template_text):
+            raise ValidationError("Nested variable placeholders are not allowed")
+
+        return True
+
+    def validate_reserved_keywords(self) -> bool:
+        """Check that template doesn't use reserved keywords.
+
+        Returns:
+            True if no reserved keywords are used.
+
+        Raises:
+            ValidationError: If reserved keywords are found.
+        """
+        variables = self.detect_variables()
+
+        for var in variables:
+            # Check if variable starts with reserved prefixes
+            for prefix in self.RESERVED_PREFIXES:
+                if var.startswith(prefix):
+                    raise ValidationError(
+                        f"Variable '{var}' uses reserved prefix '{prefix}'. "
+                        f"Reserved prefixes: {', '.join(self.RESERVED_PREFIXES)}"
+                    )
+
+            # Check if trying to write to reserved fields
+            if "=" in var or var.endswith("_metadata"):
+                raise ValidationError(
+                    f"Variable '{var}' appears to be trying to set a value. "
+                    f"Variables should only reference existing data."
+                )
+
+        return True
+
+    def get_variable_info(self) -> dict:
+        """Get detailed information about detected variables.
+
+        Returns:
+            Dictionary with variable paths and their types/documentation.
+        """
+        variables = self.detect_variables()
+        info = {}
+
+        for var in variables:
+            parts = var.split(".")
+            if len(parts) > 0:
+                root = parts[0]
+                path = ".".join(parts[1:]) if len(parts) > 1 else ""
+
+                info[var] = {
+                    "root": root,
+                    "path": path,
+                    "depth": len(parts),
+                    "description": self.variable_mappings.get(var, "No description"),
+                }
+
+        return info
+
+    def clean(self):
+        """Validate the template on save."""
+        super().clean()
+
+        if not self.template_text:
+            raise ValidationError("Template text cannot be empty")
+
+        try:
+            self.validate_syntax()
+            self.validate_reserved_keywords()
+        except ValidationError as e:
+            raise e
+
+        # Warn if no variables detected (might be intentional)
+        if not self.detect_variables():
+            # This is just a warning, not an error
+            pass
+
+    @property
+    def variable_count(self) -> int:
+        """Get the count of unique variables in the template."""
+        return len(self.detect_variables())
diff --git a/backend/lookup/models/prompt_studio_lookup_link.py b/backend/lookup/models/prompt_studio_lookup_link.py
new file mode 100644
index 0000000000..0a03cd7f63
--- /dev/null
+++ b/backend/lookup/models/prompt_studio_lookup_link.py
@@ -0,0 +1,128 @@
+"""PromptStudioLookupLink model for linking PS projects with Look-Up projects."""
+
+import uuid
+
+from django.db import models
+
+
+class PromptStudioLookupLinkManager(models.Manager):
+    """Custom manager for PromptStudioLookupLink."""
+
+    def get_links_for_ps_project(self, ps_project_id: uuid.UUID):
+        """Get all Look-Up links for a Prompt Studio project, ordered by execution order.
+
+        Args:
+            ps_project_id: UUID of the Prompt Studio project
+
+        Returns:
+            QuerySet of links ordered by execution_order
+        """
+        return self.filter(prompt_studio_project_id=ps_project_id).order_by(
+            "execution_order", "created_at"
+        )
+
+    def get_lookup_projects_for_ps(self, ps_project_id: uuid.UUID):
+        """Get all Look-Up projects linked to a Prompt Studio project.
+
+        Args:
+            ps_project_id: UUID of the Prompt Studio project
+
+        Returns:
+            QuerySet of LookupProject instances
+        """
+        from .lookup_project import LookupProject
+
+        link_ids = self.filter(prompt_studio_project_id=ps_project_id).values_list(
+            "lookup_project_id", flat=True
+        )
+
+        return LookupProject.objects.filter(id__in=link_ids)
+
+
+class PromptStudioLookupLink(models.Model):
+    """Many-to-many relationship between Prompt Studio projects and Look-Up projects.
+
+    Manages the linking and execution order of Look-Up projects within
+    a Prompt Studio extraction pipeline.
+    """
+
+    id = models.UUIDField(primary_key=True, default=uuid.uuid4, editable=False)
+
+    # Note: We're using UUIDs for now since PS project model isn't defined yet
+    # In production, this should be a ForeignKey to the actual PS project model
+    prompt_studio_project_id = models.UUIDField(
+        help_text="UUID of the Prompt Studio project"
+    )
+
+    lookup_project = models.ForeignKey(
+        "lookup.LookupProject",
+        on_delete=models.CASCADE,
+        related_name="ps_links",
+        help_text="Linked Look-Up project",
+    )
+
+    execution_order = models.PositiveIntegerField(
+        default=0, help_text="Order in which this Look-Up executes (lower numbers first)"
+    )
+
+    # Timestamps
+    created_at = models.DateTimeField(auto_now_add=True)
+
+    objects = PromptStudioLookupLinkManager()
+
+    class Meta:
+        """Model metadata."""
+
+        db_table = "prompt_studio_lookup_links"
+        ordering = ["execution_order", "created_at"]
+        unique_together = [["prompt_studio_project_id", "lookup_project"]]
+        verbose_name = "Prompt Studio Look-Up Link"
+        verbose_name_plural = "Prompt Studio Look-Up Links"
+        indexes = [
+            models.Index(fields=["prompt_studio_project_id"]),
+            models.Index(fields=["lookup_project"]),
+            models.Index(fields=["prompt_studio_project_id", "execution_order"]),
+        ]
+
+    def __str__(self) -> str:
+        """String representation."""
+        return f"PS Project {self.prompt_studio_project_id} → {self.lookup_project.name}"
+
+    def save(self, *args, **kwargs):
+        """Override save to auto-assign execution_order if not set.
+
+        Auto-assigns the next available execution order number for the
+        Prompt Studio project if not explicitly provided.
+        """
+        if self.execution_order == 0 and not self.pk:
+            # Get the maximum execution order for this PS project
+            max_order = PromptStudioLookupLink.objects.filter(
+                prompt_studio_project_id=self.prompt_studio_project_id
+            ).aggregate(max_order=models.Max("execution_order"))["max_order"]
+
+            # Set to max + 1, or 1 if no existing links
+            self.execution_order = (max_order or 0) + 1
+
+        super().save(*args, **kwargs)
+
+    def clean(self):
+        """Validate the link."""
+        super().clean()
+
+        # In production, we would validate that both projects
+        # belong to the same organization here
+        # For now, we'll just ensure the lookup project is ready
+
+        if self.lookup_project and not self.lookup_project.is_ready:
+            # This is a warning, not an error - allow linking but warn
+            # In production, this might log a warning
+            pass
+
+    @property
+    def is_enabled(self) -> bool:
+        """Check if this link is enabled and ready for execution.
+
+        Returns:
+            True if the linked Look-Up project is ready for use.
+        """
+        return self.lookup_project.is_ready if self.lookup_project else False
diff --git a/backend/lookup/serializers.py b/backend/lookup/serializers.py
new file mode 100644
index 0000000000..be0aff118f
--- /dev/null
+++ b/backend/lookup/serializers.py
@@ -0,0 +1,333 @@
+"""Django REST Framework serializers for Look-Up API.
+
+This module provides serializers for all Look-Up models
+to support RESTful API operations.
+"""
+
+import logging
+from typing import Any
+
+from adapter_processor_v2.adapter_processor import AdapterProcessor
+from rest_framework import serializers
+
+from backend.serializers import AuditSerializer
+
+from .constants import LookupProfileManagerKeys
+from .models import (
+    LookupDataSource,
+    LookupExecutionAudit,
+    LookupProfileManager,
+    LookupProject,
+    LookupPromptTemplate,
+    PromptStudioLookupLink,
+)
+
+logger = logging.getLogger(__name__)
+
+
+class LookupPromptTemplateSerializer(serializers.ModelSerializer):
+    """Serializer for LookupPromptTemplate model."""
+
+    class Meta:
+        model = LookupPromptTemplate
+        fields = [
+            "id",
+            "project",
+            "name",
+            "template_text",
+            "llm_config",
+            "is_active",
+            "created_by",
+            "created_at",
+            "modified_at",
+        ]
+        read_only_fields = ["id", "created_by", "created_at", "modified_at"]
+
+    def validate_template_text(self, value: str) -> str:
+        """Validate that template text contains required placeholders."""
+        if "{{reference_data}}" not in value:
+            raise serializers.ValidationError(
+                "Template must contain {{reference_data}} placeholder"
+            )
+        return value
+
+    def validate_llm_config(self, value: dict[str, Any]) -> dict[str, Any]:
+        """Validate LLM configuration structure."""
+        # Accept either new format (adapter_id) or legacy format (provider + model)
+        has_adapter_id = "adapter_id" in value
+        has_legacy = "provider" in value and "model" in value
+
+        if not has_adapter_id and not has_legacy:
+            raise serializers.ValidationError(
+                "llm_config must contain either 'adapter_id' (recommended) "
+                "or both 'provider' and 'model' fields"
+            )
+        return value
+
+
+class LookupDataSourceSerializer(serializers.ModelSerializer):
+    """Serializer for LookupDataSource model."""
+
+    extraction_status_display = serializers.CharField(
+        source="get_extraction_status_display", read_only=True
+    )
+
+    class Meta:
+        model = LookupDataSource
+        fields = [
+            "id",
+            "project",
+            "file_name",
+            "file_path",
+            "file_size",
+            "file_type",
+            "extracted_content_path",
+            "extraction_status",
+            "extraction_status_display",
+            "extraction_error",
+            "version_number",
+            "is_latest",
+            "uploaded_by",
+            "created_at",
+            "modified_at",
+        ]
+        read_only_fields = [
+            "id",
+            "version_number",
+            "is_latest",
+            "uploaded_by",
+            "created_at",
+            "modified_at",
+            "extraction_status_display",
+        ]
+
+
+class LookupProjectSerializer(serializers.ModelSerializer):
+    """Serializer for LookupProject model."""
+
+    template = LookupPromptTemplateSerializer(read_only=True)
+    template_id = serializers.PrimaryKeyRelatedField(
+        queryset=LookupPromptTemplate.objects.all(),
+        source="template",
+        write_only=True,
+        allow_null=True,
+        required=False,
+    )
+    data_source_count = serializers.SerializerMethodField()
+    latest_version = serializers.SerializerMethodField()
+
+    class Meta:
+        model = LookupProject
+        fields = [
+            "id",
+            "name",
+            "description",
+            "reference_data_type",
+            "template",
+            "template_id",
+            "is_active",
+            "data_source_count",
+            "latest_version",
+            "metadata",
+            "created_by",
+            "created_at",
+            "modified_at",
+        ]
+        read_only_fields = [
+            "id",
+            "data_source_count",
+            "latest_version",
+            "created_by",
+            "created_at",
+            "modified_at",
+        ]
+
+    def get_data_source_count(self, obj) -> int:
+        """Get count of data sources for this project."""
+        return obj.data_sources.filter(is_latest=True).count()
+
+    def get_latest_version(self, obj) -> int:
+        """Get latest version number of data sources."""
+        latest = obj.data_sources.filter(is_latest=True).first()
+        return latest.version_number if latest else 0
+
+
+class PromptStudioLookupLinkSerializer(serializers.ModelSerializer):
+    """Serializer for linking Look-Ups to Prompt Studio projects."""
+
+    lookup_project_name = serializers.CharField(
+        source="lookup_project.name", read_only=True
+    )
+
+    class Meta:
+        model = PromptStudioLookupLink
+        fields = [
+            "id",
+            "prompt_studio_project_id",
+            "lookup_project",
+            "lookup_project_name",
+            "created_at",
+        ]
+        read_only_fields = ["id", "lookup_project_name", "created_at"]
+
+    def validate(self, attrs):
+        """Validate that the link doesn't already exist."""
+        ps_project_id = attrs.get("prompt_studio_project_id")
+        lookup_project = attrs.get("lookup_project")
+
+        # Check if this combination already exists
+        existing = PromptStudioLookupLink.objects.filter(
+            prompt_studio_project_id=ps_project_id, lookup_project=lookup_project
+        ).exists()
+
+        if existing and not self.instance:  # Only check for creation, not update
+            raise serializers.ValidationError(
+                "This Look-Up is already linked to the Prompt Studio project"
+            )
+
+        return attrs
+
+
+class LookupExecutionAuditSerializer(serializers.ModelSerializer):
+    """Serializer for execution audit records."""
+
+    lookup_project_name = serializers.CharField(
+        source="lookup_project.name", read_only=True
+    )
+
+    class Meta:
+        model = LookupExecutionAudit
+        fields = [
+            "id",
+            "lookup_project",
+            "lookup_project_name",
+            "prompt_studio_project_id",
+            "execution_id",
+            "input_data",
+            "enriched_output",
+            "reference_data_version",
+            "llm_provider",
+            "llm_model",
+            "llm_prompt",
+            "llm_response",
+            "llm_response_cached",
+            "execution_time_ms",
+            "llm_call_time_ms",
+            "status",
+            "error_message",
+            "confidence_score",
+            "executed_at",
+        ]
+        read_only_fields = fields  # All fields are read-only for audit records
+
+
+class LookupExecutionRequestSerializer(serializers.Serializer):
+    """Serializer for Look-Up execution requests."""
+
+    input_data = serializers.JSONField(help_text="Input data for variable resolution")
+    lookup_project_ids = serializers.ListField(
+        child=serializers.UUIDField(),
+        required=False,
+        help_text="List of Look-Up project IDs to execute",
+    )
+    use_cache = serializers.BooleanField(
+        default=True, help_text="Whether to use cached LLM responses"
+    )
+    timeout_seconds = serializers.IntegerField(
+        default=30,
+        min_value=1,
+        max_value=300,
+        help_text="Timeout for execution in seconds",
+    )
+
+
+class LookupExecutionResponseSerializer(serializers.Serializer):
+    """Serializer for Look-Up execution responses."""
+
+    lookup_enrichment = serializers.JSONField(
+        help_text="Merged enrichment data from all Look-Ups"
+    )
+    _lookup_metadata = serializers.JSONField(
+        help_text="Execution metadata including timing and status"
+    )
+
+
+class ReferenceDataUploadSerializer(serializers.Serializer):
+    """Serializer for reference data upload requests."""
+
+    file = serializers.FileField(help_text="Reference data file to upload")
+    extract_text = serializers.BooleanField(
+        default=True, help_text="Whether to extract text from the file"
+    )
+    metadata = serializers.JSONField(
+        required=False, default=dict, help_text="Additional metadata for the data source"
+    )
+
+
+class BulkLinkSerializer(serializers.Serializer):
+    """Serializer for bulk linking operations."""
+
+    prompt_studio_project_id = serializers.UUIDField(help_text="Prompt Studio project ID")
+    lookup_project_ids = serializers.ListField(
+        child=serializers.UUIDField(), help_text="List of Look-Up project IDs to link"
+    )
+    unlink = serializers.BooleanField(
+        default=False, help_text="If true, unlink instead of link"
+    )
+
+
+class TemplateValidationSerializer(serializers.Serializer):
+    """Serializer for template validation requests."""
+
+    template_text = serializers.CharField(help_text="Template text to validate")
+    sample_data = serializers.JSONField(
+        required=False, help_text="Sample input data for testing variable resolution"
+    )
+    sample_reference = serializers.CharField(
+        required=False, help_text="Sample reference data for testing"
+    )
+
+
+class LookupProfileManagerSerializer(AuditSerializer):
+    """Serializer for LookupProfileManager model.
+
+    Follows the same pattern as Prompt Studio's ProfileManagerSerializer.
+    Expands adapter UUIDs to full adapter details in the response.
+    """
+
+    class Meta:
+        model = LookupProfileManager
+        fields = "__all__"
+
+    def to_representation(self, instance):
+        """Expand adapter UUIDs to full adapter details.
+
+        This converts the FK references to AdapterInstance objects
+        into full adapter details including adapter_name, adapter_type, etc.
+        """
+        rep: dict[str, str] = super().to_representation(instance)
+
+        # Expand each adapter FK to full details
+        llm = rep.get(LookupProfileManagerKeys.LLM)
+        embedding = rep.get(LookupProfileManagerKeys.EMBEDDING_MODEL)
+        vector_db = rep.get(LookupProfileManagerKeys.VECTOR_STORE)
+        x2text = rep.get(LookupProfileManagerKeys.X2TEXT)
+
+        if llm:
+            rep[LookupProfileManagerKeys.LLM] = (
+                AdapterProcessor.get_adapter_instance_by_id(llm)
+            )
+        if embedding:
+            rep[LookupProfileManagerKeys.EMBEDDING_MODEL] = (
+                AdapterProcessor.get_adapter_instance_by_id(embedding)
+            )
+        if vector_db:
+            rep[LookupProfileManagerKeys.VECTOR_STORE] = (
+                AdapterProcessor.get_adapter_instance_by_id(vector_db)
+            )
+        if x2text:
+            rep[LookupProfileManagerKeys.X2TEXT] = (
+                AdapterProcessor.get_adapter_instance_by_id(x2text)
+            )
+
+        return rep
diff --git a/backend/lookup/services/__init__.py b/backend/lookup/services/__init__.py
new file mode 100644
index 0000000000..1e7332ee1c
--- /dev/null
+++ b/backend/lookup/services/__init__.py
@@ -0,0 +1,29 @@
+"""Service layer implementations for the Look-Up system.
+
+This package contains the core business logic and service classes
+for the Static Data-based Look-Ups feature.
+"""
+
+from .audit_logger import AuditLogger
+from .document_indexing_service import LookupDocumentIndexingService
+from .enrichment_merger import EnrichmentMerger
+from .indexing_service import IndexingService
+from .llm_cache import LLMResponseCache
+from .lookup_executor import LookUpExecutor
+from .lookup_index_helper import LookupIndexHelper
+from .lookup_orchestrator import LookUpOrchestrator
+from .reference_data_loader import ReferenceDataLoader
+from .variable_resolver import VariableResolver
+
+__all__ = [
+    "AuditLogger",
+    "LookupDocumentIndexingService",
+    "EnrichmentMerger",
+    "IndexingService",
+    "LookupIndexHelper",
+    "LLMResponseCache",
+    "LookUpExecutor",
+    "LookUpOrchestrator",
+    "ReferenceDataLoader",
+    "VariableResolver",
+]
diff --git a/backend/lookup/services/audit_logger.py b/backend/lookup/services/audit_logger.py
new file mode 100644
index 0000000000..3259e4c1d6
--- /dev/null
+++ b/backend/lookup/services/audit_logger.py
@@ -0,0 +1,310 @@
+"""Audit Logger implementation for tracking Look-Up executions.
+
+This module provides functionality to log all Look-Up execution details
+to the database for debugging, monitoring, and compliance purposes.
+"""
+
+import logging
+from decimal import Decimal
+from typing import Any
+from uuid import UUID
+
+from lookup.models import LookupExecutionAudit, LookupProject
+
+logger = logging.getLogger(__name__)
+
+
+class AuditLogger:
+    """Logs Look-Up execution details to lookup_execution_audit table.
+
+    This class provides methods to record all aspects of Look-Up executions
+    including inputs, outputs, performance metrics, and errors for audit
+    trail and debugging purposes.
+    """
+
+    def log_execution(
+        self,
+        execution_id: str,
+        lookup_project_id: UUID,
+        prompt_studio_project_id: UUID | None,
+        input_data: dict[str, Any],
+        reference_data_version: int,
+        llm_provider: str,
+        llm_model: str,
+        llm_prompt: str,
+        llm_response: str | None,
+        enriched_output: dict[str, Any] | None,
+        status: str,  # 'success', 'partial', 'failed'
+        confidence_score: float | None = None,
+        execution_time_ms: int | None = None,
+        llm_call_time_ms: int | None = None,
+        llm_response_cached: bool = False,
+        error_message: str | None = None,
+    ) -> LookupExecutionAudit | None:
+        """Log execution to database.
+
+        Records comprehensive details about a Look-Up execution including
+        the input data, LLM interaction, output, and performance metrics.
+
+        Args:
+            execution_id: UUID of the orchestration execution
+            lookup_project_id: UUID of the Look-Up project
+            prompt_studio_project_id: Optional UUID of PS project
+            input_data: Input data used for variable resolution
+            reference_data_version: Version of reference data used
+            llm_provider: LLM provider name (e.g., 'openai')
+            llm_model: LLM model name (e.g., 'gpt-4')
+            llm_prompt: Final resolved prompt sent to LLM
+            llm_response: Raw response from LLM
+            enriched_output: Parsed enrichment data
+            status: Execution status ('success', 'partial', 'failed')
+            confidence_score: Optional confidence score (0.0-1.0)
+            execution_time_ms: Total execution time in milliseconds
+            llm_call_time_ms: Time spent calling LLM in milliseconds
+            llm_response_cached: Whether response was from cache
+            error_message: Error message if execution failed
+
+        Returns:
+            Created LookupExecutionAudit instance or None if logging fails
+
+        Example:
+            >>> logger = AuditLogger()
+            >>> audit = logger.log_execution(
+            ...     execution_id='abc-123',
+            ...     lookup_project_id=project_id,
+            ...     status='success',
+            ...     ...
+            ... )
+        """
+        try:
+            # Get the Look-Up project
+            try:
+                lookup_project = LookupProject.objects.get(id=lookup_project_id)
+            except LookupProject.DoesNotExist:
+                logger.error(f"Look-Up project {lookup_project_id} not found for audit")
+                return None
+
+            # Convert confidence score to Decimal if provided
+            if confidence_score is not None:
+                confidence_score = Decimal(str(confidence_score))
+
+            # Create audit record
+            audit = LookupExecutionAudit.objects.create(
+                lookup_project=lookup_project,
+                prompt_studio_project_id=prompt_studio_project_id,
+                execution_id=execution_id,
+                input_data=input_data,
+                reference_data_version=reference_data_version,
+                enriched_output=enriched_output,
+                llm_provider=llm_provider,
+                llm_model=llm_model,
+                llm_prompt=llm_prompt,
+                llm_response=llm_response,
+                llm_response_cached=llm_response_cached,
+                execution_time_ms=execution_time_ms,
+                llm_call_time_ms=llm_call_time_ms,
+                status=status,
+                error_message=error_message,
+                confidence_score=confidence_score,
+            )
+
+            logger.debug(
+                f"Logged execution audit {audit.id} for Look-Up {lookup_project.name} "
+                f"(execution {execution_id})"
+            )
+
+            return audit
+
+        except Exception as e:
+            # Log error but don't fail the execution
+            logger.exception(
+                f"Failed to log execution audit for {lookup_project_id}: {str(e)}"
+            )
+            return None
+
+    def log_success(
+        self, execution_id: str, project_id: UUID, **kwargs
+    ) -> LookupExecutionAudit | None:
+        """Convenience method for logging successful execution.
+
+        Args:
+            execution_id: UUID of the orchestration execution
+            project_id: UUID of the Look-Up project
+            **kwargs: Additional parameters to pass to log_execution
+
+        Returns:
+            Created audit record or None if logging fails
+
+        Example:
+            >>> audit = logger.log_success(
+            ...     execution_id="abc-123",
+            ...     project_id=project_id,
+            ...     input_data={"vendor": "Slack"},
+            ...     enriched_output={"canonical_vendor": "Slack"},
+            ...     confidence_score=0.92,
+            ... )
+        """
+        return self.log_execution(
+            execution_id=execution_id,
+            lookup_project_id=project_id,
+            status="success",
+            **kwargs,
+        )
+
+    def log_failure(
+        self, execution_id: str, project_id: UUID, error: str, **kwargs
+    ) -> LookupExecutionAudit | None:
+        """Convenience method for logging failed execution.
+
+        Args:
+            execution_id: UUID of the orchestration execution
+            project_id: UUID of the Look-Up project
+            error: Error message describing the failure
+            **kwargs: Additional parameters to pass to log_execution
+
+        Returns:
+            Created audit record or None if logging fails
+
+        Example:
+            >>> audit = logger.log_failure(
+            ...     execution_id="abc-123",
+            ...     project_id=project_id,
+            ...     error="LLM timeout after 30 seconds",
+            ...     input_data={"vendor": "Slack"},
+            ... )
+        """
+        return self.log_execution(
+            execution_id=execution_id,
+            lookup_project_id=project_id,
+            status="failed",
+            error_message=error,
+            **kwargs,
+        )
+
+    def log_partial(
+        self, execution_id: str, project_id: UUID, **kwargs
+    ) -> LookupExecutionAudit | None:
+        """Convenience method for logging partial success.
+
+        Used when some enrichment was achieved but with issues
+        (e.g., low confidence, incomplete data).
+
+        Args:
+            execution_id: UUID of the orchestration execution
+            project_id: UUID of the Look-Up project
+            **kwargs: Additional parameters to pass to log_execution
+
+        Returns:
+            Created audit record or None if logging fails
+
+        Example:
+            >>> audit = logger.log_partial(
+            ...     execution_id="abc-123",
+            ...     project_id=project_id,
+            ...     input_data={"vendor": "Unknown Corp"},
+            ...     enriched_output={"canonical_vendor": "Unknown"},
+            ...     confidence_score=0.35,
+            ...     error_message="Low confidence match",
+            ... )
+        """
+        return self.log_execution(
+            execution_id=execution_id,
+            lookup_project_id=project_id,
+            status="partial",
+            **kwargs,
+        )
+
+    def get_execution_history(self, execution_id: str, limit: int = 100) -> list:
+        """Retrieve audit records for a specific execution.
+
+        Args:
+            execution_id: UUID of the orchestration execution
+            limit: Maximum number of records to return
+
+        Returns:
+            List of LookupExecutionAudit instances
+
+        Example:
+            >>> history = logger.get_execution_history("abc-123")
+            >>> for audit in history:
+            ...     print(f"{audit.lookup_project.name}: {audit.status}")
+        """
+        try:
+            return list(
+                LookupExecutionAudit.objects.filter(execution_id=execution_id)
+                .select_related("lookup_project")
+                .order_by("executed_at")[:limit]
+            )
+        except Exception as e:
+            logger.error(f"Failed to retrieve execution history: {str(e)}")
+            return []
+
+    def get_project_stats(self, project_id: UUID, limit: int = 1000) -> dict[str, Any]:
+        """Get execution statistics for a Look-Up project.
+
+        Args:
+            project_id: UUID of the Look-Up project
+            limit: Maximum number of records to analyze
+
+        Returns:
+            Dictionary with statistics including success rate,
+            average execution time, cache hit rate, etc.
+
+        Example:
+            >>> stats = logger.get_project_stats(project_id)
+            >>> print(f"Success rate: {stats['success_rate']:.1%}")
+        """
+        try:
+            audits = LookupExecutionAudit.objects.filter(
+                lookup_project_id=project_id
+            ).order_by("-executed_at")[:limit]
+
+            total = len(audits)
+            if total == 0:
+                return {
+                    "total_executions": 0,
+                    "success_rate": 0.0,
+                    "avg_execution_time_ms": 0,
+                    "cache_hit_rate": 0.0,
+                    "avg_confidence": 0.0,
+                }
+
+            successful = sum(1 for a in audits if a.status == "success")
+            cached = sum(1 for a in audits if a.llm_response_cached)
+
+            exec_times = [
+                a.execution_time_ms for a in audits if a.execution_time_ms is not None
+            ]
+            avg_exec_time = sum(exec_times) / len(exec_times) if exec_times else 0
+
+            confidence_scores = [
+                float(a.confidence_score)
+                for a in audits
+                if a.confidence_score is not None
+            ]
+            avg_confidence = (
+                sum(confidence_scores) / len(confidence_scores)
+                if confidence_scores
+                else 0.0
+            )
+
+            return {
+                "total_executions": total,
+                "success_rate": successful / total if total > 0 else 0.0,
+                "avg_execution_time_ms": int(avg_exec_time),
+                "cache_hit_rate": cached / total if total > 0 else 0.0,
+                "avg_confidence": avg_confidence,
+                "successful": successful,
+                "failed": sum(1 for a in audits if a.status == "failed"),
+                "partial": sum(1 for a in audits if a.status == "partial"),
+            }
+
+        except Exception as e:
+            logger.error(f"Failed to get project stats: {str(e)}")
+            return {
+                "total_executions": 0,
+                "success_rate": 0.0,
+                "avg_execution_time_ms": 0,
+                "cache_hit_rate": 0.0,
+                "avg_confidence": 0.0,
+            }
diff --git a/backend/lookup/services/document_indexing_service.py b/backend/lookup/services/document_indexing_service.py
new file mode 100644
index 0000000000..5da68e8542
--- /dev/null
+++ b/backend/lookup/services/document_indexing_service.py
@@ -0,0 +1,141 @@
+"""Document Indexing Service for Lookup projects.
+
+This service manages indexing status tracking using cache to prevent
+duplicate indexing operations and track in-progress indexing.
+
+Based on Prompt Studio's DocumentIndexingService pattern.
+"""
+
+import logging
+
+from django.core.cache import cache
+
+logger = logging.getLogger(__name__)
+
+
+class LookupDocumentIndexingService:
+    """Cache-based service to track document indexing status.
+
+    Prevents duplicate indexing and tracks in-progress operations.
+    """
+
+    # Cache key format: lookup_indexing:{org_id}:{user_id}:{doc_id_key}
+    CACHE_KEY_PREFIX = "lookup_indexing"
+    CACHE_TIMEOUT = 3600  # 1 hour
+
+    # Status values
+    STATUS_INDEXING = "INDEXING"  # Currently being indexed
+
+    @staticmethod
+    def _get_cache_key(org_id: str, user_id: str, doc_id_key: str) -> str:
+        """Generate cache key for document indexing status.
+
+        Args:
+            org_id: Organization ID
+            user_id: User ID
+            doc_id_key: Document ID key (hash of indexing parameters)
+
+        Returns:
+            Cache key string
+        """
+        return f"{LookupDocumentIndexingService.CACHE_KEY_PREFIX}:{org_id}:{user_id}:{doc_id_key}"
+
+    @staticmethod
+    def is_document_indexing(org_id: str, user_id: str, doc_id_key: str) -> bool:
+        """Check if document is currently being indexed.
+
+        Args:
+            org_id: Organization ID
+            user_id: User ID
+            doc_id_key: Document ID key
+
+        Returns:
+            True if document is being indexed, False otherwise
+        """
+        cache_key = LookupDocumentIndexingService._get_cache_key(
+            org_id, user_id, doc_id_key
+        )
+        status = cache.get(cache_key)
+
+        if status == LookupDocumentIndexingService.STATUS_INDEXING:
+            logger.debug(f"Document {doc_id_key} is currently being indexed")
+            return True
+
+        return False
+
+    @staticmethod
+    def set_document_indexing(org_id: str, user_id: str, doc_id_key: str) -> None:
+        """Mark document as being indexed.
+
+        Args:
+            org_id: Organization ID
+            user_id: User ID
+            doc_id_key: Document ID key
+        """
+        cache_key = LookupDocumentIndexingService._get_cache_key(
+            org_id, user_id, doc_id_key
+        )
+        cache.set(
+            cache_key,
+            LookupDocumentIndexingService.STATUS_INDEXING,
+            LookupDocumentIndexingService.CACHE_TIMEOUT,
+        )
+        logger.debug(f"Marked document {doc_id_key} as being indexed")
+
+    @staticmethod
+    def mark_document_indexed(
+        org_id: str, user_id: str, doc_id_key: str, doc_id: str
+    ) -> None:
+        """Mark document as indexed with final doc_id.
+
+        Args:
+            org_id: Organization ID
+            user_id: User ID
+            doc_id_key: Document ID key
+            doc_id: Final document ID from indexing service
+        """
+        cache_key = LookupDocumentIndexingService._get_cache_key(
+            org_id, user_id, doc_id_key
+        )
+        # Store the final doc_id instead of status
+        cache.set(cache_key, doc_id, LookupDocumentIndexingService.CACHE_TIMEOUT)
+        logger.debug(f"Marked document {doc_id_key} as indexed with ID {doc_id}")
+
+    @staticmethod
+    def get_indexed_document_id(org_id: str, user_id: str, doc_id_key: str) -> str | None:
+        """Get indexed document ID if already indexed.
+
+        Args:
+            org_id: Organization ID
+            user_id: User ID
+            doc_id_key: Document ID key
+
+        Returns:
+            Document ID if indexed, None otherwise
+        """
+        cache_key = LookupDocumentIndexingService._get_cache_key(
+            org_id, user_id, doc_id_key
+        )
+        cached_value = cache.get(cache_key)
+
+        # Return doc_id only if it's not the "INDEXING" status
+        if cached_value and cached_value != LookupDocumentIndexingService.STATUS_INDEXING:
+            logger.debug(f"Document {doc_id_key} already indexed with ID {cached_value}")
+            return cached_value
+
+        return None
+
+    @staticmethod
+    def clear_indexing_status(org_id: str, user_id: str, doc_id_key: str) -> None:
+        """Clear indexing status from cache (e.g., on error).
+
+        Args:
+            org_id: Organization ID
+            user_id: User ID
+            doc_id_key: Document ID key
+        """
+        cache_key = LookupDocumentIndexingService._get_cache_key(
+            org_id, user_id, doc_id_key
+        )
+        cache.delete(cache_key)
+        logger.debug(f"Cleared indexing status for document {doc_id_key}")
diff --git a/backend/lookup/services/enrichment_merger.py b/backend/lookup/services/enrichment_merger.py
new file mode 100644
index 0000000000..47da11b079
--- /dev/null
+++ b/backend/lookup/services/enrichment_merger.py
@@ -0,0 +1,174 @@
+"""Enrichment Merger implementation for combining multiple Look-Up results.
+
+This module provides functionality to merge enrichment data from multiple
+Look-Up executions with confidence-based conflict resolution.
+"""
+
+from typing import Any
+
+
+class EnrichmentMerger:
+    """Merges enrichments from multiple Look-Ups with conflict resolution.
+
+    When multiple Look-Ups run on the same input data, they may produce
+    overlapping enrichment fields. This class handles merging those results
+    and resolving conflicts based on confidence scores.
+    """
+
+    def merge(self, enrichments: list[dict[str, Any]]) -> dict[str, Any]:
+        """Merge enrichments with conflict resolution.
+
+        Combines enrichment data from multiple Look-Up executions,
+        resolving conflicts based on confidence scores when the same
+        field appears in multiple enrichments.
+
+        Args:
+            enrichments: List of dicts with structure:
+                {
+                    'project_id': UUID,
+                    'project_name': str,
+                    'data': Dict[str, Any],  # Enrichment fields
+                    'confidence': Optional[float],  # 0.0-1.0
+                    'execution_time_ms': int,
+                    'cached': bool
+                }
+
+        Returns:
+            Dictionary containing:
+                - data: Merged enrichment data
+                - conflicts_resolved: Number of conflicts resolved
+                - enrichment_details: Per-lookup metadata
+
+        Example:
+            >>> merger = EnrichmentMerger()
+            >>> enrichments = [
+            ...     {
+            ...         "project_id": uuid1,
+            ...         "project_name": "Vendor Matcher",
+            ...         "data": {"vendor": "Slack", "category": "SaaS"},
+            ...         "confidence": 0.95,
+            ...         "execution_time_ms": 1234,
+            ...         "cached": False,
+            ...     },
+            ...     {
+            ...         "project_id": uuid2,
+            ...         "project_name": "Product Classifier",
+            ...         "data": {"category": "Communication", "type": "Software"},
+            ...         "confidence": 0.80,
+            ...         "execution_time_ms": 567,
+            ...         "cached": True,
+            ...     },
+            ... ]
+            >>> result = merger.merge(enrichments)
+            >>> print(result["data"])
+            {'vendor': 'Slack', 'category': 'SaaS', 'type': 'Software'}
+            >>> print(result["conflicts_resolved"])
+            1
+        """
+        merged_data = {}
+        field_sources = {}  # Track which lookup contributed each field
+        conflicts_resolved = 0
+        enrichment_details = []
+
+        # Process each enrichment
+        for enrichment in enrichments:
+            project_id = enrichment.get("project_id")
+            project_name = enrichment.get("project_name", "Unknown")
+            data = enrichment.get("data", {})
+            confidence = enrichment.get("confidence")
+            execution_time_ms = enrichment.get("execution_time_ms", 0)
+            cached = enrichment.get("cached", False)
+
+            fields_added = []
+
+            # Process each field in the enrichment
+            for field_name, field_value in data.items():
+                field_entry = {
+                    "lookup_id": project_id,
+                    "lookup_name": project_name,
+                    "confidence": confidence,
+                    "value": field_value,
+                }
+
+                if field_name not in field_sources:
+                    # No conflict, add the field
+                    field_sources[field_name] = field_entry
+                    merged_data[field_name] = field_value
+                    fields_added.append(field_name)
+                else:
+                    # Conflict! Resolve it
+                    existing = field_sources[field_name]
+                    winner = self._resolve_conflict(field_name, existing, field_entry)
+
+                    # Check if resolution changed the winner
+                    if winner["lookup_id"] != existing["lookup_id"]:
+                        # New winner, update the merged data
+                        field_sources[field_name] = winner
+                        merged_data[field_name] = winner["value"]
+                        fields_added.append(field_name)
+                        conflicts_resolved += 1
+                    elif winner["lookup_id"] == field_entry["lookup_id"]:
+                        # Current enrichment won but was not originally there
+                        conflicts_resolved += 1
+
+            # Track enrichment details
+            enrichment_details.append(
+                {
+                    "lookup_project_id": str(project_id) if project_id else None,
+                    "lookup_project_name": project_name,
+                    "confidence": confidence,
+                    "cached": cached,
+                    "execution_time_ms": execution_time_ms,
+                    "fields_added": fields_added,
+                }
+            )
+
+        return {
+            "data": merged_data,
+            "conflicts_resolved": conflicts_resolved,
+            "enrichment_details": enrichment_details,
+        }
+
+    def _resolve_conflict(self, field_name: str, existing: dict, new: dict) -> dict:
+        """Resolve conflict for a single field.
+
+        Uses confidence scores to determine which value to keep.
+        When confidence scores are equal or absent, uses first-complete-wins
+        strategy (keeps the existing value).
+
+        Args:
+            field_name: Name of the field with conflict (for context)
+            existing: Dict with {lookup_id, lookup_name, confidence, value}
+            new: Dict with {lookup_id, lookup_name, confidence, value}
+
+        Returns:
+            Winner dict with same structure
+
+        Resolution rules:
+            1. Both have confidence: higher confidence wins
+            2. Equal confidence: first-complete wins (existing)
+            3. One has confidence: confidence one wins
+            4. Neither has confidence: first-complete wins (existing)
+        """
+        existing_confidence = existing.get("confidence")
+        new_confidence = new.get("confidence")
+
+        # Case 1: Both have confidence scores
+        if existing_confidence is not None and new_confidence is not None:
+            if new_confidence > existing_confidence:
+                return new
+            else:
+                # Equal or existing is higher: keep existing (first-complete-wins)
+                return existing
+
+        # Case 2: Only new has confidence
+        elif existing_confidence is None and new_confidence is not None:
+            return new
+
+        # Case 3: Only existing has confidence
+        elif existing_confidence is not None and new_confidence is None:
+            return existing
+
+        # Case 4: Neither has confidence - first-complete-wins
+        else:
+            return existing
diff --git a/backend/lookup/services/indexing_service.py b/backend/lookup/services/indexing_service.py
new file mode 100644
index 0000000000..6dd427f5c5
--- /dev/null
+++ b/backend/lookup/services/indexing_service.py
@@ -0,0 +1,471 @@
+"""Service for indexing reference data using configured profiles.
+
+This service implements the actual indexing workflow by calling external
+extraction and indexing services via the PromptTool SDK, following the
+same pattern as Prompt Studio's indexing implementation.
+"""
+
+import json
+import logging
+import os
+from typing import Any
+
+from django.conf import settings
+from prompt_studio.prompt_studio_core_v2.prompt_ide_base_tool import (
+    PromptIdeBaseTool,
+)
+from utils.file_storage.constants import FileStorageKeys
+from utils.user_context import UserContext
+
+from lookup.models import LookupDataSource, LookupProfileManager
+from unstract.sdk1.constants import LogLevel
+from unstract.sdk1.exceptions import SdkError
+from unstract.sdk1.file_storage.constants import StorageType
+from unstract.sdk1.file_storage.env_helper import EnvHelper
+from unstract.sdk1.prompt import PromptTool
+from unstract.sdk1.utils.indexing import IndexingUtils
+from unstract.sdk1.utils.tool import ToolUtils
+
+from .document_indexing_service import LookupDocumentIndexingService
+from .lookup_index_helper import LookupIndexHelper
+
+logger = logging.getLogger(__name__)
+
+
+class IndexingService:
+    """Service to orchestrate indexing of reference data.
+
+    Uses PromptTool SDK to call external extraction and indexing services,
+    similar to Prompt Studio's implementation but adapted for Lookup projects.
+    """
+
+    def __init__(self, profile: LookupProfileManager):
+        """Initialize indexing service with profile configuration.
+
+        Args:
+            profile: LookupProfileManager instance with adapter configuration
+        """
+        self.profile = profile
+        self.chunk_size = profile.chunk_size
+        self.chunk_overlap = profile.chunk_overlap
+        self.similarity_top_k = profile.similarity_top_k
+
+        # Adapters from profile
+        self.llm = profile.llm
+        self.embedding_model = profile.embedding_model
+        self.vector_store = profile.vector_store
+        self.x2text = profile.x2text
+
+    @staticmethod
+    def extract_text(
+        data_source: LookupDataSource,
+        profile: LookupProfileManager,
+        org_id: str,
+        run_id: str = None,
+    ) -> str:
+        """Extract text from data source using X2Text adapter via external service.
+
+        Args:
+            data_source: LookupDataSource instance to extract
+            profile: LookupProfileManager with X2Text adapter configuration
+            org_id: Organization ID
+            run_id: Optional run ID for tracking
+
+        Returns:
+            Extracted text content
+
+        Raises:
+            SdkError: If extraction service fails
+        """
+        # Generate X2Text config hash for tracking
+        metadata = profile.x2text.metadata or {}
+        x2text_config_hash = ToolUtils.hash_str(json.dumps(metadata, sort_keys=True))
+
+        # Check if already extracted
+        is_extracted = LookupIndexHelper.check_extraction_status(
+            data_source_id=str(data_source.id),
+            profile_manager=profile,
+            x2text_config_hash=x2text_config_hash,
+            enable_highlight=False,  # Lookup doesn't need highlighting
+        )
+
+        # Get file storage instance
+        fs_instance = EnvHelper.get_storage(
+            storage_type=StorageType.PERMANENT,
+            env_name=FileStorageKeys.PERMANENT_REMOTE_STORAGE,
+        )
+
+        logger.info(f"File storage instance type: {type(fs_instance)}")
+        logger.info(
+            f"File storage config: {fs_instance.fs if hasattr(fs_instance, 'fs') else 'N/A'}"
+        )
+
+        # Construct file paths
+        file_path = data_source.file_path
+        logger.info(f"Data source file_path from DB: {file_path}")
+        logger.info(
+            f"Storage type: {StorageType.PERMANENT}, env: {FileStorageKeys.PERMANENT_REMOTE_STORAGE}"
+        )
+
+        directory, filename = os.path.split(file_path)
+        extract_file_path = os.path.join(
+            directory, "extract", os.path.splitext(filename)[0] + ".txt"
+        )
+
+        logger.info(f"Constructed paths - directory: {directory}, filename: {filename}")
+        logger.info(f"Extract file path: {extract_file_path}")
+
+        if is_extracted:
+            try:
+                extracted_text = fs_instance.read(path=extract_file_path, mode="r")
+                logger.info(f"Extracted text found for {filename}, reading from file")
+                return extracted_text
+            except FileNotFoundError as e:
+                logger.warning(
+                    f"File not found for extraction: {extract_file_path}. {e}. "
+                    "Continuing with extraction..."
+                )
+
+        # Call extraction service via PromptTool SDK
+        usage_kwargs = {"run_id": run_id, "file_name": filename}
+        payload = {
+            "x2text_instance_id": str(profile.x2text.id),
+            "file_path": file_path,
+            "enable_highlight": False,
+            "usage_kwargs": usage_kwargs.copy(),
+            "run_id": run_id,
+            "execution_source": "ide",
+            "output_file_path": extract_file_path,
+        }
+
+        logger.info(
+            f"Extraction payload: x2text_id={payload['x2text_instance_id']}, "
+            f"file_path={payload['file_path']}, "
+            f"execution_source={payload['execution_source']}, "
+            f"output_file_path={payload['output_file_path']}"
+        )
+
+        util = PromptIdeBaseTool(log_level=LogLevel.INFO, org_id=org_id)
+
+        try:
+            responder = PromptTool(
+                tool=util,
+                prompt_host=settings.PROMPT_HOST,
+                prompt_port=settings.PROMPT_PORT,
+                request_id=None,
+            )
+            extracted_text = responder.extract(payload=payload)
+
+            # Mark extraction success in IndexManager
+            success = LookupIndexHelper.mark_extraction_status(
+                data_source_id=str(data_source.id),
+                profile_manager=profile,
+                x2text_config_hash=x2text_config_hash,
+                enable_highlight=False,
+            )
+
+            if not success:
+                logger.warning(
+                    f"Failed to mark extraction success for data source {data_source.id}. "
+                    "Extraction completed but status not saved."
+                )
+
+            # Update the data source extraction_status field for UI display
+            data_source.extraction_status = "completed"
+            data_source.save(update_fields=["extraction_status"])
+
+            logger.info(f"Successfully extracted text from {filename}")
+            return extracted_text
+
+        except SdkError as e:
+            msg = str(e)
+            if e.actual_err and hasattr(e.actual_err, "response"):
+                msg = e.actual_err.response.json().get("error", str(e))
+
+            # Mark extraction failure in IndexManager
+            LookupIndexHelper.mark_extraction_status(
+                data_source_id=str(data_source.id),
+                profile_manager=profile,
+                x2text_config_hash=x2text_config_hash,
+                enable_highlight=False,
+                extracted=False,
+                error_message=msg,
+            )
+
+            # Update the data source extraction_status field for UI display
+            data_source.extraction_status = "failed"
+            data_source.extraction_error = msg
+            data_source.save(update_fields=["extraction_status", "extraction_error"])
+
+            raise Exception(f"Failed to extract '{filename}': {msg}") from e
+
+    @staticmethod
+    def index_data_source(
+        data_source: LookupDataSource,
+        profile: LookupProfileManager,
+        org_id: str,
+        user_id: str,
+        extracted_text: str,
+        run_id: str = None,
+        reindex: bool = True,
+    ) -> str:
+        """Index extracted text using profile's adapters via external indexing service.
+
+        Args:
+            data_source: LookupDataSource instance
+            profile: LookupProfileManager with adapter configuration
+            org_id: Organization ID
+            user_id: User ID
+            extracted_text: Pre-extracted text content
+            run_id: Optional run ID for tracking
+            reindex: Whether to reindex if already indexed
+
+        Returns:
+            Document ID from indexing service
+
+        Raises:
+            SdkError: If indexing service fails
+        """
+        # Skip indexing if chunk_size is 0 (full context mode)
+        if profile.chunk_size == 0:
+            # Generate doc_id for tracking
+            fs_instance = EnvHelper.get_storage(
+                storage_type=StorageType.PERMANENT,
+                env_name=FileStorageKeys.PERMANENT_REMOTE_STORAGE,
+            )
+            util = PromptIdeBaseTool(log_level=LogLevel.INFO, org_id=org_id)
+
+            doc_id = IndexingUtils.generate_index_key(
+                vector_db=str(profile.vector_store.id),
+                embedding=str(profile.embedding_model.id),
+                x2text=str(profile.x2text.id),
+                chunk_size=str(profile.chunk_size),
+                chunk_overlap=str(profile.chunk_overlap),
+                file_path=data_source.file_path,
+                file_hash=None,
+                fs=fs_instance,
+                tool=util,
+            )
+
+            # Update index manager without actual indexing
+            LookupIndexHelper.handle_index_manager(
+                data_source_id=str(data_source.id),
+                profile_manager=profile,
+                doc_id=doc_id,
+            )
+
+            logger.info("Skipping vector DB indexing since chunk size is 0")
+            return doc_id
+
+        # Get adapter IDs
+        embedding_model = str(profile.embedding_model.id)
+        vector_db = str(profile.vector_store.id)
+        x2text_adapter = str(profile.x2text.id)
+
+        # Construct file paths
+        directory, filename = os.path.split(data_source.file_path)
+        file_path = os.path.join(
+            directory, "extract", os.path.splitext(filename)[0] + ".txt"
+        )
+
+        # Generate index key
+        fs_instance = EnvHelper.get_storage(
+            storage_type=StorageType.PERMANENT,
+            env_name=FileStorageKeys.PERMANENT_REMOTE_STORAGE,
+        )
+        util = PromptIdeBaseTool(log_level=LogLevel.INFO, org_id=org_id)
+
+        doc_id_key = IndexingUtils.generate_index_key(
+            vector_db=vector_db,
+            embedding=embedding_model,
+            x2text=x2text_adapter,
+            chunk_size=str(profile.chunk_size),
+            chunk_overlap=str(profile.chunk_overlap),
+            file_path=data_source.file_path,
+            file_hash=None,
+            fs=fs_instance,
+            tool=util,
+        )
+
+        try:
+            usage_kwargs = {"run_id": run_id, "file_name": filename}
+
+            # Check if already indexed (unless reindexing)
+            if not reindex:
+                indexed_doc_id = LookupDocumentIndexingService.get_indexed_document_id(
+                    org_id=org_id, user_id=user_id, doc_id_key=doc_id_key
+                )
+                if indexed_doc_id:
+                    logger.info(f"Document {filename} already indexed: {indexed_doc_id}")
+                    return indexed_doc_id
+
+                # Check if currently being indexed
+                if LookupDocumentIndexingService.is_document_indexing(
+                    org_id=org_id, user_id=user_id, doc_id_key=doc_id_key
+                ):
+                    raise Exception(f"Document {filename} is currently being indexed")
+
+            # Mark as being indexed
+            LookupDocumentIndexingService.set_document_indexing(
+                org_id=org_id, user_id=user_id, doc_id_key=doc_id_key
+            )
+
+            logger.info(f"Invoking indexing service for: {doc_id_key}")
+
+            # Build payload for indexing service
+            payload = {
+                "tool_id": str(data_source.project.id),  # Use project ID as tool ID
+                "embedding_instance_id": embedding_model,
+                "vector_db_instance_id": vector_db,
+                "x2text_instance_id": x2text_adapter,
+                "file_path": file_path,
+                "file_hash": None,
+                "chunk_overlap": profile.chunk_overlap,
+                "chunk_size": profile.chunk_size,
+                "reindex": reindex,
+                "enable_highlight": False,
+                "usage_kwargs": usage_kwargs.copy(),
+                "extracted_text": extracted_text,
+                "run_id": run_id,
+                "execution_source": "ide",
+            }
+
+            # Call indexing service via PromptTool SDK
+            try:
+                responder = PromptTool(
+                    tool=util,
+                    prompt_host=settings.PROMPT_HOST,
+                    prompt_port=settings.PROMPT_PORT,
+                    request_id=None,
+                )
+                doc_id = responder.index(payload=payload)
+
+                # Update index manager with doc_id
+                LookupIndexHelper.handle_index_manager(
+                    data_source_id=str(data_source.id),
+                    profile_manager=profile,
+                    doc_id=doc_id,
+                )
+
+                # Mark as indexed in cache
+                LookupDocumentIndexingService.mark_document_indexed(
+                    org_id=org_id, user_id=user_id, doc_id_key=doc_id_key, doc_id=doc_id
+                )
+
+                logger.info(f"Successfully indexed {filename} with doc_id: {doc_id}")
+                return doc_id
+
+            except SdkError as e:
+                msg = str(e)
+                if e.actual_err and hasattr(e.actual_err, "response"):
+                    msg = e.actual_err.response.json().get("error", str(e))
+                raise Exception(f"Failed to index '{filename}': {msg}") from e
+
+        except Exception as e:
+            logger.error(f"Error indexing {filename}: {e}", exc_info=True)
+            # Clear indexing status on error
+            LookupDocumentIndexingService.clear_indexing_status(
+                org_id=org_id, user_id=user_id, doc_id_key=doc_id_key
+            )
+            raise
+
+    @classmethod
+    def index_with_default_profile(
+        cls, project_id: str, org_id: str = None, user_id: str = None
+    ) -> dict[str, Any]:
+        """Index all completed data sources using the project's default profile.
+
+        Args:
+            project_id: UUID of the lookup project
+            org_id: Organization ID (if None, gets from UserContext)
+            user_id: User ID (if None, gets from UserContext)
+
+        Returns:
+            Dict with indexing results summary
+
+        Raises:
+            DefaultProfileError: If no default profile exists for project
+            ValueError: If project not found
+        """
+        from lookup.models import LookupProject
+
+        # Get context if not provided
+        if org_id is None:
+            org_id = UserContext.get_organization_identifier()
+        if user_id is None:
+            user_id = UserContext.get_user_id()
+
+        try:
+            project = LookupProject.objects.get(id=project_id)
+        except LookupProject.DoesNotExist:
+            raise ValueError(f"Project {project_id} not found")
+
+        # Get default profile
+        default_profile = LookupProfileManager.get_default_profile(project)
+
+        # Get all data sources (extraction will be done as part of indexing)
+        data_sources = LookupDataSource.objects.filter(project_id=project_id).order_by(
+            "-version_number"
+        )
+
+        logger.info(f"Found {data_sources.count()} data sources for project {project_id}")
+
+        # Log each data source status
+        for ds in data_sources:
+            logger.info(f"  - {ds.file_name}: extraction_status={ds.extraction_status}")
+
+        results = {
+            "total": data_sources.count(),
+            "success": 0,
+            "failed": 0,
+            "errors": [],
+        }
+
+        for data_source in data_sources:
+            try:
+                logger.info(
+                    f"Indexing data source {data_source.id}: {data_source.file_name}"
+                )
+
+                # Extract text
+                extracted_text = cls.extract_text(
+                    data_source=data_source,
+                    profile=default_profile,
+                    org_id=org_id,
+                    run_id=None,
+                )
+
+                # Index the extracted text
+                doc_id = cls.index_data_source(
+                    data_source=data_source,
+                    profile=default_profile,
+                    org_id=org_id,
+                    user_id=user_id,
+                    extracted_text=extracted_text,
+                    run_id=None,
+                    reindex=True,
+                )
+
+                results["success"] += 1
+                logger.info(
+                    f"Successfully indexed {data_source.file_name} with doc_id: {doc_id}"
+                )
+
+            except Exception as e:
+                results["failed"] += 1
+                error_msg = str(e)
+                results["errors"].append(
+                    {
+                        "data_source_id": str(data_source.id),
+                        "file_name": data_source.file_name,
+                        "error": error_msg,
+                    }
+                )
+                logger.error(f"Failed to index {data_source.file_name}: {error_msg}")
+
+        logger.info(
+            f"Indexing complete for project {project_id}: "
+            f"{results['success']} successful, {results['failed']} failed"
+        )
+
+        return results
diff --git a/backend/lookup/services/llm_cache.py b/backend/lookup/services/llm_cache.py
new file mode 100644
index 0000000000..e7e46bf0bd
--- /dev/null
+++ b/backend/lookup/services/llm_cache.py
@@ -0,0 +1,186 @@
+"""LLM Response Cache implementation for caching LLM API responses.
+
+This module provides an in-memory cache with TTL (Time-To-Live) support
+for storing and retrieving LLM responses based on prompt and reference data.
+"""
+
+import hashlib
+import time
+
+
+class LLMResponseCache:
+    """In-memory cache for LLM responses with TTL expiration.
+
+    This cache is used to store LLM API responses to avoid redundant
+    API calls for identical prompts and reference data combinations.
+    Uses SHA256 hashing for cache key generation and supports TTL-based
+    expiration for automatic cleanup.
+    """
+
+    def __init__(self, ttl_hours: int = 24):
+        """Initialize the LLM response cache.
+
+        Args:
+            ttl_hours: Time-to-live in hours (default 24).
+                      Cached entries expire after this duration.
+        """
+        self.cache: dict[str, tuple[str, float]] = {}
+        self.ttl_seconds = ttl_hours * 3600
+
+    def get(self, key: str) -> str | None:
+        """Get cached response if not expired.
+
+        Performs lazy cleanup by removing expired entries when accessed.
+
+        Args:
+            key: Cache key (generated by generate_cache_key)
+
+        Returns:
+            Cached response string if valid and not expired, None otherwise
+
+        Example:
+            >>> cache = LLMResponseCache(ttl_hours=1)
+            >>> cache.set("key123", "response")
+            >>> cache.get("key123")
+            'response'
+        """
+        if key not in self.cache:
+            return None
+
+        response, expiry = self.cache[key]
+        current_time = time.time()
+
+        if current_time >= expiry:
+            # Entry has expired, remove it (lazy cleanup)
+            del self.cache[key]
+            return None
+
+        return response
+
+    def set(self, key: str, response: str) -> None:
+        """Cache response with TTL.
+
+        Args:
+            key: Cache key (generated by generate_cache_key)
+            response: LLM response to cache
+
+        Example:
+            >>> cache = LLMResponseCache()
+            >>> key = cache.generate_cache_key("prompt", "ref_data")
+            >>> cache.set(key, "LLM response")
+        """
+        expiry = time.time() + self.ttl_seconds
+        self.cache[key] = (response, expiry)
+
+    def invalidate(self, key: str) -> bool:
+        """Remove specific key from cache.
+
+        Args:
+            key: Cache key to invalidate
+
+        Returns:
+            True if key was removed, False if key didn't exist
+
+        Example:
+            >>> cache = LLMResponseCache()
+            >>> cache.set("key123", "response")
+            >>> cache.invalidate("key123")
+            True
+        """
+        if key in self.cache:
+            del self.cache[key]
+            return True
+        return False
+
+    def invalidate_all(self) -> int:
+        """Clear entire cache.
+
+        Returns:
+            Count of invalidated entries
+
+        Example:
+            >>> cache = LLMResponseCache()
+            >>> cache.set("key1", "response1")
+            >>> cache.set("key2", "response2")
+            >>> cache.invalidate_all()
+            2
+        """
+        count = len(self.cache)
+        self.cache.clear()
+        return count
+
+    def generate_cache_key(self, prompt: str, reference_data: str) -> str:
+        r"""Generate SHA256 hash from prompt + reference data.
+
+        Creates a deterministic cache key based on the prompt and
+        reference data combination. Same inputs always produce the
+        same key.
+
+        Args:
+            prompt: The resolved prompt text
+            reference_data: The reference data text
+
+        Returns:
+            64-character hexadecimal SHA256 hash
+
+        Example:
+            >>> cache = LLMResponseCache()
+            >>> key = cache.generate_cache_key("Match vendor", "Slack\nGoogle")
+            >>> len(key)
+            64
+        """
+        combined = f"{prompt}{reference_data}"
+        hash_obj = hashlib.sha256(combined.encode("utf-8"))
+        return hash_obj.hexdigest()
+
+    def get_stats(self) -> dict[str, int]:
+        """Return cache statistics.
+
+        Analyzes the current cache state and returns counts of
+        total, expired, and valid entries.
+
+        Returns:
+            Dictionary with keys: 'total', 'expired', 'valid'
+
+        Example:
+            >>> cache = LLMResponseCache()
+            >>> cache.set("key1", "response1")
+            >>> stats = cache.get_stats()
+            >>> stats["total"]
+            1
+        """
+        current_time = time.time()
+        total = len(self.cache)
+        expired = sum(
+            1 for _, (_, expiry) in self.cache.items() if current_time >= expiry
+        )
+        valid = total - expired
+
+        return {"total": total, "expired": expired, "valid": valid}
+
+    def cleanup_expired(self) -> int:
+        """Remove expired entries.
+
+        Performs a full scan of the cache and removes all entries
+        that have exceeded their TTL. Can be called periodically
+        for cache maintenance.
+
+        Returns:
+            Count of removed entries
+
+        Example:
+            >>> cache = LLMResponseCache(ttl_hours=0)  # Immediate expiry
+            >>> cache.set("key1", "response1")
+            >>> time.sleep(0.1)
+            >>> cache.cleanup_expired()
+            1
+        """
+        current_time = time.time()
+        keys_to_remove = [
+            key for key, (_, expiry) in self.cache.items() if current_time >= expiry
+        ]
+
+        for key in keys_to_remove:
+            del self.cache[key]
+
+        return len(keys_to_remove)
diff --git a/backend/lookup/services/lookup_executor.py b/backend/lookup/services/lookup_executor.py
new file mode 100644
index 0000000000..ebb70a9303
--- /dev/null
+++ b/backend/lookup/services/lookup_executor.py
@@ -0,0 +1,285 @@
+"""Look-Up Executor implementation for single Look-Up execution.
+
+This module provides functionality to execute a single Look-Up project
+against input data, including variable resolution, LLM calling, and
+response caching.
+"""
+
+import json
+import logging
+import time
+from typing import Any, Protocol
+
+from lookup.exceptions import (
+    ExtractionNotCompleteError,
+    ParseError,
+    TemplateNotFoundError,
+)
+from lookup.models import LookupProject
+
+logger = logging.getLogger(__name__)
+
+
+class LLMClient(Protocol):
+    """Protocol for LLM client abstraction."""
+
+    def generate(self, prompt: str, config: dict[str, Any]) -> str:
+        """Generate LLM response for the prompt."""
+        ...
+
+
+class LookUpExecutor:
+    """Executes a single Look-Up project against input data.
+
+    This class handles the complete execution flow of a Look-Up:
+    loading reference data, resolving variables in the prompt template,
+    calling the LLM, caching responses, and parsing the results.
+    """
+
+    def __init__(
+        self,
+        variable_resolver,  # Class, not instance
+        cache_manager,
+        reference_loader,
+        llm_client: LLMClient,
+    ):
+        """Initialize the Look-Up executor.
+
+        Args:
+            variable_resolver: VariableResolver class (not instance)
+            cache_manager: LLMResponseCache instance
+            reference_loader: ReferenceDataLoader instance
+            llm_client: LLM provider client implementing LLMClient protocol
+        """
+        self.variable_resolver_class = variable_resolver
+        self.cache = cache_manager
+        self.ref_loader = reference_loader
+        self.llm_client = llm_client
+
+    def execute(
+        self, lookup_project: LookupProject, input_data: dict[str, Any]
+    ) -> dict[str, Any]:
+        """Execute single Look-Up.
+
+        Performs the complete Look-Up execution including variable resolution,
+        LLM calling with caching, and response parsing.
+
+        Args:
+            lookup_project: The Look-Up project to execute
+            input_data: Input data containing variables to resolve
+
+        Returns:
+            Dictionary containing:
+                - status: 'success' or 'failed'
+                - project_id: UUID of the project
+                - project_name: Name of the project
+                - data: Enrichment data (if success)
+                - confidence: Confidence score 0.0-1.0 (if available)
+                - cached: Whether response was from cache
+                - execution_time_ms: Time taken in milliseconds
+                - error: Error message (if failed)
+
+        Example:
+            >>> executor = LookUpExecutor(...)
+            >>> result = executor.execute(project, {"vendor": "Slack"})
+            >>> if result["status"] == "success":
+            ...     print(result["data"])
+            {'canonical_vendor': 'Slack Technologies', 'confidence': 0.92}
+        """
+        start_time = time.time()
+
+        try:
+            # Step 1: Load reference data
+            try:
+                reference_data_dict = self.ref_loader.load_latest_for_project(
+                    lookup_project.id
+                )
+                reference_data = reference_data_dict["content"]
+            except ExtractionNotCompleteError as e:
+                return self._failed_result(
+                    lookup_project,
+                    f"Reference data extraction not complete: {str(e)}",
+                    start_time,
+                )
+            except Exception as e:
+                return self._failed_result(
+                    lookup_project, f"Failed to load reference data: {str(e)}", start_time
+                )
+
+            # Step 2: Load prompt template
+            try:
+                template = lookup_project.template
+                if not template:
+                    raise TemplateNotFoundError("No template configured")
+                template_text = template.template_text
+            except (AttributeError, TemplateNotFoundError) as e:
+                return self._failed_result(
+                    lookup_project, f"Missing prompt template: {str(e)}", start_time
+                )
+
+            # Step 3: Resolve variables
+            logger.info(f"Input data received: {input_data}")
+            logger.info(f"Reference data length: {len(reference_data)} chars")
+            logger.info(f"Template text: {template_text[:200]}...")
+            resolver = self.variable_resolver_class(input_data, reference_data)
+            resolved_prompt = resolver.resolve(template_text)
+            logger.info(f"Resolved prompt: {resolved_prompt[:500]}...")
+
+            # Step 4: Check cache (if caching is enabled)
+            cache_key = None
+            cached_response = None
+            if self.cache:
+                cache_key = self.cache.generate_cache_key(resolved_prompt, reference_data)
+                cached_response = self.cache.get(cache_key)
+
+                if cached_response:
+                    # Cache hit - parse and return
+                    enrichment_data, confidence = self._parse_llm_response(
+                        cached_response
+                    )
+                    return self._success_result(
+                        lookup_project,
+                        enrichment_data,
+                        confidence,
+                        cached=True,
+                        execution_time_ms=0,  # No execution time for cached response
+                    )
+
+            # Step 5: Call LLM (cache miss or caching disabled)
+            try:
+                llm_start = time.time()
+                llm_response = self.llm_client.generate(
+                    resolved_prompt, lookup_project.llm_config or {}
+                )
+                llm_time_ms = int((time.time() - llm_start) * 1000)
+
+                # Store in cache (if caching is enabled)
+                if self.cache and cache_key:
+                    self.cache.set(cache_key, llm_response)
+
+            except TimeoutError as e:
+                return self._failed_result(
+                    lookup_project, f"LLM request timed out: {str(e)}", start_time
+                )
+            except Exception as e:
+                return self._failed_result(
+                    lookup_project, f"LLM request failed: {str(e)}", start_time
+                )
+
+            # Step 6: Parse response
+            try:
+                enrichment_data, confidence = self._parse_llm_response(llm_response)
+            except ParseError as e:
+                return self._failed_result(
+                    lookup_project, f"Failed to parse LLM response: {str(e)}", start_time
+                )
+
+            # Step 7: Return result
+            return self._success_result(
+                lookup_project,
+                enrichment_data,
+                confidence,
+                cached=False,
+                execution_time_ms=llm_time_ms,
+            )
+
+        except Exception as e:
+            # Catch-all for unexpected errors
+            logger.exception(f"Unexpected error executing Look-Up {lookup_project.id}")
+            return self._failed_result(
+                lookup_project, f"Unexpected error: {str(e)}", start_time
+            )
+
+    def _parse_llm_response(self, response_text: str) -> tuple[dict, float | None]:
+        """Parse LLM response to extract enrichment data.
+
+        Attempts to parse the LLM response as JSON and extract
+        enrichment fields and optional confidence score.
+
+        Args:
+            response_text: Raw text response from the LLM
+
+        Returns:
+            Tuple of (enrichment_data, confidence)
+            - enrichment_data: Dictionary of extracted fields
+            - confidence: Optional confidence score (0.0-1.0)
+
+        Raises:
+            ParseError: If response cannot be parsed as valid JSON
+
+        Example:
+            >>> response = '{"vendor": "Slack", "confidence": 0.92}'
+            >>> data, conf = executor._parse_llm_response(response)
+            >>> print(data)
+            {'vendor': 'Slack'}
+            >>> print(conf)
+            0.92
+        """
+        try:
+            # Try direct JSON parse
+            parsed = json.loads(response_text)
+
+            if not isinstance(parsed, dict):
+                raise ParseError(f"Expected JSON object, got {type(parsed).__name__}")
+
+            # Extract confidence if present
+            confidence = None
+            if "confidence" in parsed:
+                confidence = parsed.pop("confidence")
+
+                # Validate confidence is a number between 0 and 1
+                if isinstance(confidence, (int, float)):
+                    confidence = float(confidence)
+                    if not 0.0 <= confidence <= 1.0:
+                        logger.warning(
+                            f"Confidence {confidence} outside valid range [0.0, 1.0]"
+                        )
+                        confidence = max(0.0, min(1.0, confidence))  # Clamp to range
+                else:
+                    logger.warning(f"Invalid confidence type: {type(confidence)}")
+                    confidence = None
+
+            # Remaining fields are the enrichment data
+            enrichment_data = parsed
+
+            return enrichment_data, confidence
+
+        except json.JSONDecodeError as e:
+            logger.warning(f"Failed to parse LLM response as JSON: {e}")
+            raise ParseError(f"Invalid JSON response: {str(e)}")
+        except Exception as e:
+            logger.warning(f"Unexpected error parsing LLM response: {e}")
+            raise ParseError(f"Parse error: {str(e)}")
+
+    def _success_result(
+        self,
+        project: LookupProject,
+        data: dict[str, Any],
+        confidence: float | None,
+        cached: bool,
+        execution_time_ms: int,
+    ) -> dict[str, Any]:
+        """Build success result dictionary."""
+        return {
+            "status": "success",
+            "project_id": str(project.id),  # Convert UUID to string for JSON
+            "project_name": project.name,
+            "data": data,
+            "confidence": confidence,
+            "cached": cached,
+            "execution_time_ms": execution_time_ms,
+        }
+
+    def _failed_result(
+        self, project: LookupProject, error: str, start_time: float
+    ) -> dict[str, Any]:
+        """Build failed result dictionary."""
+        execution_time_ms = int((time.time() - start_time) * 1000)
+        return {
+            "status": "failed",
+            "project_id": str(project.id),  # Convert UUID to string for JSON
+            "project_name": project.name,
+            "error": error,
+            "execution_time_ms": execution_time_ms,
+            "cached": False,
+        }
diff --git a/backend/lookup/services/lookup_index_helper.py b/backend/lookup/services/lookup_index_helper.py
new file mode 100644
index 0000000000..d22a7d86b3
--- /dev/null
+++ b/backend/lookup/services/lookup_index_helper.py
@@ -0,0 +1,190 @@
+"""Helper service for Lookup IndexManager operations.
+
+Based on Prompt Studio's PromptStudioIndexHelper pattern.
+"""
+
+import logging
+
+from django.db import transaction
+
+from lookup.models import LookupIndexManager
+
+logger = logging.getLogger(__name__)
+
+
+class LookupIndexHelper:
+    """Helper class for LookupIndexManager CRUD operations."""
+
+    @staticmethod
+    @transaction.atomic
+    def handle_index_manager(
+        data_source_id: str,
+        profile_manager,
+        doc_id: str,
+    ) -> LookupIndexManager:
+        """Create or update LookupIndexManager with doc_id.
+
+        Args:
+            data_source_id: UUID of the LookupDataSource
+            profile_manager: LookupProfileManager instance
+            doc_id: Document ID returned from indexing service
+
+        Returns:
+            LookupIndexManager instance
+        """
+        from lookup.models import LookupDataSource
+
+        try:
+            data_source = LookupDataSource.objects.get(pk=data_source_id)
+
+            # Get or create index manager for this data source + profile combination
+            index_manager, created = LookupIndexManager.objects.get_or_create(
+                data_source=data_source,
+                profile_manager=profile_manager,
+                defaults={
+                    "raw_index_id": doc_id,
+                    "index_ids_history": [doc_id],
+                    "status": {"indexed": True, "error": None},
+                },
+            )
+
+            if not created:
+                # Update existing index manager
+                index_manager.raw_index_id = doc_id
+
+                # Add to history if not already present
+                if doc_id not in index_manager.index_ids_history:
+                    index_manager.index_ids_history.append(doc_id)
+
+                # Update status
+                index_manager.status = {"indexed": True, "error": None}
+
+                index_manager.save()
+                logger.debug(f"Updated index manager for data source {data_source_id}")
+            else:
+                logger.debug(f"Created index manager for data source {data_source_id}")
+
+            return index_manager
+
+        except LookupDataSource.DoesNotExist:
+            logger.error(f"Data source {data_source_id} not found")
+            raise
+        except Exception as e:
+            logger.error(f"Error handling index manager: {e}", exc_info=True)
+            raise
+
+    @staticmethod
+    def check_extraction_status(
+        data_source_id: str,
+        profile_manager,
+        x2text_config_hash: str,
+        enable_highlight: bool = False,
+    ) -> bool:
+        """Check if extraction already completed for this configuration.
+
+        Args:
+            data_source_id: UUID of the LookupDataSource
+            profile_manager: LookupProfileManager instance
+            x2text_config_hash: Hash of X2Text adapter configuration
+            enable_highlight: Whether highlighting is enabled
+
+        Returns:
+            True if extraction completed with same settings, False otherwise
+        """
+        try:
+            index_manager = LookupIndexManager.objects.get(
+                data_source_id=data_source_id, profile_manager=profile_manager
+            )
+
+            extraction_status = index_manager.extraction_status.get(
+                x2text_config_hash, {}
+            )
+
+            if not extraction_status.get("extracted", False):
+                return False
+
+            # Check if highlight setting matches
+            stored_highlight = extraction_status.get("enable_highlight", False)
+            if stored_highlight != enable_highlight:
+                logger.debug(
+                    f"Highlight setting mismatch: stored={stored_highlight}, "
+                    f"requested={enable_highlight}"
+                )
+                return False
+
+            logger.debug(f"Extraction already completed for {x2text_config_hash}")
+            return True
+
+        except LookupIndexManager.DoesNotExist:
+            logger.debug(f"No index manager found for data source {data_source_id}")
+            return False
+        except Exception as e:
+            logger.error(f"Error checking extraction status: {e}", exc_info=True)
+            return False
+
+    @staticmethod
+    @transaction.atomic
+    def mark_extraction_status(
+        data_source_id: str,
+        profile_manager,
+        x2text_config_hash: str,
+        enable_highlight: bool = False,
+        extracted: bool = True,
+        error_message: str = None,
+    ) -> bool:
+        """Mark extraction success or failure in IndexManager.
+
+        Args:
+            data_source_id: UUID of the LookupDataSource
+            profile_manager: LookupProfileManager instance
+            x2text_config_hash: Hash of X2Text adapter configuration
+            enable_highlight: Whether highlighting is enabled
+            extracted: Whether extraction succeeded
+            error_message: Error message if extraction failed
+
+        Returns:
+            True if status marked successfully, False otherwise
+        """
+        from lookup.models import LookupDataSource
+
+        try:
+            data_source = LookupDataSource.objects.get(pk=data_source_id)
+
+            # Get or create index manager
+            index_manager, created = LookupIndexManager.objects.get_or_create(
+                data_source=data_source,
+                profile_manager=profile_manager,
+                defaults={"extraction_status": {}, "status": {}},
+            )
+
+            # Update extraction status for this configuration
+            index_manager.extraction_status[x2text_config_hash] = {
+                "extracted": extracted,
+                "enable_highlight": enable_highlight,
+                "error": error_message,
+            }
+
+            # Also update overall status
+            if extracted:
+                index_manager.status["extracted"] = True
+                index_manager.status["error"] = None
+            else:
+                index_manager.status["extracted"] = False
+                index_manager.status["error"] = error_message
+
+            index_manager.save()
+
+            status_text = "success" if extracted else "failure"
+            logger.debug(
+                f"Marked extraction {status_text} for data source {data_source_id}, "
+                f"config {x2text_config_hash}"
+            )
+
+            return True
+
+        except LookupDataSource.DoesNotExist:
+            logger.error(f"Data source {data_source_id} not found")
+            return False
+        except Exception as e:
+            logger.error(f"Error marking extraction status: {e}", exc_info=True)
+            return False
diff --git a/backend/lookup/services/lookup_orchestrator.py b/backend/lookup/services/lookup_orchestrator.py
new file mode 100644
index 0000000000..9ee00942d6
--- /dev/null
+++ b/backend/lookup/services/lookup_orchestrator.py
@@ -0,0 +1,306 @@
+"""Look-Up Orchestrator implementation for parallel execution.
+
+This module provides functionality to execute multiple Look-Up projects
+in parallel and merge their results into a single enriched output.
+"""
+
+import logging
+import time
+import uuid
+from concurrent.futures import ThreadPoolExecutor, TimeoutError, as_completed
+from datetime import UTC, datetime
+from typing import Any
+
+from lookup.models import LookupProject
+from lookup.services.enrichment_merger import EnrichmentMerger
+from lookup.services.lookup_executor import LookUpExecutor
+
+logger = logging.getLogger(__name__)
+
+
+class LookUpOrchestrator:
+    """Orchestrates parallel execution of multiple Look-Up projects.
+
+    This class manages the concurrent execution of multiple Look-Up projects,
+    handles timeouts, collects results, and merges them into a single
+    enriched output using the EnrichmentMerger.
+    """
+
+    def __init__(
+        self,
+        executor: LookUpExecutor,
+        merger: EnrichmentMerger,
+        config: dict[str, Any] = None,
+    ):
+        """Initialize the Look-Up orchestrator.
+
+        Args:
+            executor: LookUpExecutor instance for single Look-Up execution
+            merger: EnrichmentMerger instance for combining results
+            config: Configuration dictionary with optional keys:
+                - max_concurrent_executions: Maximum parallel executions (default 10)
+                - queue_timeout_seconds: Overall queue timeout (default 120)
+                - execution_timeout_seconds: Per-execution timeout (default 30)
+        """
+        self.executor = executor
+        self.merger = merger
+
+        config = config or {}
+        self.max_concurrent = config.get("max_concurrent_executions", 10)
+        self.queue_timeout = config.get("queue_timeout_seconds", 120)
+        self.execution_timeout = config.get("execution_timeout_seconds", 30)
+
+        logger.info(
+            f"Orchestrator initialized with max_concurrent={self.max_concurrent}, "
+            f"queue_timeout={self.queue_timeout}s, "
+            f"execution_timeout={self.execution_timeout}s"
+        )
+
+    def execute_lookups(
+        self, input_data: dict[str, Any], lookup_projects: list[LookupProject]
+    ) -> dict[str, Any]:
+        """Execute all Look-Ups in parallel and merge results.
+
+        Submits all Look-Up projects for parallel execution, collects
+        the results, and merges successful enrichments into a single
+        output. Handles timeouts and failures gracefully.
+
+        Args:
+            input_data: Input data to enrich
+            lookup_projects: List of Look-Up projects to execute
+
+        Returns:
+            Dictionary containing:
+                - lookup_enrichment: Merged enrichment data
+                - _lookup_metadata: Execution metadata including:
+                    - execution_id: Unique ID for this execution
+                    - executed_at: ISO8601 timestamp
+                    - total_execution_time_ms: Total time in milliseconds
+                    - lookups_executed: Number of Look-Ups attempted
+                    - lookups_successful: Number of successful executions
+                    - lookups_failed: Number of failed executions
+                    - conflicts_resolved: Number of field conflicts resolved
+                    - enrichments: List of individual enrichment results
+
+        Example:
+            >>> orchestrator = LookUpOrchestrator(executor, merger)
+            >>> projects = [vendor_lookup, product_lookup]
+            >>> result = orchestrator.execute_lookups({"vendor": "Slack"}, projects)
+            >>> print(result["lookup_enrichment"])
+            {'canonical_vendor': 'Slack', 'product_type': 'SaaS'}
+            >>> print(result["_lookup_metadata"]["lookups_successful"])
+            2
+        """
+        execution_id = str(uuid.uuid4())
+        start_time = time.time()
+        executed_at = datetime.now(UTC).isoformat()
+
+        logger.info(
+            f"Starting orchestrated execution {execution_id} for "
+            f"{len(lookup_projects)} Look-Up projects"
+        )
+
+        if not lookup_projects:
+            # No Look-Ups to execute
+            return self._empty_result(execution_id, executed_at, start_time)
+
+        successful_enrichments = []
+        failed_lookups = []
+        timeout_count = 0
+
+        # Execute Look-Ups in parallel
+        with ThreadPoolExecutor(max_workers=self.max_concurrent) as thread_executor:
+            # Submit all tasks
+            futures = {
+                thread_executor.submit(
+                    self._execute_single, execution_id, input_data, lookup_project
+                ): lookup_project
+                for lookup_project in lookup_projects
+            }
+
+            logger.debug(f"Submitted {len(futures)} Look-Up tasks for parallel execution")
+
+            # Collect results with timeout
+            try:
+                for future in as_completed(futures, timeout=self.queue_timeout):
+                    lookup_project = futures[future]
+                    try:
+                        result = future.result(timeout=self.execution_timeout)
+
+                        if result["status"] == "success":
+                            successful_enrichments.append(result)
+                            logger.debug(
+                                f"Look-Up {lookup_project.name} completed successfully"
+                            )
+                        else:
+                            failed_lookups.append(result)
+                            logger.warning(
+                                f"Look-Up {lookup_project.name} failed: {result.get('error')}"
+                            )
+
+                    except TimeoutError:
+                        # Individual execution timeout
+                        timeout_count += 1
+                        logger.error(
+                            f"Look-Up {lookup_project.name} timed out after "
+                            f"{self.execution_timeout}s"
+                        )
+                        failed_lookups.append(
+                            {
+                                "status": "failed",
+                                "project_id": str(lookup_project.id),
+                                "project_name": lookup_project.name,
+                                "error": f"Execution timeout ({self.execution_timeout}s)",
+                                "execution_time_ms": self.execution_timeout * 1000,
+                                "cached": False,
+                            }
+                        )
+
+                    except Exception as e:
+                        # Unexpected error in future.result()
+                        logger.exception(
+                            f"Unexpected error getting result for {lookup_project.name}"
+                        )
+                        failed_lookups.append(
+                            {
+                                "status": "failed",
+                                "project_id": str(lookup_project.id),
+                                "project_name": lookup_project.name,
+                                "error": f"Execution error: {str(e)}",
+                                "execution_time_ms": 0,
+                                "cached": False,
+                            }
+                        )
+
+            except TimeoutError:
+                # Overall queue timeout
+                logger.error(
+                    f"Queue timeout after {self.queue_timeout}s, "
+                    f"some Look-Ups may not have completed"
+                )
+                # Cancel remaining futures
+                for future in futures:
+                    if not future.done():
+                        future.cancel()
+                        lookup_project = futures[future]
+                        failed_lookups.append(
+                            {
+                                "status": "failed",
+                                "project_id": str(lookup_project.id),
+                                "project_name": lookup_project.name,
+                                "error": f"Queue timeout ({self.queue_timeout}s)",
+                                "execution_time_ms": 0,
+                                "cached": False,
+                            }
+                        )
+
+        # Merge successful enrichments
+        if successful_enrichments:
+            merge_result = self.merger.merge(successful_enrichments)
+            merged_data = merge_result["data"]
+            conflicts_resolved = merge_result["conflicts_resolved"]
+            # enrichment_details = merge_result["enrichment_details"]
+        else:
+            # No successful enrichments
+            merged_data = {}
+            conflicts_resolved = 0
+
+        # Calculate execution time
+        total_execution_time_ms = int((time.time() - start_time) * 1000)
+
+        # Combine all enrichment results (successful and failed)
+        all_enrichments = successful_enrichments + failed_lookups
+
+        logger.info(
+            f"Orchestration {execution_id} completed: "
+            f"{len(successful_enrichments)} successful, "
+            f"{len(failed_lookups)} failed, "
+            f"{timeout_count} timeouts, "
+            f"{conflicts_resolved} conflicts resolved, "
+            f"total time {total_execution_time_ms}ms"
+        )
+
+        return {
+            "lookup_enrichment": merged_data,
+            "_lookup_metadata": {
+                "execution_id": execution_id,
+                "executed_at": executed_at,
+                "total_execution_time_ms": total_execution_time_ms,
+                "lookups_executed": len(lookup_projects),
+                "lookups_successful": len(successful_enrichments),
+                "lookups_failed": len(failed_lookups),
+                "conflicts_resolved": conflicts_resolved,
+                "enrichments": all_enrichments,
+            },
+        }
+
+    def _execute_single(
+        self, execution_id: str, input_data: dict[str, Any], lookup_project: LookupProject
+    ) -> dict[str, Any]:
+        """Execute a single Look-Up project.
+
+        Wrapper around the executor to add execution context and
+        handle any unexpected errors.
+
+        Args:
+            execution_id: ID of the orchestration execution
+            input_data: Input data for enrichment
+            lookup_project: Look-Up project to execute
+
+        Returns:
+            Enrichment result dictionary from the executor
+        """
+        try:
+            logger.debug(
+                f"Executing Look-Up {lookup_project.name} for execution {execution_id}"
+            )
+
+            # Execute the Look-Up
+            result = self.executor.execute(lookup_project, input_data)
+
+            # Add execution context
+            result["execution_id"] = execution_id
+
+            return result
+
+        except Exception as e:
+            # Catch any unexpected errors from the executor
+            logger.exception(f"Unexpected error executing Look-Up {lookup_project.name}")
+            return {
+                "status": "failed",
+                "project_id": str(lookup_project.id),
+                "project_name": lookup_project.name,
+                "error": f"Unexpected error: {str(e)}",
+                "execution_time_ms": 0,
+                "cached": False,
+                "execution_id": execution_id,
+            }
+
+    def _empty_result(
+        self, execution_id: str, executed_at: str, start_time: float
+    ) -> dict[str, Any]:
+        """Build result for empty Look-Up list.
+
+        Args:
+            execution_id: Execution ID
+            executed_at: Execution timestamp
+            start_time: Start time for calculating duration
+
+        Returns:
+            Empty result dictionary with metadata
+        """
+        total_execution_time_ms = int((time.time() - start_time) * 1000)
+
+        return {
+            "lookup_enrichment": {},
+            "_lookup_metadata": {
+                "execution_id": execution_id,
+                "executed_at": executed_at,
+                "total_execution_time_ms": total_execution_time_ms,
+                "lookups_executed": 0,
+                "lookups_successful": 0,
+                "lookups_failed": 0,
+                "conflicts_resolved": 0,
+                "enrichments": [],
+            },
+        }
diff --git a/backend/lookup/services/mock_clients.py b/backend/lookup/services/mock_clients.py
new file mode 100644
index 0000000000..ee0838d153
--- /dev/null
+++ b/backend/lookup/services/mock_clients.py
@@ -0,0 +1,157 @@
+"""Mock implementations of LLM and Storage clients for testing.
+
+These are temporary implementations for testing the API layer
+before integrating with real services in Phase 4.
+"""
+
+import json
+import random
+import time
+from typing import Any
+
+
+class MockLLMClient:
+    """Mock LLM client for testing Look-Up execution.
+
+    Generates synthetic responses for testing purposes.
+    """
+
+    def generate(self, prompt: str, config: dict[str, Any], timeout: int = 30) -> str:
+        """Generate a mock LLM response.
+
+        Returns JSON-formatted enrichment data with random confidence.
+        """
+        # Simulate processing time
+        time.sleep(random.uniform(0.1, 0.5))
+
+        # Extract vendor name from prompt if available
+        vendor = "Unknown"
+        if "vendor" in prompt.lower():
+            # Try to extract vendor name from prompt
+            lines = prompt.split("\n")
+            for line in lines:
+                if "vendor" in line.lower() and ":" in line:
+                    vendor = line.split(":")[-1].strip()
+                    break
+
+        # Generate mock enrichment data
+        confidence = random.uniform(0.6, 0.98)
+        enrichment_data = {
+            "canonical_vendor": self._canonicalize(vendor),
+            "vendor_category": random.choice(
+                ["SaaS", "Infrastructure", "Security", "Analytics"]
+            ),
+            "vendor_type": random.choice(["Software", "Service", "Platform"]),
+            "confidence": round(confidence, 2),
+        }
+
+        return json.dumps(enrichment_data)
+
+    def _canonicalize(self, vendor: str) -> str:
+        """Mock canonicalization of vendor names."""
+        # Simple mock canonicalization
+        mappings = {
+            "Slack Technologies": "Slack",
+            "Microsoft Corp": "Microsoft",
+            "Amazon Web Services": "AWS",
+            "Google Cloud Platform": "GCP",
+            "International Business Machines": "IBM",
+        }
+        return mappings.get(vendor, vendor)
+
+
+class MockStorageClient:
+    """Mock storage client for testing reference data operations.
+
+    Stores data in memory for testing purposes.
+    """
+
+    def __init__(self):
+        """Initialize in-memory storage."""
+        self.storage = {}
+
+    def upload(self, path: str, content: bytes) -> bool:
+        """Upload content to mock storage.
+
+        Args:
+            path: Storage path
+            content: File content
+
+        Returns:
+            True if successful
+        """
+        self.storage[path] = content
+        return True
+
+    def download(self, path: str) -> bytes | None:
+        """Download content from mock storage.
+
+        Args:
+            path: Storage path
+
+        Returns:
+            File content or None if not found
+        """
+        return self.storage.get(path)
+
+    def delete(self, path: str) -> bool:
+        """Delete content from mock storage.
+
+        Args:
+            path: Storage path
+
+        Returns:
+            True if deleted, False if not found
+        """
+        if path in self.storage:
+            del self.storage[path]
+            return True
+        return False
+
+    def exists(self, path: str) -> bool:
+        """Check if path exists in storage.
+
+        Args:
+            path: Storage path
+
+        Returns:
+            True if exists
+        """
+        return path in self.storage
+
+    def list_files(self, prefix: str) -> list:
+        """List files with given prefix.
+
+        Args:
+            prefix: Path prefix
+
+        Returns:
+            List of matching paths
+        """
+        return [path for path in self.storage.keys() if path.startswith(prefix)]
+
+    def get_text_content(self, path: str) -> str | None:
+        """Get text content from storage.
+
+        Args:
+            path: Storage path
+
+        Returns:
+            Text content or None if not found
+        """
+        content = self.download(path)
+        if content:
+            return content.decode("utf-8")
+        return None
+
+    def save_text_content(self, path: str, text: str) -> bool:
+        """Save text content to storage.
+
+        Args:
+            path: Storage path
+            text: Text content
+
+        Returns:
+            True if successful
+        """
+        return self.upload(path, text.encode("utf-8"))
diff --git a/backend/lookup/services/reference_data_loader.py b/backend/lookup/services/reference_data_loader.py
new file mode 100644
index 0000000000..30799b4570
--- /dev/null
+++ b/backend/lookup/services/reference_data_loader.py
@@ -0,0 +1,267 @@
+"""Reference Data Loader implementation for loading and concatenating reference data.
+
+This module provides functionality to load reference data from object storage
+and concatenate multiple sources into a single text for LLM processing.
+"""
+
+from typing import Any, Protocol
+from uuid import UUID
+
+from django.db.models import QuerySet
+
+from lookup.exceptions import ExtractionNotCompleteError
+from lookup.models import LookupDataSource
+
+
+class StorageClient(Protocol):
+    """Protocol for object storage client abstraction.
+
+    Any storage client implementation must provide a get() method
+    that retrieves file content by path.
+    """
+
+    def get(self, path: str) -> str:
+        """Retrieve file content from storage."""
+        ...
+
+
+class ReferenceDataLoader:
+    """Loads and concatenates reference data from object storage.
+
+    This class handles loading reference data files that have been
+    extracted from uploaded documents and stored in object storage.
+    It ensures all files are properly extracted before loading and
+    concatenates multiple sources in the order they were uploaded.
+    """
+
+    def __init__(self, storage_client: StorageClient):
+        """Initialize the reference data loader.
+
+        Args:
+            storage_client: Object storage client (abstraction).
+                          Must implement the StorageClient protocol.
+        """
+        self.storage = storage_client
+
+    def load_latest_for_project(self, project_id: UUID) -> dict[str, Any]:
+        r"""Load latest reference data for a project.
+
+        Retrieves the most recent version of reference data for the specified
+        project. Ensures all data sources have completed extraction before
+        loading and concatenating their content.
+
+        Args:
+            project_id: UUID of the Look-Up project
+
+        Returns:
+            Dictionary containing:
+                - version: Version number of the reference data
+                - content: Concatenated text from all files
+                - files: List of metadata about source files
+                - total_size: Total size in bytes
+
+        Raises:
+            ExtractionNotCompleteError: If any data source extraction is incomplete
+            LookupDataSource.DoesNotExist: If no data sources found
+
+        Example:
+            >>> loader = ReferenceDataLoader(storage)
+            >>> data = loader.load_latest_for_project(project_id)
+            >>> print(data["version"])
+            3
+            >>> print(data["content"][:50])
+            '=== File: vendors.csv ===\n\nSlack\nMicrosoft...'
+        """
+        # Get latest version data sources
+        data_sources = LookupDataSource.objects.filter(
+            project_id=project_id, is_latest=True
+        ).order_by("created_at")
+
+        if not data_sources.exists():
+            raise LookupDataSource.DoesNotExist(
+                f"No data sources found for project {project_id}"
+            )
+
+        # Validate all extractions are complete
+        is_complete, failed_files = self.validate_extraction_complete(data_sources)
+        if not is_complete:
+            raise ExtractionNotCompleteError(failed_files)
+
+        # Get version number from first source (all should have same version)
+        version_number = data_sources.first().version_number
+
+        # Concatenate content from all sources
+        content = self.concatenate_sources(data_sources)
+
+        # Build file metadata
+        files = []
+        total_size = 0
+        for source in data_sources:
+            files.append(
+                {
+                    "id": str(source.id),
+                    "name": source.file_name,
+                    "size": source.file_size,
+                    "type": source.file_type,
+                    "uploaded_at": source.created_at.isoformat(),
+                }
+            )
+            total_size += source.file_size
+
+        return {
+            "version": version_number,
+            "content": content,
+            "files": files,
+            "total_size": total_size,
+        }
+
+    def load_specific_version(self, project_id: UUID, version: int) -> dict[str, Any]:
+        """Load specific version of reference data.
+
+        Retrieves a specific version of reference data for the project,
+        regardless of whether it's the latest version.
+
+        Args:
+            project_id: UUID of the Look-Up project
+            version: Version number to load
+
+        Returns:
+            Dictionary with same structure as load_latest_for_project()
+
+        Raises:
+            ExtractionNotCompleteError: If any data source extraction is incomplete
+            LookupDataSource.DoesNotExist: If version not found
+
+        Example:
+            >>> loader = ReferenceDataLoader(storage)
+            >>> data = loader.load_specific_version(project_id, 2)
+            >>> print(data["version"])
+            2
+        """
+        # Get specific version data sources
+        data_sources = LookupDataSource.objects.filter(
+            project_id=project_id, version_number=version
+        ).order_by("created_at")
+
+        if not data_sources.exists():
+            raise LookupDataSource.DoesNotExist(
+                f"Version {version} not found for project {project_id}"
+            )
+
+        # Validate all extractions are complete
+        is_complete, failed_files = self.validate_extraction_complete(data_sources)
+        if not is_complete:
+            raise ExtractionNotCompleteError(failed_files)
+
+        # Concatenate content from all sources
+        content = self.concatenate_sources(data_sources)
+
+        # Build file metadata
+        files = []
+        total_size = 0
+        for source in data_sources:
+            files.append(
+                {
+                    "id": str(source.id),
+                    "name": source.file_name,
+                    "size": source.file_size,
+                    "type": source.file_type,
+                    "uploaded_at": source.created_at.isoformat(),
+                }
+            )
+            total_size += source.file_size
+
+        return {
+            "version": version,
+            "content": content,
+            "files": files,
+            "total_size": total_size,
+        }
+
+    def concatenate_sources(self, data_sources: QuerySet) -> str:
+        """Concatenate extracted content from multiple sources in upload order.
+
+        Loads the extracted content for each data source from object storage
+        and concatenates them with file headers for clarity.
+
+        Args:
+            data_sources: QuerySet of LookupDataSource objects,
+                         should be ordered by created_at
+
+        Returns:
+            Concatenated string with all file contents separated by headers
+
+        Example:
+            >>> content = loader.concatenate_sources(sources)
+            >>> print(content)
+            === File: vendors.csv ===
+
+            Slack
+            Microsoft
+            Google
+
+            === File: products.txt ===
+
+            Slack Workspace
+            Microsoft Teams
+        """
+        contents = []
+
+        for source in data_sources:
+            # Add file header
+            header = f"=== File: {source.file_name} ==="
+
+            # Load content from storage
+            # First try extracted_content_path, then fall back to original file_path
+            # for text-based files (CSV, TXT, JSON)
+            content_path = source.extracted_content_path
+            if not content_path:
+                # For text files, use the original file path
+                text_file_types = ["csv", "txt", "json"]
+                if source.file_type in text_file_types:
+                    content_path = source.file_path
+
+            if content_path:
+                try:
+                    file_content = self.storage.get(content_path)
+                except Exception as e:
+                    # If storage fails, include error in output
+                    file_content = f"[Error loading file: {str(e)}]"
+            else:
+                file_content = "[No content path available]"
+
+            # Combine header and content
+            contents.append(f"{header}\n\n{file_content}")
+
+        # Join all contents with double newline separator
+        return "\n\n".join(contents)
+
+    def validate_extraction_complete(
+        self, data_sources: QuerySet
+    ) -> tuple[bool, list[str]]:
+        """Check if all sources have completed extraction.
+
+        Verifies that all data sources in the queryset have successfully
+        completed the extraction process.
+
+        Args:
+            data_sources: QuerySet of LookupDataSource objects
+
+        Returns:
+            Tuple of:
+                - all_complete: True if all extractions complete, False otherwise
+                - failed_files: List of filenames that are not complete
+
+        Example:
+            >>> is_complete, failed = loader.validate_extraction_complete(sources)
+            >>> if not is_complete:
+            ...     print(f"Waiting for: {', '.join(failed)}")
+        """
+        failed_files = []
+
+        for source in data_sources:
+            if source.extraction_status != "completed":
+                failed_files.append(source.file_name)
+
+        all_complete = len(failed_files) == 0
+        return all_complete, failed_files
diff --git a/backend/lookup/services/variable_resolver.py b/backend/lookup/services/variable_resolver.py
new file mode 100644
index 0000000000..75861a1f14
--- /dev/null
+++ b/backend/lookup/services/variable_resolver.py
@@ -0,0 +1,147 @@
+"""Variable resolver for template variable replacement."""
+
+import json
+import re
+from typing import Any
+
+
+class VariableResolver:
+    """Resolves {{variable}} placeholders in prompt templates with actual values.
+
+    Supports dot notation for nested field access and handles complex
+    data types (dicts, lists) by converting them to JSON.
+    """
+
+    VARIABLE_PATTERN = r"\{\{([^}]*)\}\}"
+
+    def __init__(self, input_data: dict[str, Any], reference_data: str):
+        """Initialize the variable resolver with context data.
+
+        Args:
+            input_data: Extracted data from Prompt Studio
+            reference_data: Concatenated text from all reference files
+        """
+        self.context = {"input_data": input_data, "reference_data": reference_data}
+
+    def resolve(self, template: str) -> str:
+        r"""Replace all {{variable}} references in template with actual values.
+
+        Args:
+            template: Prompt template with {{variable}} placeholders
+
+        Returns:
+            Resolved prompt with variables replaced
+
+        Example:
+            >>> resolver = VariableResolver(
+            ...     {"vendor": "Slack Inc"}, "Slack\nMicrosoft\nGoogle"
+            ... )
+            >>> template = "Match {{input_data.vendor}} against: {{reference_data}}"
+            >>> resolver.resolve(template)
+            'Match Slack Inc against: Slack\nMicrosoft\nGoogle'
+        """
+
+        def replacer(match):
+            variable_path = match.group(1).strip()
+            return str(self._get_nested_value(variable_path))
+
+        return re.sub(self.VARIABLE_PATTERN, replacer, template)
+
+    def detect_variables(self, template: str) -> list[str]:
+        """Extract all {{variable}} references from template.
+
+        Args:
+            template: Template text to analyze
+
+        Returns:
+            List of unique variable paths found in template
+
+        Example:
+            >>> resolver = VariableResolver({}, "")
+            >>> template = "Match {{input_data.vendor}} from {{reference_data}} and {{input_data.vendor}}"
+            >>> resolver.detect_variables(template)
+            ['input_data.vendor', 'reference_data']
+        """
+        if not template:
+            return []
+
+        matches = re.findall(self.VARIABLE_PATTERN, template)
+        # Strip whitespace and deduplicate
+        unique_vars = list({m.strip() for m in matches})
+        return sorted(unique_vars)
+
+    def _get_nested_value(self, path: str) -> Any:
+        """Get value from context using dot notation path.
+
+        Args:
+            path: Dot-separated path (e.g., "input_data.vendor.name")
+
+        Returns:
+            Value at path, or empty string if not found
+
+        Examples:
+            >>> resolver = VariableResolver({"vendor": {"name": "Slack"}}, "")
+            >>> resolver._get_nested_value("input_data.vendor.name")
+            'Slack'
+            >>> resolver._get_nested_value("input_data.missing")
+            ''
+        """
+        if not path:
+            return ""
+
+        keys = path.split(".")
+        value = self.context
+
+        for key in keys:
+            if isinstance(value, dict):
+                value = value.get(key, "")
+            elif isinstance(value, list):
+                # Try to convert key to integer for list indexing
+                try:
+                    index = int(key)
+                    value = value[index] if 0 <= index < len(value) else ""
+                except (ValueError, IndexError):
+                    return ""
+            else:
+                return ""
+
+        # If value is complex object, return JSON representation
+        if isinstance(value, (dict, list)):
+            return json.dumps(value, indent=2, ensure_ascii=False)
+
+        # Handle None values
+        if value is None:
+            return ""
+
+        return value
+
+    def validate_variables(self, template: str) -> dict[str, bool]:
+        """Validate that all variables in template can be resolved.
+
+        Args:
+            template: Template to validate
+
+        Returns:
+            Dictionary mapping variable paths to their availability status
+        """
+        variables = self.detect_variables(template)
+        validation = {}
+
+        for var in variables:
+            value = self._get_nested_value(var)
+            # Consider empty string as not available (could be missing)
+            validation[var] = value != ""
+
+        return validation
+
+    def get_missing_variables(self, template: str) -> list[str]:
+        """Get list of variables that cannot be resolved.
+
+        Args:
+            template: Template to check
+
+        Returns:
+            List of variable paths that resolve to empty/missing values
+        """
+        validation = self.validate_variables(template)
+        return [var for var, available in validation.items() if not available]
diff --git a/backend/lookup/tests/__init__.py b/backend/lookup/tests/__init__.py
new file mode 100644
index 0000000000..291608f561
--- /dev/null
+++ b/backend/lookup/tests/__init__.py
@@ -0,0 +1 @@
+"""Tests for the Look-Up system."""
diff --git a/backend/lookup/tests/test_api/__init__.py b/backend/lookup/tests/test_api/__init__.py
new file mode 100644
index 0000000000..58150d0e27
--- /dev/null
+++ b/backend/lookup/tests/test_api/__init__.py
@@ -0,0 +1,3 @@
+"""
+API tests for Look-Up functionality.
+"""
diff --git a/backend/lookup/tests/test_api/test_execution_api.py b/backend/lookup/tests/test_api/test_execution_api.py
new file mode 100644
index 0000000000..042c35f057
--- /dev/null
+++ b/backend/lookup/tests/test_api/test_execution_api.py
@@ -0,0 +1,309 @@
+"""
+Tests for Look-Up execution and debug API endpoints.
+"""
+
+import uuid
+from decimal import Decimal
+from unittest.mock import patch, MagicMock
+
+from django.contrib.auth import get_user_model
+from django.test import TestCase
+from django.urls import reverse
+from rest_framework import status
+from rest_framework.test import APIClient
+
+from ...models import (
+    LookupProject,
+    LookupPromptTemplate,
+    PromptStudioLookupLink,
+    LookupExecutionAudit
+)
+
+User = get_user_model()
+
+
+class LookupExecutionAPITest(TestCase):
+    """Test cases for Look-Up execution API."""
+
+    def setUp(self):
+        """Set up test data."""
+        self.client = APIClient()
+        self.user = User.objects.create_user(
+            username='testuser',
+            email='test@example.com',
+            password='testpass123'
+        )
+        self.client.force_authenticate(user=self.user)
+
+        # Create template
+        self.template = LookupPromptTemplate.objects.create(
+            name="Test Template",
+            template_text="Vendor: {{vendor_name}}\n{{reference_data}}",
+            llm_config={"provider": "openai", "model": "gpt-4"},
+            created_by=self.user
+        )
+
+        # Create projects
+        self.lookup1 = LookupProject.objects.create(
+            name="Vendor Lookup",
+            description="Vendor enrichment",
+            reference_data_type="vendor_catalog",
+            template=self.template,
+            created_by=self.user
+        )
+        self.lookup2 = LookupProject.objects.create(
+            name="Product Lookup",
+            description="Product enrichment",
+            reference_data_type="product_catalog",
+            template=self.template,
+            created_by=self.user
+        )
+
+        # Create PS project and links
+        self.ps_project_id = uuid.uuid4()
+        PromptStudioLookupLink.objects.create(
+            prompt_studio_project_id=self.ps_project_id,
+            lookup_project=self.lookup1
+        )
+        PromptStudioLookupLink.objects.create(
+            prompt_studio_project_id=self.ps_project_id,
+            lookup_project=self.lookup2
+        )
+
+    @patch('lookup.views.LookUpOrchestrator')
+    @patch('lookup.views.LookUpExecutor')
+    def test_debug_with_ps_project(self, mock_executor_class, mock_orchestrator_class):
+        """Test debug execution with PS project context."""
+        # Mock the execution
+        mock_orchestrator = MagicMock()
+        mock_orchestrator_class.return_value = mock_orchestrator
+        mock_orchestrator.execute_lookups.return_value = {
+            'lookup_enrichment': {
+                'canonical_vendor': 'Test Vendor',
+                'vendor_category': 'SaaS',
+                'product_type': 'Software'
+            },
+            '_lookup_metadata': {
+                'lookups_executed': 2,
+                'successful_lookups': 2,
+                'failed_lookups': 0,
+                'execution_time_ms': 250,
+                'conflicts_resolved': 0
+            }
+        }
+
+        url = reverse('lookup:lookupdebug-test-with-ps-project')
+        data = {
+            'prompt_studio_project_id': str(self.ps_project_id),
+            'input_data': {
+                'vendor_name': 'Test Vendor Inc',
+                'product_id': 'PROD-123'
+            }
+        }
+
+        response = self.client.post(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertIn('lookup_enrichment', response.data)
+        self.assertIn('canonical_vendor', response.data['lookup_enrichment'])
+        self.assertEqual(response.data['_lookup_metadata']['lookups_executed'], 2)
+
+        # Verify orchestrator was called with correct projects
+        mock_orchestrator.execute_lookups.assert_called_once()
+        call_args = mock_orchestrator.execute_lookups.call_args
+        self.assertEqual(len(call_args.kwargs['lookup_projects']), 2)
+
+    def test_debug_without_ps_project_id(self):
+        """Test debug endpoint requires PS project ID."""
+        url = reverse('lookup:lookupdebug-test-with-ps-project')
+        data = {'input_data': {}}
+
+        response = self.client.post(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_400_BAD_REQUEST)
+        self.assertIn('prompt_studio_project_id is required', response.data['error'])
+
+    def test_debug_with_no_linked_lookups(self):
+        """Test debug with PS project that has no linked Look-Ups."""
+        unlinked_ps_id = uuid.uuid4()
+
+        url = reverse('lookup:lookupdebug-test-with-ps-project')
+        data = {
+            'prompt_studio_project_id': str(unlinked_ps_id),
+            'input_data': {}
+        }
+
+        response = self.client.post(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(response.data['message'], 'No Look-Ups linked to this Prompt Studio project')
+        self.assertEqual(response.data['lookup_enrichment'], {})
+        self.assertEqual(response.data['_lookup_metadata']['lookups_executed'], 0)
+
+    @patch('lookup.views.LookUpOrchestrator')
+    def test_debug_with_execution_error(self, mock_orchestrator_class):
+        """Test debug endpoint handles execution errors gracefully."""
+        mock_orchestrator = MagicMock()
+        mock_orchestrator_class.return_value = mock_orchestrator
+        mock_orchestrator.execute_lookups.side_effect = Exception("Test error")
+
+        url = reverse('lookup:lookupdebug-test-with-ps-project')
+        data = {
+            'prompt_studio_project_id': str(self.ps_project_id),
+            'input_data': {}
+        }
+
+        response = self.client.post(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_500_INTERNAL_SERVER_ERROR)
+        self.assertIn('Test error', response.data['error'])
+
+
+class LookupAuditAPITest(TestCase):
+    """Test cases for execution audit API."""
+
+    def setUp(self):
+        """Set up test data."""
+        self.client = APIClient()
+        self.user = User.objects.create_user(
+            username='testuser',
+            email='test@example.com',
+            password='testpass123'
+        )
+        self.client.force_authenticate(user=self.user)
+
+        # Create template and project
+        self.template = LookupPromptTemplate.objects.create(
+            name="Test Template",
+            template_text="{{reference_data}}",
+            llm_config={"provider": "openai", "model": "gpt-4"},
+            created_by=self.user
+        )
+
+        self.lookup = LookupProject.objects.create(
+            name="Test Lookup",
+            description="Test",
+            reference_data_type="vendor_catalog",
+            template=self.template,
+            created_by=self.user
+        )
+
+        # Create audit records
+        self.execution_id = str(uuid.uuid4())
+
+        self.audit1 = LookupExecutionAudit.objects.create(
+            lookup_project=self.lookup,
+            prompt_studio_project_id=uuid.uuid4(),
+            execution_id=self.execution_id,
+            input_data={'vendor': 'Test1'},
+            enriched_output={'canonical_vendor': 'Test'},
+            reference_data_version=1,
+            llm_provider='openai',
+            llm_model='gpt-4',
+            llm_prompt='Test prompt',
+            llm_response='{"canonical_vendor": "Test"}',
+            llm_response_cached=False,
+            execution_time_ms=150,
+            llm_call_time_ms=100,
+            status='success',
+            confidence_score=Decimal('0.95')
+        )
+
+        self.audit2 = LookupExecutionAudit.objects.create(
+            lookup_project=self.lookup,
+            prompt_studio_project_id=uuid.uuid4(),
+            execution_id=str(uuid.uuid4()),
+            input_data={'vendor': 'Test2'},
+            status='failure',
+            error_message='LLM timeout'
+        )
+
+    def test_list_audit_records(self):
+        """Test listing all audit records."""
+        url = reverse('lookup:executionaudit-list')
+        response = self.client.get(url)
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(len(response.data['results']), 2)
+
+    def test_filter_audits_by_lookup_project(self):
+        """Test filtering audits by Look-Up project."""
+        url = reverse('lookup:executionaudit-list')
+        response = self.client.get(url, {'lookup_project_id': str(self.lookup.id)})
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(len(response.data['results']), 2)
+
+    def test_filter_audits_by_execution_id(self):
+        """Test filtering audits by execution ID."""
+        url = reverse('lookup:executionaudit-list')
+        response = self.client.get(url, {'execution_id': self.execution_id})
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(len(response.data['results']), 1)
+        self.assertEqual(response.data['results'][0]['execution_id'], self.execution_id)
+
+    def test_filter_audits_by_status(self):
+        """Test filtering audits by status."""
+        url = reverse('lookup:executionaudit-list')
+
+        # Get successful executions
+        response = self.client.get(url, {'status': 'success'})
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(len(response.data['results']), 1)
+        self.assertEqual(response.data['results'][0]['status'], 'success')
+
+        # Get failed executions
+        response = self.client.get(url, {'status': 'failure'})
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(len(response.data['results']), 1)
+        self.assertEqual(response.data['results'][0]['status'], 'failure')
+
+    def test_retrieve_audit_record(self):
+        """Test retrieving a specific audit record."""
+        url = reverse('lookup:executionaudit-detail', args=[self.audit1.id])
+        response = self.client.get(url)
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(response.data['execution_id'], self.execution_id)
+        self.assertEqual(response.data['status'], 'success')
+
+    def test_audit_records_are_readonly(self):
+        """Test that audit records cannot be modified."""
+        url = reverse('lookup:executionaudit-detail', args=[self.audit1.id])
+
+        # Try to update
+        response = self.client.patch(url, {'status': 'modified'}, format='json')
+        self.assertEqual(response.status_code, status.HTTP_405_METHOD_NOT_ALLOWED)
+
+        # Try to delete
+        response = self.client.delete(url)
+        self.assertEqual(response.status_code, status.HTTP_405_METHOD_NOT_ALLOWED)
+
+    @patch('lookup.views.AuditLogger')
+    def test_get_statistics(self, mock_logger_class):
+        """Test getting execution statistics."""
+        mock_logger = MagicMock()
+        mock_logger_class.return_value = mock_logger
+        mock_logger.get_project_stats.return_value = {
+            'total_executions': 100,
+            'success_rate': 0.95,
+            'avg_execution_time_ms': 150.5,
+            'cache_hit_rate': 0.30,
+            'avg_confidence_score': 0.92
+        }
+
+        url = reverse('lookup:executionaudit-statistics')
+        response = self.client.get(url, {'lookup_project_id': str(self.lookup.id)})
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(response.data['total_executions'], 100)
+        self.assertEqual(response.data['success_rate'], 0.95)
+
+    def test_statistics_requires_project_id(self):
+        """Test that statistics endpoint requires project ID."""
+        url = reverse('lookup:executionaudit-statistics')
+        response = self.client.get(url)
+
+        self.assertEqual(response.status_code, status.HTTP_400_BAD_REQUEST)
+        self.assertIn('lookup_project_id is required', response.data['error'])
diff --git a/backend/lookup/tests/test_api/test_linking_api.py b/backend/lookup/tests/test_api/test_linking_api.py
new file mode 100644
index 0000000000..69442b8985
--- /dev/null
+++ b/backend/lookup/tests/test_api/test_linking_api.py
@@ -0,0 +1,260 @@
+"""
+Tests for Prompt Studio Look-Up linking API endpoints.
+"""
+
+import uuid
+from django.contrib.auth import get_user_model
+from django.test import TestCase
+from django.urls import reverse
+from rest_framework import status
+from rest_framework.test import APIClient
+
+from ...models import (
+    LookupProject,
+    LookupPromptTemplate,
+    PromptStudioLookupLink
+)
+
+User = get_user_model()
+
+
+class PromptStudioLinkingAPITest(TestCase):
+    """Test cases for PS Look-Up linking API."""
+
+    def setUp(self):
+        """Set up test data."""
+        self.client = APIClient()
+        self.user = User.objects.create_user(
+            username='testuser',
+            email='test@example.com',
+            password='testpass123'
+        )
+        self.client.force_authenticate(user=self.user)
+
+        # Create template
+        self.template = LookupPromptTemplate.objects.create(
+            name="Test Template",
+            template_text="{{reference_data}}",
+            llm_config={"provider": "openai", "model": "gpt-4"},
+            created_by=self.user
+        )
+
+        # Create Look-Up projects
+        self.lookup1 = LookupProject.objects.create(
+            name="Lookup 1",
+            description="First lookup",
+            reference_data_type="vendor_catalog",
+            template=self.template,
+            created_by=self.user
+        )
+        self.lookup2 = LookupProject.objects.create(
+            name="Lookup 2",
+            description="Second lookup",
+            reference_data_type="product_catalog",
+            template=self.template,
+            created_by=self.user
+        )
+
+        # Create PS project ID
+        self.ps_project_id = uuid.uuid4()
+
+    def test_create_link(self):
+        """Test creating a link between PS project and Look-Up."""
+        url = reverse('lookup:lookuplink-list')
+        data = {
+            'prompt_studio_project_id': str(self.ps_project_id),
+            'lookup_project': str(self.lookup1.id)
+        }
+
+        response = self.client.post(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_201_CREATED)
+        self.assertEqual(response.data['lookup_project_name'], 'Lookup 1')
+        self.assertTrue(
+            PromptStudioLookupLink.objects.filter(
+                prompt_studio_project_id=self.ps_project_id,
+                lookup_project=self.lookup1
+            ).exists()
+        )
+
+    def test_create_duplicate_link(self):
+        """Test that duplicate links are rejected."""
+        # Create first link
+        PromptStudioLookupLink.objects.create(
+            prompt_studio_project_id=self.ps_project_id,
+            lookup_project=self.lookup1
+        )
+
+        # Try to create duplicate
+        url = reverse('lookup:lookuplink-list')
+        data = {
+            'prompt_studio_project_id': str(self.ps_project_id),
+            'lookup_project': str(self.lookup1.id)
+        }
+
+        response = self.client.post(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_400_BAD_REQUEST)
+        self.assertIn('already linked', str(response.data))
+
+    def test_list_links(self):
+        """Test listing all links."""
+        # Create links
+        link1 = PromptStudioLookupLink.objects.create(
+            prompt_studio_project_id=self.ps_project_id,
+            lookup_project=self.lookup1
+        )
+        link2 = PromptStudioLookupLink.objects.create(
+            prompt_studio_project_id=self.ps_project_id,
+            lookup_project=self.lookup2
+        )
+
+        url = reverse('lookup:lookuplink-list')
+        response = self.client.get(url)
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(len(response.data['results']), 2)
+
+    def test_filter_links_by_ps_project(self):
+        """Test filtering links by PS project ID."""
+        # Create links for different PS projects
+        ps_project_id_2 = uuid.uuid4()
+
+        PromptStudioLookupLink.objects.create(
+            prompt_studio_project_id=self.ps_project_id,
+            lookup_project=self.lookup1
+        )
+        PromptStudioLookupLink.objects.create(
+            prompt_studio_project_id=ps_project_id_2,
+            lookup_project=self.lookup2
+        )
+
+        url = reverse('lookup:lookuplink-list')
+        response = self.client.get(url, {'prompt_studio_project_id': str(self.ps_project_id)})
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(len(response.data['results']), 1)
+        self.assertEqual(response.data['results'][0]['lookup_project_name'], 'Lookup 1')
+
+    def test_filter_links_by_lookup_project(self):
+        """Test filtering links by Look-Up project ID."""
+        # Create links
+        ps_project_id_2 = uuid.uuid4()
+
+        PromptStudioLookupLink.objects.create(
+            prompt_studio_project_id=self.ps_project_id,
+            lookup_project=self.lookup1
+        )
+        PromptStudioLookupLink.objects.create(
+            prompt_studio_project_id=ps_project_id_2,
+            lookup_project=self.lookup1
+        )
+
+        url = reverse('lookup:lookuplink-list')
+        response = self.client.get(url, {'lookup_project_id': str(self.lookup1.id)})
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(len(response.data['results']), 2)
+
+    def test_delete_link(self):
+        """Test deleting a link."""
+        link = PromptStudioLookupLink.objects.create(
+            prompt_studio_project_id=self.ps_project_id,
+            lookup_project=self.lookup1
+        )
+
+        url = reverse('lookup:lookuplink-detail', args=[link.id])
+        response = self.client.delete(url)
+
+        self.assertEqual(response.status_code, status.HTTP_204_NO_CONTENT)
+        self.assertFalse(
+            PromptStudioLookupLink.objects.filter(id=link.id).exists()
+        )
+
+    def test_bulk_link(self):
+        """Test bulk linking multiple Look-Ups to a PS project."""
+        url = reverse('lookup:lookuplink-bulk-link')
+        data = {
+            'prompt_studio_project_id': str(self.ps_project_id),
+            'lookup_project_ids': [str(self.lookup1.id), str(self.lookup2.id)],
+            'unlink': False
+        }
+
+        response = self.client.post(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(response.data['total_processed'], 2)
+        self.assertTrue(response.data['results'][0]['linked'])
+        self.assertTrue(response.data['results'][1]['linked'])
+
+        # Verify links were created
+        self.assertEqual(
+            PromptStudioLookupLink.objects.filter(
+                prompt_studio_project_id=self.ps_project_id
+            ).count(),
+            2
+        )
+
+    def test_bulk_unlink(self):
+        """Test bulk unlinking Look-Ups from a PS project."""
+        # Create links first
+        PromptStudioLookupLink.objects.create(
+            prompt_studio_project_id=self.ps_project_id,
+            lookup_project=self.lookup1
+        )
+        PromptStudioLookupLink.objects.create(
+            prompt_studio_project_id=self.ps_project_id,
+            lookup_project=self.lookup2
+        )
+
+        url = reverse('lookup:lookuplink-bulk-link')
+        data = {
+            'prompt_studio_project_id': str(self.ps_project_id),
+            'lookup_project_ids': [str(self.lookup1.id), str(self.lookup2.id)],
+            'unlink': True
+        }
+
+        response = self.client.post(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(response.data['total_processed'], 2)
+        self.assertTrue(response.data['results'][0]['unlinked'])
+        self.assertTrue(response.data['results'][1]['unlinked'])
+
+        # Verify links were removed
+        self.assertEqual(
+            PromptStudioLookupLink.objects.filter(
+                prompt_studio_project_id=self.ps_project_id
+            ).count(),
+            0
+        )
+
+    def test_bulk_link_idempotent(self):
+        """Test that bulk link is idempotent."""
+        # Create one link first
+        PromptStudioLookupLink.objects.create(
+            prompt_studio_project_id=self.ps_project_id,
+            lookup_project=self.lookup1
+        )
+
+        url = reverse('lookup:lookuplink-bulk-link')
+        data = {
+            'prompt_studio_project_id': str(self.ps_project_id),
+            'lookup_project_ids': [str(self.lookup1.id), str(self.lookup2.id)],
+            'unlink': False
+        }
+
+        response = self.client.post(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(response.data['total_processed'], 2)
+        self.assertFalse(response.data['results'][0]['linked'])  # Already existed
+        self.assertTrue(response.data['results'][1]['linked'])  # Newly created
+
+        # Still only 2 links total
+        self.assertEqual(
+            PromptStudioLookupLink.objects.filter(
+                prompt_studio_project_id=self.ps_project_id
+            ).count(),
+            2
+        )
diff --git a/backend/lookup/tests/test_api/test_profile_manager_api.py b/backend/lookup/tests/test_api/test_profile_manager_api.py
new file mode 100644
index 0000000000..4884bb53f7
--- /dev/null
+++ b/backend/lookup/tests/test_api/test_profile_manager_api.py
@@ -0,0 +1,397 @@
+"""
+Tests for LookupProfileManager API endpoints.
+"""
+
+import uuid
+from unittest.mock import patch, MagicMock
+
+from django.contrib.auth import get_user_model
+from django.test import TestCase
+from django.urls import reverse
+from rest_framework import status
+from rest_framework.test import APIClient
+
+from ...models import LookupProject, LookupProfileManager
+
+User = get_user_model()
+
+
+class LookupProfileManagerAPITest(TestCase):
+    """Test cases for LookupProfileManager API."""
+
+    def setUp(self):
+        """Set up test data."""
+        self.client = APIClient()
+        self.user = User.objects.create_user(
+            username='testuser',
+            email='test@example.com',
+            password='testpass123'
+        )
+        self.client.force_authenticate(user=self.user)
+
+        # Create lookup project
+        self.project = LookupProject.objects.create(
+            name="Test Lookup Project",
+            description="Test Description",
+            reference_data_type="vendor_catalog",
+            created_by=self.user
+        )
+
+        # Mock adapter instances (UUIDs)
+        self.mock_llm_id = str(uuid.uuid4())
+        self.mock_embedding_id = str(uuid.uuid4())
+        self.mock_vector_db_id = str(uuid.uuid4())
+        self.mock_x2text_id = str(uuid.uuid4())
+
+    @patch('adapter_processor_v2.models.AdapterInstance.objects.get')
+    def test_create_profile(self, mock_get_adapter):
+        """Test creating a new profile."""
+        # Mock adapter instances
+        mock_adapter = MagicMock()
+        mock_adapter.id = uuid.uuid4()
+        mock_get_adapter.return_value = mock_adapter
+
+        url = reverse('lookup:lookupprofile-list')
+        data = {
+            'profile_name': 'Default Profile',
+            'lookup_project': str(self.project.id),
+            'llm': self.mock_llm_id,
+            'embedding_model': self.mock_embedding_id,
+            'vector_store': self.mock_vector_db_id,
+            'x2text': self.mock_x2text_id,
+            'chunk_size': 1000,
+            'chunk_overlap': 200,
+            'similarity_top_k': 5,
+            'is_default': True
+        }
+
+        response = self.client.post(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_201_CREATED)
+        self.assertEqual(response.data['profile_name'], 'Default Profile')
+        self.assertTrue(response.data['is_default'])
+        self.assertEqual(LookupProfileManager.objects.count(), 1)
+
+    @patch('adapter_processor_v2.models.AdapterInstance.objects.get')
+    def test_duplicate_profile_name(self, mock_get_adapter):
+        """Test that duplicate profile names for same project are rejected."""
+        # Mock adapter instances
+        mock_adapter = MagicMock()
+        mock_adapter.id = uuid.uuid4()
+        mock_get_adapter.return_value = mock_adapter
+
+        # Create first profile
+        LookupProfileManager.objects.create(
+            profile_name='Test Profile',
+            lookup_project=self.project,
+            llm_id=self.mock_llm_id,
+            embedding_model_id=self.mock_embedding_id,
+            vector_store_id=self.mock_vector_db_id,
+            x2text_id=self.mock_x2text_id,
+            created_by=self.user
+        )
+
+        # Try to create duplicate
+        url = reverse('lookup:lookupprofile-list')
+        data = {
+            'profile_name': 'Test Profile',  # Same name
+            'lookup_project': str(self.project.id),  # Same project
+            'llm': self.mock_llm_id,
+            'embedding_model': self.mock_embedding_id,
+            'vector_store': self.mock_vector_db_id,
+            'x2text': self.mock_x2text_id,
+        }
+
+        response = self.client.post(url, data, format='json')
+
+        # Should fail due to unique constraint
+        self.assertEqual(response.status_code, status.HTTP_400_BAD_REQUEST)
+
+    @patch('adapter_processor_v2.models.AdapterInstance.objects.get')
+    @patch('adapter_processor_v2.adapter_processor.AdapterProcessor.get_adapter_instance_by_id')
+    def test_list_profiles(self, mock_get_by_id, mock_get_adapter):
+        """Test listing all profiles."""
+        # Mock adapters
+        mock_adapter = MagicMock()
+        mock_adapter.id = uuid.uuid4()
+        mock_get_adapter.return_value = mock_adapter
+
+        mock_adapter_detail = {
+            'id': str(uuid.uuid4()),
+            'adapter_name': 'Test Adapter',
+            'adapter_type': 'LLM'
+        }
+        mock_get_by_id.return_value = mock_adapter_detail
+
+        # Create test profiles
+        LookupProfileManager.objects.create(
+            profile_name='Profile 1',
+            lookup_project=self.project,
+            llm_id=self.mock_llm_id,
+            embedding_model_id=self.mock_embedding_id,
+            vector_store_id=self.mock_vector_db_id,
+            x2text_id=self.mock_x2text_id,
+            created_by=self.user
+        )
+
+        LookupProfileManager.objects.create(
+            profile_name='Profile 2',
+            lookup_project=self.project,
+            llm_id=self.mock_llm_id,
+            embedding_model_id=self.mock_embedding_id,
+            vector_store_id=self.mock_vector_db_id,
+            x2text_id=self.mock_x2text_id,
+            created_by=self.user
+        )
+
+        url = reverse('lookup:lookupprofile-list')
+        response = self.client.get(url)
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(len(response.data['results']), 2)
+
+    @patch('adapter_processor_v2.models.AdapterInstance.objects.get')
+    @patch('adapter_processor_v2.adapter_processor.AdapterProcessor.get_adapter_instance_by_id')
+    def test_filter_by_project(self, mock_get_by_id, mock_get_adapter):
+        """Test filtering profiles by project."""
+        # Mock adapters
+        mock_adapter = MagicMock()
+        mock_adapter.id = uuid.uuid4()
+        mock_get_adapter.return_value = mock_adapter
+
+        mock_adapter_detail = {
+            'id': str(uuid.uuid4()),
+            'adapter_name': 'Test Adapter',
+            'adapter_type': 'LLM'
+        }
+        mock_get_by_id.return_value = mock_adapter_detail
+
+        # Create another project
+        project2 = LookupProject.objects.create(
+            name="Project 2",
+            description="Description 2",
+            reference_data_type="product_catalog",
+            created_by=self.user
+        )
+
+        # Create profiles for different projects
+        LookupProfileManager.objects.create(
+            profile_name='Profile 1',
+            lookup_project=self.project,
+            llm_id=self.mock_llm_id,
+            embedding_model_id=self.mock_embedding_id,
+            vector_store_id=self.mock_vector_db_id,
+            x2text_id=self.mock_x2text_id,
+            created_by=self.user
+        )
+
+        LookupProfileManager.objects.create(
+            profile_name='Profile 2',
+            lookup_project=project2,
+            llm_id=self.mock_llm_id,
+            embedding_model_id=self.mock_embedding_id,
+            vector_store_id=self.mock_vector_db_id,
+            x2text_id=self.mock_x2text_id,
+            created_by=self.user
+        )
+
+        # Filter by project 1
+        url = reverse('lookup:lookupprofile-list')
+        response = self.client.get(url, {'lookup_project': str(self.project.id)})
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(len(response.data['results']), 1)
+        self.assertEqual(response.data['results'][0]['profile_name'], 'Profile 1')
+
+    @patch('adapter_processor_v2.models.AdapterInstance.objects.get')
+    @patch('adapter_processor_v2.adapter_processor.AdapterProcessor.get_adapter_instance_by_id')
+    def test_get_default_profile(self, mock_get_by_id, mock_get_adapter):
+        """Test getting the default profile for a project."""
+        # Mock adapters
+        mock_adapter = MagicMock()
+        mock_adapter.id = uuid.uuid4()
+        mock_get_adapter.return_value = mock_adapter
+
+        mock_adapter_detail = {
+            'id': str(uuid.uuid4()),
+            'adapter_name': 'Test Adapter',
+            'adapter_type': 'LLM'
+        }
+        mock_get_by_id.return_value = mock_adapter_detail
+
+        # Create profiles
+        profile1 = LookupProfileManager.objects.create(
+            profile_name='Non-Default',
+            lookup_project=self.project,
+            llm_id=self.mock_llm_id,
+            embedding_model_id=self.mock_embedding_id,
+            vector_store_id=self.mock_vector_db_id,
+            x2text_id=self.mock_x2text_id,
+            is_default=False,
+            created_by=self.user
+        )
+
+        profile2 = LookupProfileManager.objects.create(
+            profile_name='Default Profile',
+            lookup_project=self.project,
+            llm_id=self.mock_llm_id,
+            embedding_model_id=self.mock_embedding_id,
+            vector_store_id=self.mock_vector_db_id,
+            x2text_id=self.mock_x2text_id,
+            is_default=True,
+            created_by=self.user
+        )
+
+        # Get default profile
+        url = reverse('lookup:lookupprofile-default')
+        response = self.client.get(url, {'lookup_project': str(self.project.id)})
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(response.data['profile_name'], 'Default Profile')
+        self.assertTrue(response.data['is_default'])
+
+    @patch('adapter_processor_v2.models.AdapterInstance.objects.get')
+    @patch('adapter_processor_v2.adapter_processor.AdapterProcessor.get_adapter_instance_by_id')
+    def test_set_default_profile(self, mock_get_by_id, mock_get_adapter):
+        """Test setting a profile as default."""
+        # Mock adapters
+        mock_adapter = MagicMock()
+        mock_adapter.id = uuid.uuid4()
+        mock_get_adapter.return_value = mock_adapter
+
+        mock_adapter_detail = {
+            'id': str(uuid.uuid4()),
+            'adapter_name': 'Test Adapter',
+            'adapter_type': 'LLM'
+        }
+        mock_get_by_id.return_value = mock_adapter_detail
+
+        # Create two profiles
+        profile1 = LookupProfileManager.objects.create(
+            profile_name='Profile 1',
+            lookup_project=self.project,
+            llm_id=self.mock_llm_id,
+            embedding_model_id=self.mock_embedding_id,
+            vector_store_id=self.mock_vector_db_id,
+            x2text_id=self.mock_x2text_id,
+            is_default=True,
+            created_by=self.user
+        )
+
+        profile2 = LookupProfileManager.objects.create(
+            profile_name='Profile 2',
+            lookup_project=self.project,
+            llm_id=self.mock_llm_id,
+            embedding_model_id=self.mock_embedding_id,
+            vector_store_id=self.mock_vector_db_id,
+            x2text_id=self.mock_x2text_id,
+            is_default=False,
+            created_by=self.user
+        )
+
+        # Set profile2 as default
+        url = reverse('lookup:lookupprofile-set-default', args=[profile2.profile_id])
+        response = self.client.post(url)
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertTrue(response.data['is_default'])
+
+        # Verify profile1 is no longer default
+        profile1.refresh_from_db()
+        self.assertFalse(profile1.is_default)
+
+    @patch('adapter_processor_v2.models.AdapterInstance.objects.get')
+    @patch('adapter_processor_v2.adapter_processor.AdapterProcessor.get_adapter_instance_by_id')
+    def test_update_profile(self, mock_get_by_id, mock_get_adapter):
+        """Test updating a profile."""
+        # Mock adapters
+        mock_adapter = MagicMock()
+        mock_adapter.id = uuid.uuid4()
+        mock_get_adapter.return_value = mock_adapter
+
+        mock_adapter_detail = {
+            'id': str(uuid.uuid4()),
+            'adapter_name': 'Test Adapter',
+            'adapter_type': 'LLM'
+        }
+        mock_get_by_id.return_value = mock_adapter_detail
+
+        # Create profile
+        profile = LookupProfileManager.objects.create(
+            profile_name='Original Name',
+            lookup_project=self.project,
+            llm_id=self.mock_llm_id,
+            embedding_model_id=self.mock_embedding_id,
+            vector_store_id=self.mock_vector_db_id,
+            x2text_id=self.mock_x2text_id,
+            chunk_size=1000,
+            created_by=self.user
+        )
+
+        # Update profile
+        url = reverse('lookup:lookupprofile-detail', args=[profile.profile_id])
+        data = {
+            'chunk_size': 2000,
+            'chunk_overlap': 300,
+            'similarity_top_k': 10
+        }
+
+        response = self.client.patch(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(response.data['chunk_size'], 2000)
+        self.assertEqual(response.data['chunk_overlap'], 300)
+        self.assertEqual(response.data['similarity_top_k'], 10)
+
+    @patch('adapter_processor_v2.models.AdapterInstance.objects.get')
+    def test_delete_profile(self, mock_get_adapter):
+        """Test deleting a profile."""
+        # Mock adapter instances
+        mock_adapter = MagicMock()
+        mock_adapter.id = uuid.uuid4()
+        mock_get_adapter.return_value = mock_adapter
+
+        # Create profile
+        profile = LookupProfileManager.objects.create(
+            profile_name='To Delete',
+            lookup_project=self.project,
+            llm_id=self.mock_llm_id,
+            embedding_model_id=self.mock_embedding_id,
+            vector_store_id=self.mock_vector_db_id,
+            x2text_id=self.mock_x2text_id,
+            created_by=self.user
+        )
+
+        url = reverse('lookup:lookupprofile-detail', args=[profile.profile_id])
+        response = self.client.delete(url)
+
+        self.assertEqual(response.status_code, status.HTTP_204_NO_CONTENT)
+        self.assertEqual(LookupProfileManager.objects.count(), 0)
+
+    def test_get_default_profile_no_default_exists(self):
+        """Test getting default profile when none exists."""
+        url = reverse('lookup:lookupprofile-default')
+        response = self.client.get(url, {'lookup_project': str(self.project.id)})
+
+        # Should return 404 when no default profile exists
+        self.assertEqual(response.status_code, status.HTTP_404_NOT_FOUND)
+
+    def test_required_adapters(self):
+        """Test that all 4 adapters are required."""
+        url = reverse('lookup:lookupprofile-list')
+
+        # Missing x2text adapter
+        data = {
+            'profile_name': 'Incomplete Profile',
+            'lookup_project': str(self.project.id),
+            'llm': self.mock_llm_id,
+            'embedding_model': self.mock_embedding_id,
+            'vector_store': self.mock_vector_db_id,
+            # Missing x2text
+        }
+
+        response = self.client.post(url, data, format='json')
+
+        # Should fail validation
+        self.assertEqual(response.status_code, status.HTTP_400_BAD_REQUEST)
+        self.assertIn('x2text', str(response.data))
diff --git a/backend/lookup/tests/test_api/test_project_api.py b/backend/lookup/tests/test_api/test_project_api.py
new file mode 100644
index 0000000000..f384d23f92
--- /dev/null
+++ b/backend/lookup/tests/test_api/test_project_api.py
@@ -0,0 +1,215 @@
+"""
+Tests for Look-Up Project API endpoints.
+"""
+
+import json
+from unittest.mock import patch, MagicMock
+
+from django.contrib.auth import get_user_model
+from django.test import TestCase
+from django.urls import reverse
+from rest_framework import status
+from rest_framework.test import APIClient
+
+from ...models import LookupProject, LookupPromptTemplate, LookupDataSource
+
+User = get_user_model()
+
+
+class LookupProjectAPITest(TestCase):
+    """Test cases for Look-Up Project API."""
+
+    def setUp(self):
+        """Set up test data."""
+        self.client = APIClient()
+        self.user = User.objects.create_user(
+            username='testuser',
+            email='test@example.com',
+            password='testpass123'
+        )
+        self.client.force_authenticate(user=self.user)
+
+        # Create template
+        self.template = LookupPromptTemplate.objects.create(
+            name="Test Template",
+            template_text="Vendor: {{vendor_name}}\nReference: {{reference_data}}",
+            llm_config={"provider": "openai", "model": "gpt-4"},
+            created_by=self.user
+        )
+
+        # Create project
+        self.project = LookupProject.objects.create(
+            name="Test Project",
+            description="Test Description",
+            reference_data_type="vendor_catalog",
+            template=self.template,
+            created_by=self.user
+        )
+
+    def test_list_projects(self):
+        """Test listing all projects."""
+        url = reverse('lookup:lookupproject-list')
+        response = self.client.get(url)
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(len(response.data['results']), 1)
+        self.assertEqual(response.data['results'][0]['name'], 'Test Project')
+
+    def test_create_project(self):
+        """Test creating a new project."""
+        url = reverse('lookup:lookupproject-list')
+        data = {
+            'name': 'New Project',
+            'description': 'New Description',
+            'reference_data_type': 'product_catalog',
+            'template_id': str(self.template.id),
+            'is_active': True
+        }
+
+        response = self.client.post(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_201_CREATED)
+        self.assertEqual(response.data['name'], 'New Project')
+        self.assertEqual(LookupProject.objects.count(), 2)
+
+    def test_retrieve_project(self):
+        """Test retrieving a specific project."""
+        url = reverse('lookup:lookupproject-detail', args=[self.project.id])
+        response = self.client.get(url)
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(response.data['name'], 'Test Project')
+        self.assertIn('template', response.data)
+
+    def test_update_project(self):
+        """Test updating a project."""
+        url = reverse('lookup:lookupproject-detail', args=[self.project.id])
+        data = {
+            'name': 'Updated Project',
+            'description': 'Updated Description',
+            'reference_data_type': self.project.reference_data_type,
+            'is_active': False
+        }
+
+        response = self.client.patch(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(response.data['name'], 'Updated Project')
+        self.assertFalse(response.data['is_active'])
+
+    def test_delete_project(self):
+        """Test deleting a project."""
+        url = reverse('lookup:lookupproject-detail', args=[self.project.id])
+        response = self.client.delete(url)
+
+        self.assertEqual(response.status_code, status.HTTP_204_NO_CONTENT)
+        self.assertEqual(LookupProject.objects.count(), 0)
+
+    @patch('lookup.views.LookUpOrchestrator')
+    def test_execute_project(self, mock_orchestrator_class):
+        """Test executing a Look-Up project."""
+        # Mock the orchestrator
+        mock_orchestrator = MagicMock()
+        mock_orchestrator_class.return_value = mock_orchestrator
+        mock_orchestrator.execute_lookups.return_value = {
+            'lookup_enrichment': {
+                'canonical_vendor': 'Test Vendor',
+                'vendor_category': 'SaaS'
+            },
+            '_lookup_metadata': {
+                'lookups_executed': 1,
+                'successful_lookups': 1,
+                'execution_time_ms': 150
+            }
+        }
+
+        url = reverse('lookup:lookupproject-execute', args=[self.project.id])
+        data = {
+            'input_data': {'vendor_name': 'Test Vendor Inc'},
+            'use_cache': True,
+            'timeout_seconds': 30
+        }
+
+        response = self.client.post(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertIn('lookup_enrichment', response.data)
+        self.assertIn('_lookup_metadata', response.data)
+
+    def test_execute_project_without_auth(self):
+        """Test that unauthenticated requests are rejected."""
+        self.client.force_authenticate(user=None)
+        url = reverse('lookup:lookupproject-execute', args=[self.project.id])
+        data = {'input_data': {}}
+
+        response = self.client.post(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_401_UNAUTHORIZED)
+
+    def test_filter_projects_by_active_status(self):
+        """Test filtering projects by active status."""
+        # Create inactive project
+        LookupProject.objects.create(
+            name="Inactive Project",
+            description="Inactive",
+            reference_data_type="vendor_catalog",
+            is_active=False,
+            created_by=self.user
+        )
+
+        url = reverse('lookup:lookupproject-list')
+        response = self.client.get(url, {'is_active': 'true'})
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(len(response.data['results']), 1)
+        self.assertEqual(response.data['results'][0]['name'], 'Test Project')
+
+    def test_upload_reference_data(self):
+        """Test uploading reference data."""
+        url = reverse('lookup:lookupproject-upload-reference-data', args=[self.project.id])
+
+        # Create a mock file
+        from django.core.files.uploadedfile import SimpleUploadedFile
+        file_content = b"vendor1,category1\nvendor2,category2"
+        file = SimpleUploadedFile("vendors.csv", file_content, content_type="text/csv")
+
+        data = {
+            'file': file,
+            'extract_text': True,
+            'metadata': json.dumps({'source': 'manual_upload'})
+        }
+
+        response = self.client.post(url, data, format='multipart')
+
+        self.assertEqual(response.status_code, status.HTTP_201_CREATED)
+        self.assertIn('source_file_path', response.data)
+        self.assertEqual(response.data['extraction_status'], 'pending')
+
+    def test_list_data_sources(self):
+        """Test listing data sources for a project."""
+        # Create data sources
+        LookupDataSource.objects.create(
+            project=self.project,
+            source_file_path="test/file1.csv",
+            extraction_status='complete',
+            version=1,
+            is_latest=False
+        )
+        LookupDataSource.objects.create(
+            project=self.project,
+            source_file_path="test/file2.csv",
+            extraction_status='complete',
+            version=2,
+            is_latest=True
+        )
+
+        url = reverse('lookup:lookupproject-data-sources', args=[self.project.id])
+        response = self.client.get(url)
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(len(response.data), 2)
+
+        # Test filtering by is_latest
+        response = self.client.get(url, {'is_latest': 'true'})
+        self.assertEqual(len(response.data), 1)
+        self.assertEqual(response.data[0]['version'], 2)
diff --git a/backend/lookup/tests/test_api/test_template_api.py b/backend/lookup/tests/test_api/test_template_api.py
new file mode 100644
index 0000000000..0883049ffa
--- /dev/null
+++ b/backend/lookup/tests/test_api/test_template_api.py
@@ -0,0 +1,175 @@
+"""
+Tests for Look-Up Template API endpoints.
+"""
+
+from unittest.mock import patch, MagicMock
+
+from django.contrib.auth import get_user_model
+from django.test import TestCase
+from django.urls import reverse
+from rest_framework import status
+from rest_framework.test import APIClient
+
+from ...models import LookupPromptTemplate
+
+User = get_user_model()
+
+
+class LookupTemplateAPITest(TestCase):
+    """Test cases for Look-Up Template API."""
+
+    def setUp(self):
+        """Set up test data."""
+        self.client = APIClient()
+        self.user = User.objects.create_user(
+            username='testuser',
+            email='test@example.com',
+            password='testpass123'
+        )
+        self.client.force_authenticate(user=self.user)
+
+        # Create template
+        self.template = LookupPromptTemplate.objects.create(
+            name="Test Template",
+            template_text="Vendor: {{vendor_name}}\nReference: {{reference_data}}",
+            llm_config={"provider": "openai", "model": "gpt-4"},
+            created_by=self.user
+        )
+
+    def test_list_templates(self):
+        """Test listing all templates."""
+        url = reverse('lookup:lookuptemplate-list')
+        response = self.client.get(url)
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(len(response.data['results']), 1)
+        self.assertEqual(response.data['results'][0]['name'], 'Test Template')
+
+    def test_create_template(self):
+        """Test creating a new template."""
+        url = reverse('lookup:lookuptemplate-list')
+        data = {
+            'name': 'New Template',
+            'template_text': 'Product: {{product_name}}\n{{reference_data}}',
+            'llm_config': {'provider': 'anthropic', 'model': 'claude-2'},
+            'is_active': True
+        }
+
+        response = self.client.post(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_201_CREATED)
+        self.assertEqual(response.data['name'], 'New Template')
+        self.assertEqual(LookupPromptTemplate.objects.count(), 2)
+
+    def test_create_template_without_reference_placeholder(self):
+        """Test that template without {{reference_data}} is rejected."""
+        url = reverse('lookup:lookuptemplate-list')
+        data = {
+            'name': 'Invalid Template',
+            'template_text': 'Product: {{product_name}}',  # Missing {{reference_data}}
+            'llm_config': {'provider': 'openai', 'model': 'gpt-4'}
+        }
+
+        response = self.client.post(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_400_BAD_REQUEST)
+        self.assertIn('template_text', response.data)
+
+    def test_create_template_invalid_llm_config(self):
+        """Test that template with invalid LLM config is rejected."""
+        url = reverse('lookup:lookuptemplate-list')
+        data = {
+            'name': 'Invalid Config Template',
+            'template_text': '{{reference_data}}',
+            'llm_config': {'model': 'gpt-4'}  # Missing provider
+        }
+
+        response = self.client.post(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_400_BAD_REQUEST)
+        self.assertIn('llm_config', response.data)
+
+    def test_update_template(self):
+        """Test updating a template."""
+        url = reverse('lookup:lookuptemplate-detail', args=[self.template.id])
+        data = {
+            'name': 'Updated Template',
+            'is_active': False
+        }
+
+        response = self.client.patch(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(response.data['name'], 'Updated Template')
+        self.assertFalse(response.data['is_active'])
+
+    def test_delete_template(self):
+        """Test deleting a template."""
+        url = reverse('lookup:lookuptemplate-detail', args=[self.template.id])
+        response = self.client.delete(url)
+
+        self.assertEqual(response.status_code, status.HTTP_204_NO_CONTENT)
+        self.assertEqual(LookupPromptTemplate.objects.count(), 0)
+
+    @patch('lookup.views.VariableResolver')
+    def test_validate_template(self, mock_resolver_class):
+        """Test template validation endpoint."""
+        # Mock the variable resolver
+        mock_resolver = MagicMock()
+        mock_resolver_class.return_value = mock_resolver
+        mock_resolver.resolve.return_value = "Resolved template text"
+        mock_resolver.get_all_variables.return_value = {'vendor_name', 'product_id'}
+
+        url = reverse('lookup:lookuptemplate-validate')
+        data = {
+            'template_text': 'Vendor: {{vendor_name}}\nProduct: {{product_id}}\n{{reference_data}}',
+            'sample_data': {'vendor_name': 'Test Vendor', 'product_id': '123'},
+            'sample_reference': 'Sample reference data'
+        }
+
+        response = self.client.post(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertTrue(response.data['valid'])
+        self.assertIn('resolved_template', response.data)
+        self.assertIn('variables_found', response.data)
+        self.assertEqual(set(response.data['variables_found']), {'vendor_name', 'product_id'})
+
+    def test_validate_template_with_error(self):
+        """Test template validation with error."""
+        url = reverse('lookup:lookuptemplate-validate')
+        data = {
+            'template_text': 'Invalid: {{unclosed_variable',  # Invalid template
+            'sample_data': {}
+        }
+
+        response = self.client.post(url, data, format='json')
+
+        self.assertEqual(response.status_code, status.HTTP_400_BAD_REQUEST)
+        self.assertFalse(response.data['valid'])
+        self.assertIn('error', response.data)
+
+    def test_filter_templates_by_active_status(self):
+        """Test filtering templates by active status."""
+        # Create inactive template
+        LookupPromptTemplate.objects.create(
+            name="Inactive Template",
+            template_text="{{reference_data}}",
+            llm_config={"provider": "openai", "model": "gpt-4"},
+            is_active=False,
+            created_by=self.user
+        )
+
+        url = reverse('lookup:lookuptemplate-list')
+
+        # Get only active templates
+        response = self.client.get(url, {'is_active': 'true'})
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(len(response.data['results']), 1)
+        self.assertEqual(response.data['results'][0]['name'], 'Test Template')
+
+        # Get only inactive templates
+        response = self.client.get(url, {'is_active': 'false'})
+        self.assertEqual(response.status_code, status.HTTP_200_OK)
+        self.assertEqual(len(response.data['results']), 1)
+        self.assertEqual(response.data['results'][0]['name'], 'Inactive Template')
diff --git a/backend/lookup/tests/test_integrations/__init__.py b/backend/lookup/tests/test_integrations/__init__.py
new file mode 100644
index 0000000000..c0565ab6fe
--- /dev/null
+++ b/backend/lookup/tests/test_integrations/__init__.py
@@ -0,0 +1,3 @@
+"""
+Integration tests for Look-Up external service integrations.
+"""
diff --git a/backend/lookup/tests/test_integrations/test_llm_integration.py b/backend/lookup/tests/test_integrations/test_llm_integration.py
new file mode 100644
index 0000000000..620d9cd6a7
--- /dev/null
+++ b/backend/lookup/tests/test_integrations/test_llm_integration.py
@@ -0,0 +1,239 @@
+"""
+Tests for LLM provider integration.
+"""
+
+import json
+from unittest.mock import patch
+
+from django.test import TestCase
+
+from ...integrations.llm_provider import (
+    UnstractLLMClient,
+    OpenAILLMClient,
+    AnthropicLLMClient
+)
+
+
+class UnstractLLMClientTest(TestCase):
+    """Test cases for UnstractLLMClient."""
+
+    def setUp(self):
+        """Set up test fixtures."""
+        # Patch environment variables
+        self.env_patcher = patch('lookup.integrations.llm_provider.os.getenv')
+        self.mock_getenv = self.env_patcher.start()
+        self.mock_getenv.side_effect = self._mock_getenv
+
+        # Initialize client
+        self.client = UnstractLLMClient()
+
+    def tearDown(self):
+        """Clean up patches."""
+        self.env_patcher.stop()
+
+    def _mock_getenv(self, key, default=None):
+        """Mock environment variables."""
+        env_vars = {
+            'LOOKUP_DEFAULT_LLM_PROVIDER': 'openai',
+            'LOOKUP_DEFAULT_LLM_MODEL': 'gpt-4',
+            'OPENAI_API_KEY': 'test-openai-key',
+            'ANTHROPIC_API_KEY': 'test-anthropic-key',
+            'AZURE_OPENAI_API_KEY': 'test-azure-key',
+            'AZURE_OPENAI_ENDPOINT': 'https://test.azure.com'
+        }
+        return env_vars.get(key, default)
+
+    def test_initialization(self):
+        """Test client initialization."""
+        # Test default initialization
+        client = UnstractLLMClient()
+        self.assertEqual(client.default_provider, 'openai')
+        self.assertEqual(client.default_model, 'gpt-4')
+
+        # Test custom initialization
+        client = UnstractLLMClient(provider='anthropic', model='claude-2')
+        self.assertEqual(client.default_provider, 'anthropic')
+        self.assertEqual(client.default_model, 'claude-2')
+
+    def test_generate_with_valid_json(self):
+        """Test generation with valid JSON response."""
+        prompt = "Extract vendor information"
+        config = {
+            'provider': 'openai',
+            'model': 'gpt-4',
+            'temperature': 0.7
+        }
+
+        # Since we don't have actual LLM integration, test fallback
+        response = self.client.generate(prompt, config)
+
+        # Verify response is valid JSON
+        data = json.loads(response)
+        self.assertIsInstance(data, dict)
+
+        # Should have confidence score
+        if 'confidence' in data:
+            self.assertTrue(0 <= data['confidence'] <= 1)
+
+    def test_generate_with_timeout(self):
+        """Test generation respects timeout."""
+        import time
+        start = time.time()
+
+        response = self.client.generate(
+            "Test prompt",
+            {'provider': 'openai'},
+            timeout=1
+        )
+
+        elapsed = time.time() - start
+
+        # Should complete within reasonable time
+        self.assertLess(elapsed, 2)
+        self.assertIsNotNone(response)
+
+    def test_extract_json_from_text(self):
+        """Test JSON extraction from mixed text."""
+        # Test with embedded JSON
+        text = "Here is the result: {\"vendor\": \"Test Corp\", \"confidence\": 0.9} end of response"
+        result = self.client._extract_json(text)
+
+        data = json.loads(result)
+        self.assertEqual(data['vendor'], 'Test Corp')
+        self.assertEqual(data['confidence'], 0.9)
+
+        # Test with no valid JSON
+        text = "No JSON here"
+        result = self.client._extract_json(text)
+
+        data = json.loads(result)
+        self.assertIn('raw_response', data)
+        self.assertIn('warning', data)
+
+    def test_validate_response(self):
+        """Test response validation."""
+        # Valid response
+        valid_response = json.dumps({
+            'vendor': 'Test',
+            'confidence': 0.85
+        })
+        self.assertTrue(self.client.validate_response(valid_response))
+
+        # Missing confidence
+        no_confidence = json.dumps({'vendor': 'Test'})
+        self.assertFalse(self.client.validate_response(no_confidence))
+
+        # Invalid confidence
+        bad_confidence = json.dumps({'confidence': 1.5})
+        self.assertFalse(self.client.validate_response(bad_confidence))
+
+        # Invalid JSON
+        not_json = "not json"
+        self.assertFalse(self.client.validate_response(not_json))
+
+    def test_get_token_count(self):
+        """Test token counting estimation."""
+        # Test basic estimation
+        text = "This is a test prompt with some content"
+        count = self.client.get_token_count(text)
+
+        # Should be roughly len/4
+        expected = len(text) // 4
+        self.assertAlmostEqual(count, expected, delta=2)
+
+        # Test empty text
+        self.assertEqual(self.client.get_token_count(""), 0)
+
+    def test_fallback_generation(self):
+        """Test fallback generation when LLM unavailable."""
+        # Force fallback mode
+        self.client.llm_available = False
+
+        response = self.client.generate(
+            "vendor extraction prompt",
+            {'provider': 'openai'}
+        )
+
+        # Should return valid JSON
+        data = json.loads(response)
+        self.assertEqual(data['status'], 'fallback')
+        self.assertIn('canonical_vendor', data)
+
+    def test_simulate_llm_call(self):
+        """Test simulated LLM call."""
+        # Test vendor prompt
+        vendor_response = self.client._simulate_llm_call(
+            "Extract vendor information",
+            {'provider': 'openai'}
+        )
+        vendor_data = json.loads(vendor_response)
+        self.assertIn('canonical_vendor', vendor_data)
+        self.assertIn('vendor_category', vendor_data)
+
+        # Test product prompt
+        product_response = self.client._simulate_llm_call(
+            "Extract product details",
+            {'provider': 'openai'}
+        )
+        product_data = json.loads(product_response)
+        self.assertIn('product_name', product_data)
+        self.assertIn('product_category', product_data)
+
+
+class OpenAILLMClientTest(TestCase):
+    """Test cases for OpenAI-specific client."""
+
+    def test_openai_client_initialization(self):
+        """Test OpenAI client initialization."""
+        client = OpenAILLMClient()
+        self.assertEqual(client.default_provider, 'openai')
+        self.assertEqual(client.default_model, 'gpt-4')
+
+    @patch('lookup.integrations.llm_provider.UnstractLLMClient.generate')
+    def test_openai_generate(self, mock_generate):
+        """Test OpenAI-specific generation."""
+        mock_generate.return_value = '{"result": "test"}'
+
+        client = OpenAILLMClient()
+        response = client.generate(
+            "test prompt",
+            {'temperature': 0.5}
+        )
+
+        # Verify OpenAI config was used
+        mock_generate.assert_called_once()
+        call_args = mock_generate.call_args[0]
+        config = call_args[1]
+
+        self.assertEqual(config['provider'], 'openai')
+        self.assertEqual(config['temperature'], 0.5)
+
+
+class AnthropicLLMClientTest(TestCase):
+    """Test cases for Anthropic-specific client."""
+
+    def test_anthropic_client_initialization(self):
+        """Test Anthropic client initialization."""
+        client = AnthropicLLMClient()
+        self.assertEqual(client.default_provider, 'anthropic')
+        self.assertEqual(client.default_model, 'claude-2')
+
+    @patch('lookup.integrations.llm_provider.UnstractLLMClient.generate')
+    def test_anthropic_generate(self, mock_generate):
+        """Test Anthropic-specific generation."""
+        mock_generate.return_value = '{"result": "test"}'
+
+        client = AnthropicLLMClient()
+        response = client.generate(
+            "test prompt",
+            {'temperature': 0.8}
+        )
+
+        # Verify Anthropic config was used
+        mock_generate.assert_called_once()
+        call_args = mock_generate.call_args[0]
+        config = call_args[1]
+
+        self.assertEqual(config['provider'], 'anthropic')
+        self.assertEqual(config['model'], 'claude-2')
+        self.assertEqual(config['temperature'], 0.8)
diff --git a/backend/lookup/tests/test_integrations/test_llmwhisperer_integration.py b/backend/lookup/tests/test_integrations/test_llmwhisperer_integration.py
new file mode 100644
index 0000000000..a03773159f
--- /dev/null
+++ b/backend/lookup/tests/test_integrations/test_llmwhisperer_integration.py
@@ -0,0 +1,297 @@
+"""
+Tests for LLMWhisperer document extraction integration.
+"""
+
+from unittest.mock import patch, Mock
+
+from django.test import TestCase
+from django.conf import settings
+
+from ...integrations.llmwhisperer_client import (
+    LLMWhispererClient,
+    ExtractionStatus
+)
+
+
+class LLMWhispererClientTest(TestCase):
+    """Test cases for LLMWhispererClient."""
+
+    def setUp(self):
+        """Set up test fixtures."""
+        # Mock settings
+        self.settings_patcher = patch.multiple(
+            settings,
+            LLMWHISPERER_BASE_URL='https://test.llmwhisperer.com',
+            LLMWHISPERER_API_KEY='test-api-key'
+        )
+        self.settings_patcher.start()
+
+        # Mock requests
+        self.requests_patcher = patch('lookup.integrations.llmwhisperer_client.requests')
+        self.mock_requests = self.requests_patcher.start()
+
+        # Initialize client
+        self.client = LLMWhispererClient()
+
+    def tearDown(self):
+        """Clean up patches."""
+        self.settings_patcher.stop()
+        self.requests_patcher.stop()
+
+    def test_initialization(self):
+        """Test client initialization."""
+        self.assertEqual(self.client.base_url, 'https://test.llmwhisperer.com')
+        self.assertEqual(self.client.api_key, 'test-api-key')
+        self.assertIsNotNone(self.client.session)
+
+    def test_extract_text_success(self):
+        """Test successful text extraction."""
+        # Mock response
+        mock_response = Mock()
+        mock_response.status_code = 200
+        mock_response.json.return_value = {
+            'extraction_id': 'test-id-123',
+            'status': 'processing'
+        }
+        self.mock_requests.post.return_value = mock_response
+
+        # Test extraction
+        file_content = b"PDF content here"
+        file_name = "test.pdf"
+
+        extraction_id, status = self.client.extract_text(
+            file_content,
+            file_name
+        )
+
+        # Verify
+        self.assertEqual(extraction_id, 'test-id-123')
+        self.assertEqual(status, ExtractionStatus.PROCESSING.value)
+
+        # Check API call
+        self.mock_requests.post.assert_called_once()
+        call_args = self.mock_requests.post.call_args
+
+        self.assertIn('/v1/extract', call_args[0][0])
+        self.assertIn('files', call_args[1])
+        self.assertIn('data', call_args[1])
+
+    def test_extract_text_failure(self):
+        """Test extraction failure."""
+        # Mock failed response
+        mock_response = Mock()
+        mock_response.status_code = 400
+        mock_response.text = "Bad request"
+        self.mock_requests.post.return_value = mock_response
+
+        # Test extraction
+        extraction_id, status = self.client.extract_text(
+            b"content",
+            "test.pdf"
+        )
+
+        # Verify
+        self.assertEqual(extraction_id, "")
+        self.assertEqual(status, ExtractionStatus.FAILED.value)
+
+    def test_check_extraction_status_complete(self):
+        """Test checking completed extraction status."""
+        # Mock status response
+        mock_status_response = Mock()
+        mock_status_response.status_code = 200
+        mock_status_response.json.return_value = {
+            'status': 'completed',
+            'extraction_id': 'test-id'
+        }
+
+        # Mock result response
+        mock_result_response = Mock()
+        mock_result_response.status_code = 200
+        mock_result_response.text = "Extracted text content"
+
+        # Set up session mock
+        self.client.session.get = Mock(side_effect=[
+            mock_status_response,
+            mock_result_response
+        ])
+
+        # Test status check
+        status, text = self.client.check_extraction_status('test-id')
+
+        # Verify
+        self.assertEqual(status, ExtractionStatus.COMPLETE.value)
+        self.assertEqual(text, "Extracted text content")
+
+    def test_check_extraction_status_processing(self):
+        """Test checking processing extraction status."""
+        # Mock response
+        mock_response = Mock()
+        mock_response.status_code = 200
+        mock_response.json.return_value = {
+            'status': 'processing'
+        }
+        self.client.session.get = Mock(return_value=mock_response)
+
+        # Test status check
+        status, text = self.client.check_extraction_status('test-id')
+
+        # Verify
+        self.assertEqual(status, ExtractionStatus.PROCESSING.value)
+        self.assertIsNone(text)
+
+    def test_check_extraction_status_failed(self):
+        """Test checking failed extraction status."""
+        # Mock response
+        mock_response = Mock()
+        mock_response.status_code = 200
+        mock_response.json.return_value = {
+            'status': 'failed',
+            'error': 'Extraction error'
+        }
+        self.client.session.get = Mock(return_value=mock_response)
+
+        # Test status check
+        status, text = self.client.check_extraction_status('test-id')
+
+        # Verify
+        self.assertEqual(status, ExtractionStatus.FAILED.value)
+        self.assertIsNone(text)
+
+    @patch('time.sleep')
+    def test_wait_for_extraction_success(self, mock_sleep):
+        """Test waiting for extraction completion."""
+        # Mock status checks
+        mock_responses = [
+            (ExtractionStatus.PROCESSING.value, None),
+            (ExtractionStatus.PROCESSING.value, None),
+            (ExtractionStatus.COMPLETE.value, "Extracted text")
+        ]
+
+        self.client.check_extraction_status = Mock(
+            side_effect=mock_responses
+        )
+
+        # Test wait
+        status, text = self.client.wait_for_extraction(
+            'test-id',
+            max_wait_seconds=60,
+            poll_interval=5
+        )
+
+        # Verify
+        self.assertEqual(status, ExtractionStatus.COMPLETE.value)
+        self.assertEqual(text, "Extracted text")
+        self.assertEqual(self.client.check_extraction_status.call_count, 3)
+
+    @patch('time.sleep')
+    @patch('time.time')
+    def test_wait_for_extraction_timeout(self, mock_time, mock_sleep):
+        """Test extraction timeout."""
+        # Mock time to simulate timeout
+        mock_time.side_effect = [0, 10, 20, 35, 40]  # Exceeds 30 second limit
+
+        self.client.check_extraction_status = Mock(
+            return_value=(ExtractionStatus.PROCESSING.value, None)
+        )
+
+        # Test wait with short timeout
+        status, text = self.client.wait_for_extraction(
+            'test-id',
+            max_wait_seconds=30,
+            poll_interval=5
+        )
+
+        # Verify
+        self.assertEqual(status, ExtractionStatus.FAILED.value)
+        self.assertIsNone(text)
+
+    def test_extract_and_wait(self):
+        """Test combined extract and wait."""
+        # Mock extraction
+        self.client.extract_text = Mock(
+            return_value=('test-id', ExtractionStatus.PROCESSING.value)
+        )
+
+        # Mock wait
+        self.client.wait_for_extraction = Mock(
+            return_value=(ExtractionStatus.COMPLETE.value, "Extracted text")
+        )
+
+        # Test
+        success, text = self.client.extract_and_wait(
+            b"content",
+            "test.pdf"
+        )
+
+        # Verify
+        self.assertTrue(success)
+        self.assertEqual(text, "Extracted text")
+
+    def test_is_extraction_needed(self):
+        """Test checking if extraction is needed."""
+        # Files that need extraction
+        extractable = [
+            'document.pdf',
+            'image.png',
+            'photo.jpg',
+            'scan.tiff',
+            'presentation.pptx',
+            'spreadsheet.xlsx'
+        ]
+
+        for filename in extractable:
+            self.assertTrue(
+                self.client.is_extraction_needed(filename),
+                f"{filename} should need extraction"
+            )
+
+        # Files that don't need extraction
+        non_extractable = [
+            'data.json',
+            'script.py',
+            'text.txt',
+            'config.yml'
+        ]
+
+        for filename in non_extractable:
+            self.assertFalse(
+                self.client.is_extraction_needed(filename),
+                f"{filename} should not need extraction"
+            )
+
+    def test_get_extraction_config_for_file(self):
+        """Test getting extraction config based on file type."""
+        # Test PDF config
+        pdf_config = self.client.get_extraction_config_for_file('test.pdf')
+        self.assertEqual(pdf_config['processing_mode'], 'ocr')
+        self.assertTrue(pdf_config['force_text_processing'])
+
+        # Test image config
+        img_config = self.client.get_extraction_config_for_file('test.jpg')
+        self.assertEqual(img_config['processing_mode'], 'ocr')
+        self.assertFalse(img_config['force_text_processing'])
+
+        # Test Word config
+        doc_config = self.client.get_extraction_config_for_file('test.docx')
+        self.assertEqual(doc_config['processing_mode'], 'text')
+        self.assertEqual(doc_config['output_format'], 'markdown')
+
+        # Test Excel config
+        xls_config = self.client.get_extraction_config_for_file('test.xlsx')
+        self.assertEqual(xls_config['processing_mode'], 'text')
+        self.assertEqual(xls_config['line_splitter'], 'paragraph')
+
+    def test_default_config(self):
+        """Test default extraction configuration."""
+        config = self.client._get_default_config()
+
+        # Verify required fields
+        self.assertIn('processing_mode', config)
+        self.assertIn('output_format', config)
+        self.assertIn('page_separator', config)
+        self.assertIn('timeout', config)
+
+        # Verify defaults
+        self.assertEqual(config['processing_mode'], 'ocr')
+        self.assertEqual(config['output_format'], 'text')
+        self.assertEqual(config['timeout'], 300)
diff --git a/backend/lookup/tests/test_integrations/test_redis_cache_integration.py b/backend/lookup/tests/test_integrations/test_redis_cache_integration.py
new file mode 100644
index 0000000000..de1d203a99
--- /dev/null
+++ b/backend/lookup/tests/test_integrations/test_redis_cache_integration.py
@@ -0,0 +1,272 @@
+"""
+Tests for Redis cache integration.
+"""
+
+from unittest.mock import MagicMock, patch
+
+from django.test import TestCase
+from django.conf import settings
+
+from ...integrations.redis_cache import RedisLLMCache
+
+
+class RedisLLMCacheTest(TestCase):
+    """Test cases for RedisLLMCache."""
+
+    def setUp(self):
+        """Set up test fixtures."""
+        # Mock Redis availability
+        self.redis_patcher = patch('lookup.integrations.redis_cache.REDIS_AVAILABLE', True)
+        self.redis_patcher.start()
+
+        # Mock Redis client
+        self.redis_client_patcher = patch('lookup.integrations.redis_cache.redis.Redis')
+        self.mock_redis_class = self.redis_client_patcher.start()
+
+        # Create mock Redis instance
+        self.mock_redis = MagicMock()
+        self.mock_redis_class.return_value = self.mock_redis
+        self.mock_redis.ping.return_value = True
+
+        # Mock settings
+        self.settings_patcher = patch.multiple(
+            settings,
+            REDIS_HOST='localhost',
+            REDIS_PORT=6379,
+            REDIS_CACHE_DB=1,
+            REDIS_PASSWORD='test-pass'
+        )
+        self.settings_patcher.start()
+
+        # Initialize cache
+        self.cache = RedisLLMCache(ttl_hours=24)
+
+    def tearDown(self):
+        """Clean up patches."""
+        self.redis_patcher.stop()
+        self.redis_client_patcher.stop()
+        self.settings_patcher.stop()
+
+    def test_initialization_with_redis(self):
+        """Test cache initialization with Redis available."""
+        self.assertIsNotNone(self.cache.redis_client)
+        self.mock_redis.ping.assert_called_once()
+        self.assertEqual(self.cache.ttl_seconds, 24 * 3600)
+        self.assertEqual(self.cache.key_prefix, "lookup:llm:")
+
+    def test_initialization_without_redis(self):
+        """Test cache initialization when Redis unavailable."""
+        # Mock Redis connection failure
+        self.mock_redis.ping.side_effect = Exception("Connection failed")
+
+        # Reinitialize cache
+        cache = RedisLLMCache(fallback_to_memory=True)
+
+        # Should fall back to memory cache
+        self.assertIsNone(cache.redis_client)
+        self.assertIsNotNone(cache.memory_cache)
+
+    def test_generate_cache_key(self):
+        """Test cache key generation."""
+        prompt = "Test prompt"
+        reference = "Reference data"
+
+        key = self.cache.generate_cache_key(prompt, reference)
+
+        # Should be prefixed and hashed
+        self.assertTrue(key.startswith("lookup:llm:"))
+        self.assertEqual(len(key), len("lookup:llm:") + 64)  # SHA256 hex length
+
+    def test_set_and_get(self):
+        """Test setting and getting cache values."""
+        # Test set
+        key = "lookup:llm:test-key"
+        value = '{"result": "test"}'
+
+        result = self.cache.set(key, value)
+        self.assertTrue(result)
+
+        # Verify Redis setex called
+        self.mock_redis.setex.assert_called_once_with(
+            name=key,
+            time=24 * 3600,
+            value=value
+        )
+
+        # Test get
+        self.mock_redis.get.return_value = value
+        retrieved = self.cache.get(key)
+
+        self.assertEqual(retrieved, value)
+        self.mock_redis.get.assert_called_once_with(key)
+
+    def test_get_cache_miss(self):
+        """Test cache miss."""
+        self.mock_redis.get.return_value = None
+
+        result = self.cache.get("lookup:llm:nonexistent")
+
+        self.assertIsNone(result)
+
+    def test_delete(self):
+        """Test deleting cache entries."""
+        key = "lookup:llm:test-key"
+        self.mock_redis.delete.return_value = 1
+
+        result = self.cache.delete(key)
+
+        self.assertTrue(result)
+        self.mock_redis.delete.assert_called_once_with(key)
+
+    def test_delete_nonexistent(self):
+        """Test deleting non-existent entry."""
+        self.mock_redis.delete.return_value = 0
+
+        result = self.cache.delete("lookup:llm:nonexistent")
+
+        # Redis returns 0 for non-existent keys
+        self.assertFalse(result)
+
+    def test_clear_pattern(self):
+        """Test clearing entries by pattern."""
+        # Mock SCAN operation
+        self.mock_redis.scan.side_effect = [
+            (100, ["lookup:llm:project1:key1", "lookup:llm:project1:key2"]),
+            (0, ["lookup:llm:project1:key3"])
+        ]
+        self.mock_redis.delete.return_value = 3
+
+        count = self.cache.clear_pattern("lookup:llm:project1:*")
+
+        self.assertEqual(count, 3)
+        self.mock_redis.delete.assert_called()
+
+    def test_fallback_to_memory_cache(self):
+        """Test fallback to memory cache when Redis fails."""
+        # Make Redis operations fail
+        from redis.exceptions import RedisError
+        self.mock_redis.get.side_effect = RedisError("Connection lost")
+        self.mock_redis.setex.side_effect = RedisError("Connection lost")
+
+        # Cache should have memory fallback
+        self.assertIsNotNone(self.cache.memory_cache)
+
+        # Test set with fallback
+        key = "lookup:llm:test"
+        value = "test-value"
+
+        result = self.cache.set(key, value)
+        self.assertTrue(result)  # Should succeed with memory cache
+
+        # Test get with fallback
+        retrieved = self.cache.get(key)
+        # Memory cache uses key without prefix
+        self.assertEqual(retrieved, value)
+
+    def test_get_stats(self):
+        """Test getting cache statistics."""
+        # Mock Redis info
+        self.mock_redis.info.side_effect = [
+            {  # stats info
+                'total_connections_received': 100,
+                'keyspace_hits': 80,
+                'keyspace_misses': 20
+            },
+            {  # keyspace info
+                'db1': {'keys': 50, 'expires': 45}
+            }
+        ]
+
+        stats = self.cache.get_stats()
+
+        # Verify stats structure
+        self.assertEqual(stats['backend'], 'redis')
+        self.assertEqual(stats['ttl_hours'], 24)
+        self.assertIn('redis', stats)
+        self.assertEqual(stats['redis']['keyspace_hits'], 80)
+        self.assertEqual(stats['redis']['hit_rate'], 0.8)
+
+    def test_cleanup_expired(self):
+        """Test cleanup of expired entries."""
+        # Redis handles expiration automatically
+        count = self.cache.cleanup_expired()
+
+        # Should return 0 for Redis (automatic expiry)
+        self.assertEqual(count, 0)
+
+    def test_warmup(self):
+        """Test cache warmup."""
+        project_id = "test-project"
+        preload_data = {
+            "prompt1": "response1",
+            "prompt2": "response2"
+        }
+
+        count = self.cache.warmup(project_id, preload_data)
+
+        self.assertEqual(count, 2)
+        self.assertEqual(self.mock_redis.setex.call_count, 2)
+
+    def test_custom_ttl(self):
+        """Test setting cache with custom TTL."""
+        key = "lookup:llm:test"
+        value = "test-value"
+        custom_ttl = 3600  # 1 hour
+
+        self.cache.set(key, value, ttl=custom_ttl)
+
+        # Verify custom TTL was used
+        self.mock_redis.setex.assert_called_with(
+            name=key,
+            time=custom_ttl,
+            value=value
+        )
+
+    def test_hit_rate_calculation(self):
+        """Test cache hit rate calculation."""
+        # Test with hits and misses
+        rate = self.cache._calculate_hit_rate(80, 20)
+        self.assertEqual(rate, 0.8)
+
+        # Test with no data
+        rate = self.cache._calculate_hit_rate(0, 0)
+        self.assertEqual(rate, 0.0)
+
+    def test_pattern_matching(self):
+        """Test pattern matching for memory cache."""
+        # Test exact match
+        self.assertTrue(self.cache._match_pattern("key1", "key1"))
+
+        # Test wildcard match
+        self.assertTrue(self.cache._match_pattern("project:key1", "project:*"))
+        self.assertTrue(self.cache._match_pattern("project:subkey:value", "project:*:value"))
+
+        # Test non-match
+        self.assertFalse(self.cache._match_pattern("other:key", "project:*"))
+
+
+class RedisUnavailableTest(TestCase):
+    """Test cases when Redis is not available."""
+
+    def setUp(self):
+        """Set up test without Redis."""
+        # Mock Redis as unavailable
+        self.redis_patcher = patch('lookup.integrations.redis_cache.REDIS_AVAILABLE', False)
+        self.redis_patcher.start()
+
+    def tearDown(self):
+        """Clean up patches."""
+        self.redis_patcher.stop()
+
+    def test_initialization_without_redis_package(self):
+        """Test when redis package is not installed."""
+        cache = RedisLLMCache()
+
+        # Should initialize without Redis
+        self.assertIsNone(cache.redis_client)
+        self.assertIsNotNone(cache.memory_cache)
+
+        # Should still be functional with memory cache
+        key = cache.generate_cache_key("test", "data")
+        cache.set(key, "value")
+        self.assertEqual(cache.get(key), "value")
diff --git a/backend/lookup/tests/test_integrations/test_storage_integration.py b/backend/lookup/tests/test_integrations/test_storage_integration.py
new file mode 100644
index 0000000000..5939a2fc7e
--- /dev/null
+++ b/backend/lookup/tests/test_integrations/test_storage_integration.py
@@ -0,0 +1,247 @@
+"""
+Tests for object storage integration.
+"""
+
+import uuid
+from unittest.mock import MagicMock, patch
+
+from django.test import TestCase
+
+from ...integrations.storage_client import RemoteStorageClient
+
+
+class RemoteStorageClientTest(TestCase):
+    """Test cases for RemoteStorageClient."""
+
+    def setUp(self):
+        """Set up test fixtures."""
+        # Mock the FileStorage instance
+        self.mock_fs_patcher = patch('lookup.integrations.storage_client.EnvHelper.get_storage')
+        self.mock_get_storage = self.mock_fs_patcher.start()
+
+        # Create mock file storage
+        self.mock_fs = MagicMock()
+        self.mock_get_storage.return_value = self.mock_fs
+
+        # Initialize client
+        self.client = RemoteStorageClient(base_path="test/lookup")
+        self.project_id = uuid.uuid4()
+
+    def tearDown(self):
+        """Clean up patches."""
+        self.mock_fs_patcher.stop()
+
+    def test_upload_success(self):
+        """Test successful file upload."""
+        # Setup mock
+        self.mock_fs.write.return_value = None  # Successful write
+
+        # Test upload
+        content = b"test content"
+        path = "test/file.txt"
+
+        result = self.client.upload(path, content)
+
+        # Verify
+        self.assertTrue(result)
+        self.mock_fs.mkdir.assert_called_once()
+        self.mock_fs.write.assert_called_once_with(
+            path=path,
+            mode="wb",
+            data=content
+        )
+
+    def test_upload_failure(self):
+        """Test file upload failure."""
+        # Setup mock to raise exception
+        self.mock_fs.write.side_effect = Exception("Storage error")
+
+        # Test upload
+        result = self.client.upload("test/file.txt", b"content")
+
+        # Verify
+        self.assertFalse(result)
+
+    def test_download_success(self):
+        """Test successful file download."""
+        # Setup mock
+        expected_content = b"test content"
+        self.mock_fs.exists.return_value = True
+        self.mock_fs.read.return_value = expected_content
+
+        # Test download
+        content = self.client.download("test/file.txt")
+
+        # Verify
+        self.assertEqual(content, expected_content)
+        self.mock_fs.read.assert_called_once_with(
+            path="test/file.txt",
+            mode="rb"
+        )
+
+    def test_download_file_not_found(self):
+        """Test download when file doesn't exist."""
+        # Setup mock
+        self.mock_fs.exists.return_value = False
+
+        # Test download
+        content = self.client.download("nonexistent.txt")
+
+        # Verify
+        self.assertIsNone(content)
+        self.mock_fs.read.assert_not_called()
+
+    def test_delete_success(self):
+        """Test successful file deletion."""
+        # Setup mock
+        self.mock_fs.exists.return_value = True
+        self.mock_fs.delete.return_value = None
+
+        # Test delete
+        result = self.client.delete("test/file.txt")
+
+        # Verify
+        self.assertTrue(result)
+        self.mock_fs.delete.assert_called_once_with("test/file.txt")
+
+    def test_delete_file_not_found(self):
+        """Test delete when file doesn't exist."""
+        # Setup mock
+        self.mock_fs.exists.return_value = False
+
+        # Test delete
+        result = self.client.delete("nonexistent.txt")
+
+        # Verify
+        self.assertFalse(result)
+        self.mock_fs.delete.assert_not_called()
+
+    def test_exists_check(self):
+        """Test file existence check."""
+        # Test existing file
+        self.mock_fs.exists.return_value = True
+        self.assertTrue(self.client.exists("test/file.txt"))
+
+        # Test non-existing file
+        self.mock_fs.exists.return_value = False
+        self.assertFalse(self.client.exists("nonexistent.txt"))
+
+    def test_list_files(self):
+        """Test listing files with prefix."""
+        # Setup mock
+        self.mock_fs.listdir.return_value = ["file1.txt", "file2.txt", ".hidden"]
+
+        # Test list
+        files = self.client.list_files("test/prefix")
+
+        # Verify - hidden files should be excluded
+        self.assertEqual(len(files), 2)
+        self.assertIn("test/prefix/file1.txt", files)
+        self.assertIn("test/prefix/file2.txt", files)
+        self.assertNotIn("test/prefix/.hidden", files)
+
+    def test_text_content_operations(self):
+        """Test text content save and retrieve."""
+        # Test save
+        text = "Hello, World!"
+        self.mock_fs.write.return_value = None
+
+        result = self.client.save_text_content("test.txt", text)
+        self.assertTrue(result)
+        self.mock_fs.write.assert_called_with(
+            path="test.txt",
+            mode="wb",
+            data=text.encode('utf-8')
+        )
+
+        # Test get
+        self.mock_fs.exists.return_value = True
+        self.mock_fs.read.return_value = text.encode('utf-8')
+
+        retrieved = self.client.get_text_content("test.txt")
+        self.assertEqual(retrieved, text)
+
+    def test_upload_reference_data(self):
+        """Test uploading reference data with metadata."""
+        # Setup
+        content = b"reference data"
+        filename = "vendors.csv"
+        metadata = {"source": "manual", "version": 1}
+
+        # Mock JSON encoding for metadata
+        import json
+        expected_meta = json.dumps(metadata, indent=2)
+
+        # Test upload
+        path = self.client.upload_reference_data(
+            self.project_id,
+            filename,
+            content,
+            metadata
+        )
+
+        # Verify
+        expected_path = f"test/lookup/{self.project_id}/{filename}"
+        self.assertEqual(path, expected_path)
+
+        # Check main file upload
+        call_args = [call for call in self.mock_fs.write.call_args_list
+                     if call[1]['path'] == expected_path]
+        self.assertEqual(len(call_args), 1)
+
+        # Check metadata upload
+        meta_path = f"{expected_path}.meta.json"
+        meta_calls = [call for call in self.mock_fs.write.call_args_list
+                      if call[1]['path'] == meta_path]
+        self.assertEqual(len(meta_calls), 1)
+
+    def test_get_reference_data(self):
+        """Test retrieving reference data."""
+        # Setup
+        expected_data = "reference content"
+        self.mock_fs.exists.return_value = True
+        self.mock_fs.read.return_value = expected_data.encode('utf-8')
+
+        # Test
+        data = self.client.get_reference_data(self.project_id, "data.txt")
+
+        # Verify
+        self.assertEqual(data, expected_data)
+        expected_path = f"test/lookup/{self.project_id}/data.txt"
+        self.mock_fs.read.assert_called_with(path=expected_path, mode="rb")
+
+    def test_list_project_files(self):
+        """Test listing all files for a project."""
+        # Setup
+        self.mock_fs.listdir.return_value = ["file1.csv", "file2.json"]
+
+        # Test
+        files = self.client.list_project_files(self.project_id)
+
+        # Verify
+        expected_prefix = f"test/lookup/{self.project_id}"
+        self.assertEqual(len(files), 2)
+        self.assertIn(f"{expected_prefix}/file1.csv", files)
+        self.assertIn(f"{expected_prefix}/file2.json", files)
+
+    def test_delete_project_data(self):
+        """Test deleting all project data."""
+        # Setup
+        project_files = ["file1.csv", "file2.json"]
+        self.mock_fs.listdir.return_value = project_files
+        self.mock_fs.exists.return_value = True
+
+        # Test
+        result = self.client.delete_project_data(self.project_id)
+
+        # Verify
+        self.assertTrue(result)
+
+        # Check files were deleted
+        expected_prefix = f"test/lookup/{self.project_id}"
+        for filename in project_files:
+            expected_path = f"{expected_prefix}/{filename}"
+            self.mock_fs.delete.assert_any_call(expected_path)
+
+        # Check directory was removed
+        self.mock_fs.rmdir.assert_called_once_with(expected_prefix)
diff --git a/backend/lookup/tests/test_migrations.py b/backend/lookup/tests/test_migrations.py
new file mode 100644
index 0000000000..496891a816
--- /dev/null
+++ b/backend/lookup/tests/test_migrations.py
@@ -0,0 +1,286 @@
+"""Tests for Look-Up system database migrations."""
+
+import pytest
+from django.db import connection
+from django.db.migrations.executor import MigrationExecutor
+from django.test import TransactionTestCase
+
+
+class TestLookupMigrations(TransactionTestCase):
+    """Test suite for Look-Up database migrations."""
+
+    @property
+    def app(self):
+        return "lookup"
+
+    @property
+    def migrate_from(self):
+        return None  # Initial migration
+
+    @property
+    def migrate_to(self):
+        return [(self.app, "0001_initial")]
+
+    def setUp(self):
+        """Set up test environment."""
+        assert (
+            self.migrate_from and self.migrate_to
+        ), "TestCase '{}' must define migrate_from and migrate_to properties".format(
+            type(self).__name__
+        )
+        self.migrate_from = [(self.app, self.migrate_from)]
+        self.migrate_to = [(self.app, self.migrate_to[0][1])]
+        executor = MigrationExecutor(connection)
+        old_apps = executor.loader.project_state(self.migrate_from).apps
+
+        # Reverse to the original migration
+        executor.migrate(self.migrate_from)
+
+        self.apps_before = old_apps
+
+    def test_migration_can_be_applied(self):
+        """Test that the migration can be applied successfully."""
+        executor = MigrationExecutor(connection)
+
+        # Apply migrations
+        executor.migrate(self.migrate_to)
+
+        # Check tables exist
+        with connection.cursor() as cursor:
+            cursor.execute(
+                """
+                SELECT table_name FROM information_schema.tables
+                WHERE table_name IN (
+                    'lookup_projects',
+                    'lookup_data_sources',
+                    'lookup_prompt_templates',
+                    'prompt_studio_lookup_links'
+                )
+                """
+            )
+            tables = [row[0] for row in cursor.fetchall()]
+
+        assert len(tables) == 4, f"Expected 4 tables, found {len(tables)}: {tables}"
+        assert "lookup_projects" in tables
+        assert "lookup_data_sources" in tables
+        assert "lookup_prompt_templates" in tables
+        assert "prompt_studio_lookup_links" in tables
+
+    def test_migration_can_be_reversed(self):
+        """Test that the migration can be reversed successfully."""
+        executor = MigrationExecutor(connection)
+
+        # Apply migration
+        executor.migrate(self.migrate_to)
+
+        # Reverse migration
+        executor.migrate(self.migrate_from)
+
+        # Check tables don't exist
+        with connection.cursor() as cursor:
+            cursor.execute(
+                """
+                SELECT table_name FROM information_schema.tables
+                WHERE table_name IN (
+                    'lookup_projects',
+                    'lookup_data_sources',
+                    'lookup_prompt_templates',
+                    'prompt_studio_lookup_links'
+                )
+                """
+            )
+            tables = [row[0] for row in cursor.fetchall()]
+
+        assert (
+            len(tables) == 0
+        ), f"Tables should not exist after reversal, found: {tables}"
+
+    def test_constraints_are_enforced(self):
+        """Test that all database constraints are properly enforced."""
+        from django.contrib.auth import get_user_model
+        from account.models import Organization
+        from lookup.models import LookupProject, LookupDataSource
+
+        User = get_user_model()
+
+        # Create test user and organization
+        org = Organization.objects.create(name="Test Org")
+        user = User.objects.create_user(
+            username="testuser", email="test@example.com", password="password"
+        )
+
+        # Test CHECK constraint on lookup_type
+        with pytest.raises(Exception):
+            LookupProject.objects.create(
+                name="Invalid Type Project",
+                lookup_type="invalid_type",
+                llm_provider="openai",
+                llm_model="gpt-4",
+                organization=org,
+                created_by=user,
+            )
+
+        # Test CHECK constraint on extraction_status
+        project = LookupProject.objects.create(
+            name="Valid Project",
+            lookup_type="static_data",
+            llm_provider="openai",
+            llm_model="gpt-4",
+            organization=org,
+            created_by=user,
+        )
+
+        with pytest.raises(Exception):
+            LookupDataSource.objects.create(
+                project=project,
+                file_name="test.pdf",
+                file_path="/path/to/file.pdf",
+                file_size=1024,
+                file_type="pdf",
+                extraction_status="invalid_status",
+                uploaded_by=user,
+            )
+
+    def test_version_trigger_functionality(self):
+        """Test that the version management trigger works correctly."""
+        from django.contrib.auth import get_user_model
+        from account.models import Organization
+        from lookup.models import LookupProject, LookupDataSource
+
+        User = get_user_model()
+
+        # Create test data
+        org = Organization.objects.create(name="Test Org")
+        user = User.objects.create_user(
+            username="testuser", email="test@example.com", password="password"
+        )
+
+        project = LookupProject.objects.create(
+            name="Version Test Project",
+            lookup_type="static_data",
+            llm_provider="openai",
+            llm_model="gpt-4",
+            organization=org,
+            created_by=user,
+        )
+
+        # Create first data source
+        ds1 = LookupDataSource.objects.create(
+            project=project,
+            file_name="v1.pdf",
+            file_path="/path/v1.pdf",
+            file_size=1024,
+            file_type="pdf",
+            uploaded_by=user,
+        )
+
+        # Verify first version
+        ds1.refresh_from_db()
+        assert ds1.version_number == 1
+        assert ds1.is_latest is True
+
+        # Create second data source
+        ds2 = LookupDataSource.objects.create(
+            project=project,
+            file_name="v2.pdf",
+            file_path="/path/v2.pdf",
+            file_size=2048,
+            file_type="pdf",
+            uploaded_by=user,
+        )
+
+        # Verify second version
+        ds2.refresh_from_db()
+        assert ds2.version_number == 2
+        assert ds2.is_latest is True
+
+        # Verify first version is no longer latest
+        ds1.refresh_from_db()
+        assert ds1.is_latest is False
+
+    def test_indexes_are_created(self):
+        """Test that all required indexes are created."""
+        with connection.cursor() as cursor:
+            # Check for index existence on lookup_projects
+            cursor.execute(
+                """
+                SELECT indexname FROM pg_indexes
+                WHERE tablename = 'lookup_projects'
+                AND indexname IN (
+                    'idx_lookup_proj_org',
+                    'idx_lookup_proj_created_by',
+                    'idx_lookup_proj_updated'
+                )
+                """
+            )
+            project_indexes = [row[0] for row in cursor.fetchall()]
+
+        assert len(project_indexes) == 3
+
+        with connection.cursor() as cursor:
+            # Check for index existence on lookup_data_sources
+            cursor.execute(
+                """
+                SELECT indexname FROM pg_indexes
+                WHERE tablename = 'lookup_data_sources'
+                AND indexname IN (
+                    'idx_lookup_ds_project',
+                    'idx_lookup_ds_latest',
+                    'idx_lookup_ds_created',
+                    'idx_lookup_ds_status'
+                )
+                """
+            )
+            ds_indexes = [row[0] for row in cursor.fetchall()]
+
+        assert len(ds_indexes) == 4
+
+    def test_foreign_key_constraints(self):
+        """Test that foreign key relationships work correctly."""
+        from django.contrib.auth import get_user_model
+        from account.models import Organization
+        from lookup.models import (
+            LookupProject,
+            LookupDataSource,
+            LookupPromptTemplate,
+        )
+
+        User = get_user_model()
+
+        # Create test data
+        org = Organization.objects.create(name="Test Org")
+        user = User.objects.create_user(
+            username="testuser", email="test@example.com", password="password"
+        )
+
+        project = LookupProject.objects.create(
+            name="FK Test Project",
+            lookup_type="static_data",
+            llm_provider="openai",
+            llm_model="gpt-4",
+            organization=org,
+            created_by=user,
+        )
+
+        # Test cascade delete
+        data_source = LookupDataSource.objects.create(
+            project=project,
+            file_name="test.pdf",
+            file_path="/path/test.pdf",
+            file_size=1024,
+            file_type="pdf",
+            uploaded_by=user,
+        )
+
+        template = LookupPromptTemplate.objects.create(
+            project=project,
+            template_text="Test: {{input_data}}",
+        )
+
+        # Delete project should cascade
+        project_id = project.id
+        project.delete()
+
+        # Verify cascaded deletes
+        assert not LookupDataSource.objects.filter(id=data_source.id).exists()
+        assert not LookupPromptTemplate.objects.filter(id=template.id).exists()
diff --git a/backend/lookup/tests/test_services/test_audit_logger.py b/backend/lookup/tests/test_services/test_audit_logger.py
new file mode 100644
index 0000000000..f7f138b193
--- /dev/null
+++ b/backend/lookup/tests/test_services/test_audit_logger.py
@@ -0,0 +1,455 @@
+"""
+Tests for Audit Logger implementation.
+
+This module tests the AuditLogger class including logging executions,
+convenience methods, and statistics retrieval.
+"""
+
+import uuid
+from decimal import Decimal
+from unittest.mock import MagicMock, patch
+
+import pytest
+
+from lookup.services.audit_logger import AuditLogger
+
+
+class TestAuditLogger:
+    """Test cases for AuditLogger class."""
+
+    @pytest.fixture
+    def audit_logger(self):
+        """Create an AuditLogger instance."""
+        return AuditLogger()
+
+    @pytest.fixture
+    def mock_project(self):
+        """Create a mock LookupProject."""
+        project = MagicMock()
+        project.id = uuid.uuid4()
+        project.name = "Test Look-Up"
+        return project
+
+    @pytest.fixture
+    def execution_params(self, mock_project):
+        """Create standard execution parameters."""
+        return {
+            'execution_id': str(uuid.uuid4()),
+            'lookup_project_id': mock_project.id,
+            'prompt_studio_project_id': uuid.uuid4(),
+            'input_data': {'vendor': 'Slack Technologies'},
+            'reference_data_version': 2,
+            'llm_provider': 'openai',
+            'llm_model': 'gpt-4',
+            'llm_prompt': 'Match vendor Slack Technologies...',
+            'llm_response': '{"canonical_vendor": "Slack", "confidence": 0.92}',
+            'enriched_output': {'canonical_vendor': 'Slack'},
+            'status': 'success',
+            'confidence_score': 0.92,
+            'execution_time_ms': 1234,
+            'llm_call_time_ms': 890,
+            'llm_response_cached': False,
+            'error_message': None
+        }
+
+    # ========== Basic Logging Tests ==========
+
+    @patch('lookup.services.audit_logger.LookupExecutionAudit')
+    @patch('lookup.services.audit_logger.LookupProject')
+    def test_successful_logging(
+        self, mock_project_model, mock_audit_model,
+        audit_logger, execution_params, mock_project
+    ):
+        """Test successful execution logging."""
+        # Setup mocks
+        mock_project_model.objects.get.return_value = mock_project
+        mock_audit_instance = MagicMock()
+        mock_audit_instance.id = uuid.uuid4()
+        mock_audit_model.objects.create.return_value = mock_audit_instance
+
+        # Log execution
+        result = audit_logger.log_execution(**execution_params)
+
+        # Verify project was fetched
+        mock_project_model.objects.get.assert_called_once_with(
+            id=execution_params['lookup_project_id']
+        )
+
+        # Verify audit was created with correct params
+        mock_audit_model.objects.create.assert_called_once()
+        create_call = mock_audit_model.objects.create.call_args
+        kwargs = create_call.kwargs
+
+        assert kwargs['lookup_project'] == mock_project
+        assert kwargs['execution_id'] == execution_params['execution_id']
+        assert kwargs['status'] == 'success'
+        assert kwargs['llm_provider'] == 'openai'
+        assert kwargs['llm_model'] == 'gpt-4'
+        assert kwargs['confidence_score'] == Decimal('0.92')
+
+        # Verify return value
+        assert result == mock_audit_instance
+
+    @patch('lookup.services.audit_logger.LookupProject')
+    def test_project_not_found(
+        self, mock_project_model, audit_logger, execution_params
+    ):
+        """Test handling when Look-Up project doesn't exist."""
+        # Make project lookup fail
+        mock_project_model.objects.get.side_effect = mock_project_model.DoesNotExist()
+
+        # Log execution
+        result = audit_logger.log_execution(**execution_params)
+
+        # Should return None and not raise exception
+        assert result is None
+
+    @patch('lookup.services.audit_logger.LookupExecutionAudit')
+    @patch('lookup.services.audit_logger.LookupProject')
+    def test_database_error_handling(
+        self, mock_project_model, mock_audit_model,
+        audit_logger, execution_params, mock_project
+    ):
+        """Test handling of database errors during logging."""
+        # Setup mocks
+        mock_project_model.objects.get.return_value = mock_project
+        mock_audit_model.objects.create.side_effect = Exception("Database error")
+
+        # Log execution - should not raise exception
+        result = audit_logger.log_execution(**execution_params)
+
+        # Should return None
+        assert result is None
+
+    # ========== Convenience Method Tests ==========
+
+    @patch('lookup.services.audit_logger.AuditLogger.log_execution')
+    def test_log_success(self, mock_log_execution, audit_logger):
+        """Test log_success convenience method."""
+        execution_id = str(uuid.uuid4())
+        project_id = uuid.uuid4()
+
+        audit_logger.log_success(
+            execution_id=execution_id,
+            project_id=project_id,
+            input_data={'test': 'data'},
+            confidence_score=0.85
+        )
+
+        mock_log_execution.assert_called_once_with(
+            execution_id=execution_id,
+            lookup_project_id=project_id,
+            status='success',
+            input_data={'test': 'data'},
+            confidence_score=0.85
+        )
+
+    @patch('lookup.services.audit_logger.AuditLogger.log_execution')
+    def test_log_failure(self, mock_log_execution, audit_logger):
+        """Test log_failure convenience method."""
+        execution_id = str(uuid.uuid4())
+        project_id = uuid.uuid4()
+        error_msg = "LLM timeout"
+
+        audit_logger.log_failure(
+            execution_id=execution_id,
+            project_id=project_id,
+            error=error_msg,
+            input_data={'test': 'data'}
+        )
+
+        mock_log_execution.assert_called_once_with(
+            execution_id=execution_id,
+            lookup_project_id=project_id,
+            status='failed',
+            error_message=error_msg,
+            input_data={'test': 'data'}
+        )
+
+    @patch('lookup.services.audit_logger.AuditLogger.log_execution')
+    def test_log_partial(self, mock_log_execution, audit_logger):
+        """Test log_partial convenience method."""
+        execution_id = str(uuid.uuid4())
+        project_id = uuid.uuid4()
+
+        audit_logger.log_partial(
+            execution_id=execution_id,
+            project_id=project_id,
+            confidence_score=0.35,
+            error_message='Low confidence'
+        )
+
+        mock_log_execution.assert_called_once_with(
+            execution_id=execution_id,
+            lookup_project_id=project_id,
+            status='partial',
+            confidence_score=0.35,
+            error_message='Low confidence'
+        )
+
+    # ========== Data Validation Tests ==========
+
+    @patch('lookup.services.audit_logger.LookupExecutionAudit')
+    @patch('lookup.services.audit_logger.LookupProject')
+    def test_confidence_score_conversion(
+        self, mock_project_model, mock_audit_model,
+        audit_logger, execution_params, mock_project
+    ):
+        """Test that confidence score is properly converted to Decimal."""
+        mock_project_model.objects.get.return_value = mock_project
+        mock_audit_model.objects.create.return_value = MagicMock()
+
+        # Test with float confidence
+        execution_params['confidence_score'] = 0.456789
+        audit_logger.log_execution(**execution_params)
+
+        create_call = mock_audit_model.objects.create.call_args
+        assert create_call.kwargs['confidence_score'] == Decimal('0.456789')
+
+        # Test with None confidence
+        execution_params['confidence_score'] = None
+        audit_logger.log_execution(**execution_params)
+
+        create_call = mock_audit_model.objects.create.call_args
+        assert create_call.kwargs['confidence_score'] is None
+
+    @patch('lookup.services.audit_logger.LookupExecutionAudit')
+    @patch('lookup.services.audit_logger.LookupProject')
+    def test_optional_fields(
+        self, mock_project_model, mock_audit_model,
+        audit_logger, mock_project
+    ):
+        """Test logging with minimal required fields."""
+        mock_project_model.objects.get.return_value = mock_project
+        mock_audit_model.objects.create.return_value = MagicMock()
+
+        # Minimal parameters
+        minimal_params = {
+            'execution_id': str(uuid.uuid4()),
+            'lookup_project_id': mock_project.id,
+            'prompt_studio_project_id': None,
+            'input_data': {},
+            'reference_data_version': 1,
+            'llm_provider': 'openai',
+            'llm_model': 'gpt-4',
+            'llm_prompt': 'test prompt',
+            'llm_response': None,
+            'enriched_output': None,
+            'status': 'failed'
+        }
+
+        result = audit_logger.log_execution(**minimal_params)
+
+        # Should still create audit record
+        mock_audit_model.objects.create.assert_called_once()
+
+    # ========== History Retrieval Tests ==========
+
+    @patch('lookup.services.audit_logger.LookupExecutionAudit')
+    def test_get_execution_history(self, mock_audit_model, audit_logger):
+        """Test retrieving execution history."""
+        execution_id = str(uuid.uuid4())
+
+        # Create mock audit records
+        mock_audits = []
+        for i in range(3):
+            audit = MagicMock()
+            audit.lookup_project.name = f"Look-Up {i+1}"
+            audit.status = 'success' if i < 2 else 'failed'
+            mock_audits.append(audit)
+
+        # Setup mock query
+        mock_queryset = MagicMock()
+        mock_queryset.select_related.return_value = mock_queryset
+        mock_queryset.order_by.return_value = mock_queryset
+        mock_queryset.__getitem__.return_value = mock_audits
+        mock_audit_model.objects.filter.return_value = mock_queryset
+
+        # Get history
+        result = audit_logger.get_execution_history(execution_id, limit=10)
+
+        # Verify query
+        mock_audit_model.objects.filter.assert_called_once_with(
+            execution_id=execution_id
+        )
+        mock_queryset.select_related.assert_called_once_with('lookup_project')
+        mock_queryset.order_by.assert_called_once_with('executed_at')
+
+        # Check result
+        assert len(result) == 3
+        assert result[0].status == 'success'
+        assert result[2].status == 'failed'
+
+    @patch('lookup.services.audit_logger.LookupExecutionAudit')
+    def test_get_execution_history_error_handling(
+        self, mock_audit_model, audit_logger
+    ):
+        """Test error handling in get_execution_history."""
+        mock_audit_model.objects.filter.side_effect = Exception("Database error")
+
+        result = audit_logger.get_execution_history('test-id')
+
+        # Should return empty list on error
+        assert result == []
+
+    # ========== Statistics Tests ==========
+
+    @patch('lookup.services.audit_logger.LookupExecutionAudit')
+    def test_get_project_stats(self, mock_audit_model, audit_logger):
+        """Test getting project statistics."""
+        project_id = uuid.uuid4()
+
+        # Create mock audit records
+        mock_audits = []
+
+        # 3 successful executions
+        for i in range(3):
+            audit = MagicMock()
+            audit.status = 'success'
+            audit.execution_time_ms = 1000 + i * 100
+            audit.llm_response_cached = (i == 0)  # First one cached
+            audit.confidence_score = Decimal(f'0.{80 + i}')
+            mock_audits.append(audit)
+
+        # 1 failed execution
+        audit = MagicMock()
+        audit.status = 'failed'
+        audit.execution_time_ms = 500
+        audit.llm_response_cached = False
+        audit.confidence_score = None
+        mock_audits.append(audit)
+
+        # 1 partial execution
+        audit = MagicMock()
+        audit.status = 'partial'
+        audit.execution_time_ms = 800
+        audit.llm_response_cached = False
+        audit.confidence_score = Decimal('0.40')
+        mock_audits.append(audit)
+
+        # Setup mock query
+        mock_queryset = MagicMock()
+        mock_queryset.order_by.return_value = mock_queryset
+        mock_queryset.__getitem__.return_value = mock_audits
+        mock_audit_model.objects.filter.return_value = mock_queryset
+
+        # Get stats
+        stats = audit_logger.get_project_stats(project_id, limit=100)
+
+        # Verify stats
+        assert stats['total_executions'] == 5
+        assert stats['successful'] == 3
+        assert stats['failed'] == 1
+        assert stats['partial'] == 1
+        assert stats['success_rate'] == 0.6  # 3/5
+        assert stats['cache_hit_rate'] == 0.2  # 1/5
+        assert stats['avg_execution_time_ms'] == 880  # (1000+1100+1200+500+800)/5
+        # avg_confidence = (0.80 + 0.81 + 0.82 + 0.40) / 4 = 0.7075
+        assert abs(stats['avg_confidence'] - 0.7075) < 0.001
+
+    @patch('lookup.services.audit_logger.LookupExecutionAudit')
+    def test_get_project_stats_empty(self, mock_audit_model, audit_logger):
+        """Test getting stats for project with no executions."""
+        mock_queryset = MagicMock()
+        mock_queryset.order_by.return_value = mock_queryset
+        mock_queryset.__getitem__.return_value = []
+        mock_audit_model.objects.filter.return_value = mock_queryset
+
+        stats = audit_logger.get_project_stats(uuid.uuid4())
+
+        assert stats['total_executions'] == 0
+        assert stats['success_rate'] == 0.0
+        assert stats['avg_execution_time_ms'] == 0
+        assert stats['cache_hit_rate'] == 0.0
+        assert stats['avg_confidence'] == 0.0
+
+    @patch('lookup.services.audit_logger.LookupExecutionAudit')
+    def test_get_project_stats_error_handling(
+        self, mock_audit_model, audit_logger
+    ):
+        """Test error handling in get_project_stats."""
+        mock_audit_model.objects.filter.side_effect = Exception("Database error")
+
+        stats = audit_logger.get_project_stats(uuid.uuid4())
+
+        # Should return zero stats on error
+        assert stats['total_executions'] == 0
+        assert stats['success_rate'] == 0.0
+
+    # ========== Integration Tests ==========
+
+    @patch('lookup.services.audit_logger.logger')
+    @patch('lookup.services.audit_logger.LookupExecutionAudit')
+    @patch('lookup.services.audit_logger.LookupProject')
+    def test_logging_messages(
+        self, mock_project_model, mock_audit_model, mock_logger,
+        audit_logger, execution_params, mock_project
+    ):
+        """Test that appropriate log messages are generated."""
+        mock_project_model.objects.get.return_value = mock_project
+        mock_audit_instance = MagicMock()
+        mock_audit_instance.id = uuid.uuid4()
+        mock_audit_model.objects.create.return_value = mock_audit_instance
+
+        audit_logger.log_execution(**execution_params)
+
+        # Should log debug message on success
+        mock_logger.debug.assert_called()
+        debug_message = mock_logger.debug.call_args[0][0]
+        assert 'Logged execution audit' in debug_message
+        assert mock_project.name in debug_message
+
+    @patch('lookup.services.audit_logger.logger')
+    @patch('lookup.services.audit_logger.LookupProject')
+    def test_error_logging(
+        self, mock_project_model, mock_logger,
+        audit_logger, execution_params
+    ):
+        """Test that errors are properly logged."""
+        mock_project_model.objects.get.side_effect = Exception("Database connection lost")
+
+        audit_logger.log_execution(**execution_params)
+
+        # Should log exception
+        mock_logger.exception.assert_called()
+        error_message = mock_logger.exception.call_args[0][0]
+        assert 'Failed to log execution audit' in error_message
+
+    def test_real_world_scenario(self, audit_logger):
+        """Test realistic usage scenario with mock objects."""
+        # This would normally require Django test database
+        # For now, just verify the interface works correctly
+
+        execution_id = str(uuid.uuid4())
+        project_id = uuid.uuid4()
+
+        # Log various execution types
+        with patch('lookup.services.audit_logger.AuditLogger.log_execution') as mock_log:
+            mock_log.return_value = MagicMock()
+
+            # Success
+            audit_logger.log_success(
+                execution_id=execution_id,
+                project_id=project_id,
+                input_data={'vendor': 'Slack'},
+                enriched_output={'canonical': 'Slack'},
+                confidence_score=0.95
+            )
+
+            # Failure
+            audit_logger.log_failure(
+                execution_id=execution_id,
+                project_id=project_id,
+                error='Timeout',
+                input_data={'vendor': 'Unknown'}
+            )
+
+            # Partial
+            audit_logger.log_partial(
+                execution_id=execution_id,
+                project_id=project_id,
+                confidence_score=0.30
+            )
+
+            # Verify all three logs were attempted
+            assert mock_log.call_count == 3
diff --git a/backend/lookup/tests/test_services/test_enrichment_merger.py b/backend/lookup/tests/test_services/test_enrichment_merger.py
new file mode 100644
index 0000000000..bed77e2bf7
--- /dev/null
+++ b/backend/lookup/tests/test_services/test_enrichment_merger.py
@@ -0,0 +1,547 @@
+"""
+Tests for Enrichment Merger implementation.
+
+This module tests the EnrichmentMerger class including merging logic,
+conflict resolution, and metadata tracking.
+"""
+
+import uuid
+
+import pytest
+
+from lookup.services.enrichment_merger import EnrichmentMerger
+
+
+class TestEnrichmentMerger:
+    """Test cases for EnrichmentMerger class."""
+
+    @pytest.fixture
+    def merger(self):
+        """Create an EnrichmentMerger instance."""
+        return EnrichmentMerger()
+
+    @pytest.fixture
+    def sample_enrichments(self):
+        """Create sample enrichments for testing."""
+        return [
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'Vendor Matcher',
+                'data': {
+                    'canonical_vendor': 'Slack',
+                    'vendor_category': 'SaaS'
+                },
+                'confidence': 0.95,
+                'execution_time_ms': 1234,
+                'cached': False
+            },
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'Product Classifier',
+                'data': {
+                    'product_type': 'Software',
+                    'license_model': 'Subscription'
+                },
+                'confidence': 0.88,
+                'execution_time_ms': 567,
+                'cached': True
+            }
+        ]
+
+    # ========== No Conflicts Tests ==========
+
+    def test_merge_no_conflicts(self, merger, sample_enrichments):
+        """Test merging enrichments with no overlapping fields."""
+        result = merger.merge(sample_enrichments)
+
+        # Check merged data has all fields
+        assert 'canonical_vendor' in result['data']
+        assert 'vendor_category' in result['data']
+        assert 'product_type' in result['data']
+        assert 'license_model' in result['data']
+
+        # Check values are correct
+        assert result['data']['canonical_vendor'] == 'Slack'
+        assert result['data']['vendor_category'] == 'SaaS'
+        assert result['data']['product_type'] == 'Software'
+        assert result['data']['license_model'] == 'Subscription'
+
+        # Check no conflicts were resolved
+        assert result['conflicts_resolved'] == 0
+
+        # Check enrichment details
+        assert len(result['enrichment_details']) == 2
+        assert result['enrichment_details'][0]['lookup_project_name'] == 'Vendor Matcher'
+        assert result['enrichment_details'][0]['fields_added'] == ['canonical_vendor', 'vendor_category']
+        assert result['enrichment_details'][1]['lookup_project_name'] == 'Product Classifier'
+        assert result['enrichment_details'][1]['fields_added'] == ['product_type', 'license_model']
+
+    def test_merge_empty_enrichments(self, merger):
+        """Test merging empty list of enrichments."""
+        result = merger.merge([])
+
+        assert result['data'] == {}
+        assert result['conflicts_resolved'] == 0
+        assert result['enrichment_details'] == []
+
+    def test_merge_single_enrichment(self, merger):
+        """Test merging with only one enrichment."""
+        enrichment = {
+            'project_id': uuid.uuid4(),
+            'project_name': 'Solo Lookup',
+            'data': {'field1': 'value1', 'field2': 'value2'},
+            'confidence': 0.9,
+            'execution_time_ms': 100,
+            'cached': False
+        }
+
+        result = merger.merge([enrichment])
+
+        assert result['data'] == {'field1': 'value1', 'field2': 'value2'}
+        assert result['conflicts_resolved'] == 0
+        assert len(result['enrichment_details']) == 1
+        assert result['enrichment_details'][0]['fields_added'] == ['field1', 'field2']
+
+    # ========== Confidence-Based Resolution Tests ==========
+
+    def test_higher_confidence_wins(self, merger):
+        """Test that higher confidence value wins in conflict."""
+        enrichments = [
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'Low Confidence',
+                'data': {'category': 'Communication'},
+                'confidence': 0.80,
+                'execution_time_ms': 100,
+                'cached': False
+            },
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'High Confidence',
+                'data': {'category': 'Collaboration'},
+                'confidence': 0.95,
+                'execution_time_ms': 200,
+                'cached': False
+            }
+        ]
+
+        result = merger.merge(enrichments)
+
+        # Higher confidence should win
+        assert result['data']['category'] == 'Collaboration'
+        assert result['conflicts_resolved'] == 1
+
+        # Check which lookup contributed the field
+        details = result['enrichment_details']
+        assert details[0]['fields_added'] == []  # Lost the conflict
+        assert details[1]['fields_added'] == ['category']  # Won the conflict
+
+    def test_equal_confidence_first_wins(self, merger):
+        """Test that first-complete wins when confidence is equal."""
+        enrichments = [
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'First',
+                'data': {'status': 'active'},
+                'confidence': 0.90,
+                'execution_time_ms': 100,
+                'cached': False
+            },
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'Second',
+                'data': {'status': 'inactive'},
+                'confidence': 0.90,  # Same confidence
+                'execution_time_ms': 200,
+                'cached': False
+            }
+        ]
+
+        result = merger.merge(enrichments)
+
+        # First should win (first-complete-wins)
+        assert result['data']['status'] == 'active'
+        assert result['conflicts_resolved'] == 0  # No resolution needed, kept existing
+
+    def test_confidence_beats_no_confidence(self, merger):
+        """Test that enrichment with confidence beats one without."""
+        enrichments = [
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'No Confidence',
+                'data': {'vendor': 'Microsoft'},
+                'confidence': None,
+                'execution_time_ms': 100,
+                'cached': False
+            },
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'Has Confidence',
+                'data': {'vendor': 'Slack'},
+                'confidence': 0.75,
+                'execution_time_ms': 200,
+                'cached': False
+            }
+        ]
+
+        result = merger.merge(enrichments)
+
+        # Confidence should win
+        assert result['data']['vendor'] == 'Slack'
+        assert result['conflicts_resolved'] == 1
+
+    def test_no_confidence_first_wins(self, merger):
+        """Test first-complete wins when neither has confidence."""
+        enrichments = [
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'First No Conf',
+                'data': {'region': 'US'},
+                'confidence': None,
+                'execution_time_ms': 100,
+                'cached': False
+            },
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'Second No Conf',
+                'data': {'region': 'EU'},
+                'confidence': None,
+                'execution_time_ms': 200,
+                'cached': False
+            }
+        ]
+
+        result = merger.merge(enrichments)
+
+        # First should win
+        assert result['data']['region'] == 'US'
+        assert result['conflicts_resolved'] == 0
+
+    # ========== Multiple Conflicts Tests ==========
+
+    def test_multiple_conflicts_same_enrichments(self, merger):
+        """Test resolving multiple field conflicts between same enrichments."""
+        enrichments = [
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'Enrichment A',
+                'data': {
+                    'field1': 'A1',
+                    'field2': 'A2',
+                    'field3': 'A3'
+                },
+                'confidence': 0.70,
+                'execution_time_ms': 100,
+                'cached': False
+            },
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'Enrichment B',
+                'data': {
+                    'field1': 'B1',  # Conflict
+                    'field2': 'B2',  # Conflict
+                    'field4': 'B4'   # No conflict
+                },
+                'confidence': 0.85,
+                'execution_time_ms': 200,
+                'cached': True
+            }
+        ]
+
+        result = merger.merge(enrichments)
+
+        # Higher confidence (B) should win conflicts
+        assert result['data']['field1'] == 'B1'
+        assert result['data']['field2'] == 'B2'
+        assert result['data']['field3'] == 'A3'  # Only from A
+        assert result['data']['field4'] == 'B4'  # Only from B
+
+        assert result['conflicts_resolved'] == 2
+
+    def test_three_way_conflicts(self, merger):
+        """Test resolving conflicts among three enrichments."""
+        enrichments = [
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'First',
+                'data': {'category': 'Cat1', 'type': 'Type1'},
+                'confidence': 0.60,
+                'execution_time_ms': 100,
+                'cached': False
+            },
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'Second',
+                'data': {'category': 'Cat2', 'vendor': 'Vendor2'},
+                'confidence': 0.80,
+                'execution_time_ms': 200,
+                'cached': False
+            },
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'Third',
+                'data': {'category': 'Cat3', 'type': 'Type3'},
+                'confidence': 0.75,
+                'execution_time_ms': 300,
+                'cached': True
+            }
+        ]
+
+        result = merger.merge(enrichments)
+
+        # Second should win category (0.80 confidence)
+        assert result['data']['category'] == 'Cat2'
+        # Third should win type (0.75 > 0.60)
+        assert result['data']['type'] == 'Type3'
+        # Vendor only from Second
+        assert result['data']['vendor'] == 'Vendor2'
+
+        assert result['conflicts_resolved'] == 2  # category and type conflicts
+
+    # ========== Metadata Tracking Tests ==========
+
+    def test_enrichment_details_tracking(self, merger):
+        """Test that enrichment details are correctly tracked."""
+        project_id1 = uuid.uuid4()
+        project_id2 = uuid.uuid4()
+
+        enrichments = [
+            {
+                'project_id': project_id1,
+                'project_name': 'Lookup 1',
+                'data': {'field1': 'value1'},
+                'confidence': 0.9,
+                'execution_time_ms': 1500,
+                'cached': True
+            },
+            {
+                'project_id': project_id2,
+                'project_name': 'Lookup 2',
+                'data': {'field2': 'value2'},
+                'confidence': 0.85,
+                'execution_time_ms': 800,
+                'cached': False
+            }
+        ]
+
+        result = merger.merge(enrichments)
+
+        details = result['enrichment_details']
+        assert len(details) == 2
+
+        # Check first enrichment details
+        assert details[0]['lookup_project_id'] == str(project_id1)
+        assert details[0]['lookup_project_name'] == 'Lookup 1'
+        assert details[0]['confidence'] == 0.9
+        assert details[0]['cached'] is True
+        assert details[0]['execution_time_ms'] == 1500
+        assert details[0]['fields_added'] == ['field1']
+
+        # Check second enrichment details
+        assert details[1]['lookup_project_id'] == str(project_id2)
+        assert details[1]['lookup_project_name'] == 'Lookup 2'
+        assert details[1]['confidence'] == 0.85
+        assert details[1]['cached'] is False
+        assert details[1]['execution_time_ms'] == 800
+        assert details[1]['fields_added'] == ['field2']
+
+    def test_fields_added_with_conflicts(self, merger):
+        """Test fields_added tracking when conflicts are resolved."""
+        enrichments = [
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'Winner',
+                'data': {'shared': 'win_value', 'unique1': 'value1'},
+                'confidence': 0.95,
+                'execution_time_ms': 100,
+                'cached': False
+            },
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'Loser',
+                'data': {'shared': 'lose_value', 'unique2': 'value2'},
+                'confidence': 0.50,
+                'execution_time_ms': 200,
+                'cached': False
+            }
+        ]
+
+        result = merger.merge(enrichments)
+
+        details = result['enrichment_details']
+        # Winner should have both its fields
+        assert 'shared' in details[0]['fields_added']
+        assert 'unique1' in details[0]['fields_added']
+
+        # Loser should only have its unique field
+        assert 'shared' not in details[1]['fields_added']
+        assert 'unique2' in details[1]['fields_added']
+
+    # ========== Edge Cases Tests ==========
+
+    def test_missing_optional_fields(self, merger):
+        """Test handling of enrichments with missing optional fields."""
+        enrichments = [
+            {
+                'project_id': None,  # Missing ID
+                'project_name': 'No ID Lookup',
+                'data': {'field1': 'value1'},
+                # Missing confidence
+                # Missing execution_time_ms
+                # Missing cached
+            },
+            {
+                # Minimal valid enrichment
+                'data': {'field2': 'value2'}
+            }
+        ]
+
+        result = merger.merge(enrichments)
+
+        assert result['data']['field1'] == 'value1'
+        assert result['data']['field2'] == 'value2'
+        assert result['conflicts_resolved'] == 0
+
+        # Check defaults are handled
+        details = result['enrichment_details']
+        assert details[0]['lookup_project_id'] is None
+        assert details[0]['confidence'] is None
+        assert details[0]['execution_time_ms'] == 0  # Default
+        assert details[0]['cached'] is False  # Default
+
+        assert details[1]['lookup_project_name'] == 'Unknown'  # Default
+
+    def test_empty_data_fields(self, merger):
+        """Test handling enrichments with empty data."""
+        enrichments = [
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'Empty Data',
+                'data': {},  # Empty
+                'confidence': 0.9,
+                'execution_time_ms': 100,
+                'cached': False
+            },
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'Has Data',
+                'data': {'field': 'value'},
+                'confidence': 0.8,
+                'execution_time_ms': 200,
+                'cached': False
+            }
+        ]
+
+        result = merger.merge(enrichments)
+
+        assert result['data'] == {'field': 'value'}
+        assert result['conflicts_resolved'] == 0
+        assert result['enrichment_details'][0]['fields_added'] == []
+        assert result['enrichment_details'][1]['fields_added'] == ['field']
+
+    def test_complex_value_types(self, merger):
+        """Test merging with complex value types (lists, dicts)."""
+        enrichments = [
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'Complex Types',
+                'data': {
+                    'tags': ['tag1', 'tag2'],
+                    'metadata': {'key': 'value'},
+                    'count': 42
+                },
+                'confidence': 0.9,
+                'execution_time_ms': 100,
+                'cached': False
+            },
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'More Complex',
+                'data': {
+                    'tags': ['tag3', 'tag4'],  # Conflict - different list
+                    'settings': {'option': True}
+                },
+                'confidence': 0.95,
+                'execution_time_ms': 200,
+                'cached': False
+            }
+        ]
+
+        result = merger.merge(enrichments)
+
+        # Higher confidence wins for tags
+        assert result['data']['tags'] == ['tag3', 'tag4']
+        assert result['data']['metadata'] == {'key': 'value'}
+        assert result['data']['count'] == 42
+        assert result['data']['settings'] == {'option': True}
+        assert result['conflicts_resolved'] == 1
+
+    # ========== Integration Tests ==========
+
+    def test_real_world_scenario(self, merger):
+        """Test a realistic scenario with multiple lookups."""
+        enrichments = [
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'Vendor Standardization',
+                'data': {
+                    'canonical_vendor': 'Slack Technologies',
+                    'vendor_id': 'SLACK-001',
+                    'vendor_category': 'Communication'
+                },
+                'confidence': 0.92,
+                'execution_time_ms': 1200,
+                'cached': False
+            },
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'Product Mapping',
+                'data': {
+                    'product_name': 'Slack Workspace',
+                    'product_sku': 'SLK-WS-ENT',
+                    'vendor_category': 'Collaboration',  # Conflict
+                    'license_type': 'Per User'
+                },
+                'confidence': 0.88,
+                'execution_time_ms': 850,
+                'cached': True
+            },
+            {
+                'project_id': uuid.uuid4(),
+                'project_name': 'Cost Center Assignment',
+                'data': {
+                    'cost_center': 'CC-IT-001',
+                    'department': 'Information Technology',
+                    'budget_category': 'Software'
+                },
+                'confidence': None,  # No confidence score
+                'execution_time_ms': 450,
+                'cached': True
+            }
+        ]
+
+        result = merger.merge(enrichments)
+
+        # Check all fields are present
+        expected_fields = [
+            'canonical_vendor', 'vendor_id', 'vendor_category',
+            'product_name', 'product_sku', 'license_type',
+            'cost_center', 'department', 'budget_category'
+        ]
+        for field in expected_fields:
+            assert field in result['data']
+
+        # vendor_category conflict: 0.92 > 0.88, first wins
+        assert result['data']['vendor_category'] == 'Communication'
+
+        # Should have 1 conflict resolved
+        assert result['conflicts_resolved'] == 1
+
+        # Check enrichment details
+        assert len(result['enrichment_details']) == 3
+        assert result['enrichment_details'][0]['fields_added'] == [
+            'canonical_vendor', 'vendor_id', 'vendor_category'
+        ]
+        # Product mapping lost vendor_category conflict
+        assert 'vendor_category' not in result['enrichment_details'][1]['fields_added']
+        assert 'product_name' in result['enrichment_details'][1]['fields_added']
diff --git a/backend/lookup/tests/test_services/test_llm_cache.py b/backend/lookup/tests/test_services/test_llm_cache.py
new file mode 100644
index 0000000000..422a72dad4
--- /dev/null
+++ b/backend/lookup/tests/test_services/test_llm_cache.py
@@ -0,0 +1,322 @@
+"""
+Tests for LLM Response Cache implementation.
+
+This module tests the LLMResponseCache class including basic operations,
+TTL expiration, cache key generation, and cache management functionality.
+"""
+
+import time
+from unittest.mock import patch
+
+import pytest
+
+from lookup.services.llm_cache import LLMResponseCache
+
+
+class TestLLMResponseCache:
+    """Test cases for LLMResponseCache class."""
+
+    @pytest.fixture
+    def cache(self):
+        """Create a fresh cache instance for each test."""
+        return LLMResponseCache(ttl_hours=1)
+
+    @pytest.fixture
+    def short_ttl_cache(self):
+        """Create cache with very short TTL for expiration testing."""
+        # 0.001 hours = 3.6 seconds
+        return LLMResponseCache(ttl_hours=0.001)
+
+    # ========== Basic Operations Tests ==========
+
+    def test_set_stores_value(self, cache):
+        """Test that set() correctly stores a value."""
+        cache.set("test_key", "test_response")
+        assert "test_key" in cache.cache
+        stored_value, _ = cache.cache["test_key"]
+        assert stored_value == "test_response"
+
+    def test_get_retrieves_stored_value(self, cache):
+        """Test that get() retrieves a stored value."""
+        cache.set("test_key", "test_response")
+        result = cache.get("test_key")
+        assert result == "test_response"
+
+    def test_get_returns_none_for_missing_key(self, cache):
+        """Test that get() returns None for non-existent key."""
+        result = cache.get("nonexistent_key")
+        assert result is None
+
+    def test_set_overwrites_existing_value(self, cache):
+        """Test that set() overwrites existing values."""
+        cache.set("test_key", "first_response")
+        cache.set("test_key", "second_response")
+        result = cache.get("test_key")
+        assert result == "second_response"
+
+    # ========== TTL Expiration Tests ==========
+
+    def test_get_returns_value_before_expiration(self, cache):
+        """Test that get() returns value before TTL expiration."""
+        cache.set("test_key", "test_response")
+        # Should still be valid after immediate retrieval
+        result = cache.get("test_key")
+        assert result == "test_response"
+
+    def test_get_returns_none_after_expiration(self, short_ttl_cache):
+        """Test that get() returns None after TTL expiration."""
+        short_ttl_cache.set("test_key", "test_response")
+        # Wait for expiration (TTL is 3.6 seconds)
+        time.sleep(4)
+        result = short_ttl_cache.get("test_key")
+        assert result is None
+
+    def test_expired_entry_removed_on_access(self, short_ttl_cache):
+        """Test that expired entries are lazily removed on access."""
+        short_ttl_cache.set("test_key", "test_response")
+        assert "test_key" in short_ttl_cache.cache
+
+        # Wait for expiration
+        time.sleep(4)
+        result = short_ttl_cache.get("test_key")
+
+        assert result is None
+        assert "test_key" not in short_ttl_cache.cache
+
+    @patch('time.time')
+    def test_ttl_calculation(self, mock_time, cache):
+        """Test correct TTL calculation using mocked time."""
+        # Set initial time
+        mock_time.return_value = 1000.0
+        cache.set("test_key", "test_response")
+
+        # Verify expiry is set correctly (1 hour = 3600 seconds)
+        _, expiry = cache.cache["test_key"]
+        assert expiry == 4600.0  # 1000 + 3600
+
+        # Move time forward but not past expiry
+        mock_time.return_value = 4599.0
+        assert cache.get("test_key") == "test_response"
+
+        # Move time past expiry
+        mock_time.return_value = 4601.0
+        assert cache.get("test_key") is None
+
+    # ========== Cache Key Generation Tests ==========
+
+    def test_cache_key_generation_deterministic(self, cache):
+        """Test that same inputs generate same cache key."""
+        prompt = "Match vendor {{input_data.vendor}}"
+        ref_data = "Slack\nGoogle\nMicrosoft"
+
+        key1 = cache.generate_cache_key(prompt, ref_data)
+        key2 = cache.generate_cache_key(prompt, ref_data)
+
+        assert key1 == key2
+
+    def test_different_prompt_different_key(self, cache):
+        """Test that different prompts generate different keys."""
+        ref_data = "Slack\nGoogle\nMicrosoft"
+
+        key1 = cache.generate_cache_key("Prompt 1", ref_data)
+        key2 = cache.generate_cache_key("Prompt 2", ref_data)
+
+        assert key1 != key2
+
+    def test_different_ref_data_different_key(self, cache):
+        """Test that different reference data generates different keys."""
+        prompt = "Match vendor {{input_data.vendor}}"
+
+        key1 = cache.generate_cache_key(prompt, "Slack\nGoogle")
+        key2 = cache.generate_cache_key(prompt, "Slack\nMicrosoft")
+
+        assert key1 != key2
+
+    def test_cache_key_is_valid_sha256(self, cache):
+        """Test that cache key is valid SHA256 hex (64 characters)."""
+        key = cache.generate_cache_key("test prompt", "test ref data")
+
+        assert len(key) == 64
+        assert all(c in '0123456789abcdef' for c in key)
+
+    def test_cache_key_handles_unicode(self, cache):
+        """Test cache key generation with Unicode characters."""
+        prompt = "Match vendor: Müller GmbH"
+        ref_data = "Zürich AG\n北京公司\n東京株式会社"
+
+        key = cache.generate_cache_key(prompt, ref_data)
+        assert len(key) == 64
+
+    # ========== Cache Management Tests ==========
+
+    def test_invalidate_removes_specific_key(self, cache):
+        """Test that invalidate() removes specific key."""
+        cache.set("key1", "response1")
+        cache.set("key2", "response2")
+
+        result = cache.invalidate("key1")
+
+        assert result is True
+        assert cache.get("key1") is None
+        assert cache.get("key2") == "response2"
+
+    def test_invalidate_returns_false_for_missing_key(self, cache):
+        """Test that invalidate() returns False for non-existent key."""
+        result = cache.invalidate("nonexistent_key")
+        assert result is False
+
+    def test_invalidate_all_clears_cache(self, cache):
+        """Test that invalidate_all() clears entire cache."""
+        cache.set("key1", "response1")
+        cache.set("key2", "response2")
+        cache.set("key3", "response3")
+
+        count = cache.invalidate_all()
+
+        assert count == 3
+        assert len(cache.cache) == 0
+        assert cache.get("key1") is None
+        assert cache.get("key2") is None
+        assert cache.get("key3") is None
+
+    def test_invalidate_all_returns_zero_for_empty_cache(self, cache):
+        """Test that invalidate_all() returns 0 for empty cache."""
+        count = cache.invalidate_all()
+        assert count == 0
+
+    # ========== Statistics Tests ==========
+
+    def test_get_stats_with_valid_entries(self, cache):
+        """Test get_stats() with all valid entries."""
+        cache.set("key1", "response1")
+        cache.set("key2", "response2")
+
+        stats = cache.get_stats()
+
+        assert stats['total'] == 2
+        assert stats['valid'] == 2
+        assert stats['expired'] == 0
+
+    @patch('time.time')
+    def test_get_stats_with_mixed_entries(self, mock_time, cache):
+        """Test get_stats() with mix of valid and expired entries."""
+        # Set initial time
+        mock_time.return_value = 1000.0
+
+        cache.set("key1", "response1")
+        cache.set("key2", "response2")
+
+        # Manually expire one entry
+        cache.cache["key1"] = ("response1", 999.0)  # Already expired
+
+        stats = cache.get_stats()
+
+        assert stats['total'] == 2
+        assert stats['valid'] == 1
+        assert stats['expired'] == 1
+
+    def test_get_stats_empty_cache(self, cache):
+        """Test get_stats() with empty cache."""
+        stats = cache.get_stats()
+
+        assert stats['total'] == 0
+        assert stats['valid'] == 0
+        assert stats['expired'] == 0
+
+    # ========== Cleanup Tests ==========
+
+    @patch('time.time')
+    def test_cleanup_expired_removes_expired_entries(self, mock_time, cache):
+        """Test cleanup_expired() removes only expired entries."""
+        # Set initial time
+        mock_time.return_value = 1000.0
+
+        cache.set("key1", "response1")
+        cache.set("key2", "response2")
+        cache.set("key3", "response3")
+
+        # Manually expire two entries
+        cache.cache["key1"] = ("response1", 999.0)  # Expired
+        cache.cache["key2"] = ("response2", 999.0)  # Expired
+        # key3 remains valid (expiry at 4600.0)
+
+        removed_count = cache.cleanup_expired()
+
+        assert removed_count == 2
+        assert len(cache.cache) == 1
+        assert "key3" in cache.cache
+        assert "key1" not in cache.cache
+        assert "key2" not in cache.cache
+
+    def test_cleanup_expired_empty_cache(self, cache):
+        """Test cleanup_expired() with empty cache."""
+        removed_count = cache.cleanup_expired()
+        assert removed_count == 0
+
+    def test_cleanup_expired_no_expired_entries(self, cache):
+        """Test cleanup_expired() when no entries are expired."""
+        cache.set("key1", "response1")
+        cache.set("key2", "response2")
+
+        removed_count = cache.cleanup_expired()
+
+        assert removed_count == 0
+        assert len(cache.cache) == 2
+
+    # ========== Integration Tests ==========
+
+    def test_end_to_end_caching_workflow(self, cache):
+        """Test complete caching workflow."""
+        # Generate cache key
+        prompt = "Match vendor Slack India"
+        ref_data = "Slack\nGoogle\nMicrosoft"
+        cache_key = cache.generate_cache_key(prompt, ref_data)
+
+        # Initially no cached value
+        assert cache.get(cache_key) is None
+
+        # Store response
+        llm_response = '{"canonical_vendor": "Slack", "confidence": 0.92}'
+        cache.set(cache_key, llm_response)
+
+        # Retrieve cached value
+        cached = cache.get(cache_key)
+        assert cached == llm_response
+
+        # Check stats
+        stats = cache.get_stats()
+        assert stats['valid'] == 1
+
+        # Invalidate
+        removed = cache.invalidate(cache_key)
+        assert removed is True
+        assert cache.get(cache_key) is None
+
+    def test_concurrent_operations(self, cache):
+        """Test cache handles multiple operations correctly."""
+        # Add multiple entries
+        for i in range(10):
+            key = f"key_{i}"
+            response = f"response_{i}"
+            cache.set(key, response)
+
+        # Verify all entries exist
+        for i in range(10):
+            key = f"key_{i}"
+            assert cache.get(key) == f"response_{i}"
+
+        # Invalidate some entries
+        for i in range(0, 10, 2):  # Even indices
+            cache.invalidate(f"key_{i}")
+
+        # Verify correct entries remain
+        for i in range(10):
+            key = f"key_{i}"
+            if i % 2 == 0:
+                assert cache.get(key) is None
+            else:
+                assert cache.get(key) == f"response_{i}"
+
+        # Clear all
+        count = cache.invalidate_all()
+        assert count == 5  # Only odd indices remained
diff --git a/backend/lookup/tests/test_services/test_lookup_executor.py b/backend/lookup/tests/test_services/test_lookup_executor.py
new file mode 100644
index 0000000000..a8b663caba
--- /dev/null
+++ b/backend/lookup/tests/test_services/test_lookup_executor.py
@@ -0,0 +1,418 @@
+"""
+Tests for Look-Up Executor implementation.
+
+This module tests the LookUpExecutor class including execution flow,
+caching, error handling, and response parsing.
+"""
+
+import json
+import uuid
+from unittest.mock import MagicMock, Mock, patch
+
+import pytest
+
+from lookup.exceptions import (
+    ExtractionNotCompleteError,
+    ParseError,
+)
+from lookup.services.lookup_executor import LookUpExecutor
+
+
+class TestLookUpExecutor:
+    """Test cases for LookUpExecutor class."""
+
+    @pytest.fixture
+    def mock_variable_resolver(self):
+        """Create a mock VariableResolver class."""
+        mock_class = Mock()
+        mock_instance = Mock()
+        mock_instance.resolve.return_value = "Resolved prompt text"
+        mock_class.return_value = mock_instance
+        return mock_class
+
+    @pytest.fixture
+    def mock_cache(self):
+        """Create a mock LLMResponseCache."""
+        cache = MagicMock()
+        cache.generate_cache_key.return_value = "cache_key_123"
+        cache.get.return_value = None  # Default to cache miss
+        return cache
+
+    @pytest.fixture
+    def mock_ref_loader(self):
+        """Create a mock ReferenceDataLoader."""
+        loader = MagicMock()
+        loader.load_latest_for_project.return_value = {
+            'version': 1,
+            'content': "Reference data content",
+            'files': [],
+            'total_size': 1000
+        }
+        return loader
+
+    @pytest.fixture
+    def mock_llm_client(self):
+        """Create a mock LLM client."""
+        client = MagicMock()
+        client.generate.return_value = '{"canonical_vendor": "Slack", "confidence": 0.92}'
+        return client
+
+    @pytest.fixture
+    def mock_project(self):
+        """Create a mock LookupProject."""
+        project = MagicMock()
+        project.id = uuid.uuid4()
+        project.name = "Test Look-Up"
+        project.llm_config = {'temperature': 0.7}
+
+        # Create mock template
+        template = MagicMock()
+        template.template_text = "Match {{input_data.vendor}} with {{reference_data}}"
+        project.template = template
+
+        return project
+
+    @pytest.fixture
+    def executor(self, mock_variable_resolver, mock_cache, mock_ref_loader, mock_llm_client):
+        """Create a LookUpExecutor instance with mocked dependencies."""
+        return LookUpExecutor(
+            variable_resolver=mock_variable_resolver,
+            cache_manager=mock_cache,
+            reference_loader=mock_ref_loader,
+            llm_client=mock_llm_client
+        )
+
+    @pytest.fixture
+    def sample_input_data(self):
+        """Create sample input data."""
+        return {
+            'vendor': 'Slack India Pvt Ltd',
+            'invoice_amount': 5000
+        }
+
+    # ========== Successful Execution Tests ==========
+
+    def test_successful_execution(self, executor, mock_project, sample_input_data,
+                                 mock_variable_resolver, mock_cache, mock_llm_client):
+        """Test complete successful execution flow."""
+        result = executor.execute(mock_project, sample_input_data)
+
+        # Check success
+        assert result['status'] == 'success'
+        assert result['project_id'] == mock_project.id
+        assert result['project_name'] == 'Test Look-Up'
+
+        # Check enrichment data
+        assert result['data'] == {'canonical_vendor': 'Slack'}
+        assert result['confidence'] == 0.92
+        assert result['cached'] is False
+        assert result['execution_time_ms'] > 0
+
+        # Verify variable resolver was called
+        mock_variable_resolver.assert_called_once_with(
+            sample_input_data, "Reference data content"
+        )
+        mock_variable_resolver.return_value.resolve.assert_called_once_with(
+            "Match {{input_data.vendor}} with {{reference_data}}"
+        )
+
+        # Verify cache was checked and set
+        mock_cache.get.assert_called_once_with("cache_key_123")
+        mock_cache.set.assert_called_once_with(
+            "cache_key_123",
+            '{"canonical_vendor": "Slack", "confidence": 0.92}'
+        )
+
+        # Verify LLM was called
+        mock_llm_client.generate.assert_called_once_with(
+            "Resolved prompt text",
+            {'temperature': 0.7}
+        )
+
+    def test_confidence_extraction(self, executor, mock_project, sample_input_data,
+                                  mock_llm_client):
+        """Test confidence score extraction from response."""
+        mock_llm_client.generate.return_value = '{"field": "value", "confidence": 0.85}'
+
+        result = executor.execute(mock_project, sample_input_data)
+
+        assert result['status'] == 'success'
+        assert result['confidence'] == 0.85
+        assert result['data'] == {'field': 'value'}
+
+    def test_no_confidence_in_response(self, executor, mock_project, sample_input_data,
+                                      mock_llm_client):
+        """Test handling response without confidence score."""
+        mock_llm_client.generate.return_value = '{"field": "value"}'
+
+        result = executor.execute(mock_project, sample_input_data)
+
+        assert result['status'] == 'success'
+        assert result['confidence'] is None
+        assert result['data'] == {'field': 'value'}
+
+    # ========== Cache Tests ==========
+
+    def test_cache_hit(self, executor, mock_project, sample_input_data,
+                       mock_cache, mock_llm_client):
+        """Test execution with cache hit."""
+        # Set up cache hit
+        mock_cache.get.return_value = '{"cached_field": "cached_value", "confidence": 0.88}'
+
+        result = executor.execute(mock_project, sample_input_data)
+
+        # Check result
+        assert result['status'] == 'success'
+        assert result['data'] == {'cached_field': 'cached_value'}
+        assert result['confidence'] == 0.88
+        assert result['cached'] is True
+        assert result['execution_time_ms'] == 0
+
+        # Verify LLM was NOT called
+        mock_llm_client.generate.assert_not_called()
+
+        # Verify cache.set was NOT called
+        mock_cache.set.assert_not_called()
+
+    def test_cache_miss(self, executor, mock_project, sample_input_data,
+                       mock_cache, mock_llm_client):
+        """Test execution with cache miss."""
+        # Cache miss (default setup)
+        mock_cache.get.return_value = None
+
+        result = executor.execute(mock_project, sample_input_data)
+
+        assert result['status'] == 'success'
+        assert result['cached'] is False
+
+        # Verify LLM was called
+        mock_llm_client.generate.assert_called_once()
+
+        # Verify result was cached
+        mock_cache.set.assert_called_once()
+
+    # ========== Error Handling Tests ==========
+
+    def test_reference_data_not_ready(self, executor, mock_project, sample_input_data,
+                                     mock_ref_loader):
+        """Test handling of incomplete extraction."""
+        mock_ref_loader.load_latest_for_project.side_effect = ExtractionNotCompleteError(
+            ['file1.csv', 'file2.txt']
+        )
+
+        result = executor.execute(mock_project, sample_input_data)
+
+        assert result['status'] == 'failed'
+        assert 'Reference data extraction not complete' in result['error']
+        assert 'file1.csv' in result['error']
+        assert 'file2.txt' in result['error']
+
+    def test_missing_template(self, executor, mock_project, sample_input_data):
+        """Test handling of missing template."""
+        mock_project.template = None
+
+        result = executor.execute(mock_project, sample_input_data)
+
+        assert result['status'] == 'failed'
+        assert 'Missing prompt template' in result['error']
+
+    def test_llm_timeout(self, executor, mock_project, sample_input_data, mock_llm_client):
+        """Test handling of LLM timeout."""
+        mock_llm_client.generate.side_effect = TimeoutError("Request timed out after 30s")
+
+        result = executor.execute(mock_project, sample_input_data)
+
+        assert result['status'] == 'failed'
+        assert 'LLM request timed out' in result['error']
+        assert '30s' in result['error']
+
+    def test_llm_generic_error(self, executor, mock_project, sample_input_data,
+                              mock_llm_client):
+        """Test handling of generic LLM errors."""
+        mock_llm_client.generate.side_effect = Exception("API key invalid")
+
+        result = executor.execute(mock_project, sample_input_data)
+
+        assert result['status'] == 'failed'
+        assert 'LLM request failed' in result['error']
+        assert 'API key invalid' in result['error']
+
+    def test_parse_error_invalid_json(self, executor, mock_project, sample_input_data,
+                                     mock_llm_client):
+        """Test handling of invalid JSON response."""
+        mock_llm_client.generate.return_value = "Not valid JSON"
+
+        result = executor.execute(mock_project, sample_input_data)
+
+        assert result['status'] == 'failed'
+        assert 'Failed to parse LLM response' in result['error']
+
+    def test_parse_error_not_object(self, executor, mock_project, sample_input_data,
+                                   mock_llm_client):
+        """Test handling of non-object JSON response."""
+        mock_llm_client.generate.return_value = '["array", "not", "object"]'
+
+        result = executor.execute(mock_project, sample_input_data)
+
+        assert result['status'] == 'failed'
+        assert 'Failed to parse LLM response' in result['error']
+
+    def test_reference_loader_error(self, executor, mock_project, sample_input_data,
+                                   mock_ref_loader):
+        """Test handling of reference loader errors."""
+        mock_ref_loader.load_latest_for_project.side_effect = Exception("Storage unavailable")
+
+        result = executor.execute(mock_project, sample_input_data)
+
+        assert result['status'] == 'failed'
+        assert 'Failed to load reference data' in result['error']
+        assert 'Storage unavailable' in result['error']
+
+    # ========== Variable Resolution Tests ==========
+
+    def test_variable_resolution(self, executor, mock_project, sample_input_data,
+                                mock_variable_resolver):
+        """Test that variables are correctly resolved."""
+        result = executor.execute(mock_project, sample_input_data)
+
+        # Verify resolver was instantiated with correct data
+        mock_variable_resolver.assert_called_once_with(
+            sample_input_data,
+            "Reference data content"
+        )
+
+        # Verify resolve was called with template
+        mock_variable_resolver.return_value.resolve.assert_called_once_with(
+            "Match {{input_data.vendor}} with {{reference_data}}"
+        )
+
+    # ========== Response Parsing Tests ==========
+
+    def test_parse_llm_response_with_confidence(self, executor):
+        """Test parsing response with confidence score."""
+        response = '{"field1": "value1", "field2": "value2", "confidence": 0.95}'
+
+        data, confidence = executor._parse_llm_response(response)
+
+        assert data == {'field1': 'value1', 'field2': 'value2'}
+        assert confidence == 0.95
+
+    def test_parse_llm_response_without_confidence(self, executor):
+        """Test parsing response without confidence score."""
+        response = '{"field1": "value1", "field2": "value2"}'
+
+        data, confidence = executor._parse_llm_response(response)
+
+        assert data == {'field1': 'value1', 'field2': 'value2'}
+        assert confidence is None
+
+    def test_parse_llm_response_invalid_confidence(self, executor):
+        """Test handling of invalid confidence values."""
+        # Confidence outside range (should be clamped)
+        response = '{"field": "value", "confidence": 1.5}'
+
+        with patch('lookup.services.lookup_executor.logger') as mock_logger:
+            data, confidence = executor._parse_llm_response(response)
+
+            assert data == {'field': 'value'}
+            assert confidence == 1.0  # Clamped to max
+            mock_logger.warning.assert_called()
+
+    def test_parse_llm_response_non_numeric_confidence(self, executor):
+        """Test handling of non-numeric confidence."""
+        response = '{"field": "value", "confidence": "high"}'
+
+        with patch('lookup.services.lookup_executor.logger') as mock_logger:
+            data, confidence = executor._parse_llm_response(response)
+
+            assert data == {'field': 'value'}
+            assert confidence is None
+            mock_logger.warning.assert_called()
+
+    def test_parse_llm_response_invalid_json(self, executor):
+        """Test parsing invalid JSON raises ParseError."""
+        response = "This is not JSON"
+
+        with pytest.raises(ParseError) as exc_info:
+            executor._parse_llm_response(response)
+
+        assert "Invalid JSON response" in str(exc_info.value)
+
+    # ========== Integration Tests ==========
+
+    def test_end_to_end_execution(self, executor, mock_project, sample_input_data):
+        """Test complete execution flow with realistic data."""
+        result = executor.execute(mock_project, sample_input_data)
+
+        # Basic assertions
+        assert result['status'] == 'success'
+        assert 'data' in result
+        assert 'confidence' in result
+        assert 'cached' in result
+        assert 'execution_time_ms' in result
+
+    def test_execution_with_empty_input(self, executor, mock_project):
+        """Test execution with empty input data."""
+        result = executor.execute(mock_project, {})
+
+        # Should still execute successfully
+        assert result['status'] == 'success'
+
+    def test_execution_time_tracking(self, executor, mock_project, sample_input_data,
+                                    mock_llm_client):
+        """Test that execution time is properly tracked."""
+        # Add a small delay to LLM call
+        def delayed_generate(*args, **kwargs):
+            import time
+            time.sleep(0.01)  # 10ms delay
+            return '{"result": "data"}'
+
+        mock_llm_client.generate.side_effect = delayed_generate
+
+        result = executor.execute(mock_project, sample_input_data)
+
+        assert result['status'] == 'success'
+        assert result['execution_time_ms'] >= 10  # At least 10ms
+
+    def test_failed_execution_time_tracking(self, executor, mock_project, sample_input_data,
+                                          mock_llm_client):
+        """Test that execution time is tracked even on failure."""
+        mock_llm_client.generate.side_effect = Exception("Error")
+
+        result = executor.execute(mock_project, sample_input_data)
+
+        assert result['status'] == 'failed'
+        assert result['execution_time_ms'] >= 0
+
+    @patch('lookup.services.lookup_executor.logger')
+    def test_unexpected_error_logging(self, mock_logger, executor, mock_project,
+                                     sample_input_data):
+        """Test that unexpected errors are logged."""
+        # Create an error that will trigger the catch-all
+        mock_project.template.template_text = None  # Will cause AttributeError
+
+        result = executor.execute(mock_project, sample_input_data)
+
+        assert result['status'] == 'failed'
+        assert 'Unexpected error' in result['error']
+        mock_logger.exception.assert_called()
+
+    def test_complex_llm_response(self, executor, mock_project, sample_input_data,
+                                 mock_llm_client):
+        """Test handling of complex nested LLM response."""
+        complex_response = json.dumps({
+            "vendor": {
+                "canonical_name": "Slack Technologies",
+                "id": "SLACK-001"
+            },
+            "categories": ["Communication", "SaaS"],
+            "confidence": 0.88
+        })
+        mock_llm_client.generate.return_value = complex_response
+
+        result = executor.execute(mock_project, sample_input_data)
+
+        assert result['status'] == 'success'
+        assert result['data']['vendor']['canonical_name'] == 'Slack Technologies'
+        assert result['data']['categories'] == ['Communication', 'SaaS']
+        assert result['confidence'] == 0.88
diff --git a/backend/lookup/tests/test_services/test_lookup_orchestrator.py b/backend/lookup/tests/test_services/test_lookup_orchestrator.py
new file mode 100644
index 0000000000..f1031ef4bc
--- /dev/null
+++ b/backend/lookup/tests/test_services/test_lookup_orchestrator.py
@@ -0,0 +1,521 @@
+"""
+Tests for Look-Up Orchestrator implementation.
+
+This module tests the LookUpOrchestrator class including parallel execution,
+timeout handling, result merging, and error recovery.
+"""
+
+import time
+import uuid
+from concurrent.futures import TimeoutError as FutureTimeoutError
+from unittest.mock import MagicMock, patch
+
+import pytest
+
+from lookup.services.lookup_orchestrator import LookUpOrchestrator
+
+
+class TestLookUpOrchestrator:
+    """Test cases for LookUpOrchestrator class."""
+
+    @pytest.fixture
+    def mock_executor(self):
+        """Create a mock LookUpExecutor."""
+        executor = MagicMock()
+        # Default to successful execution
+        executor.execute.return_value = {
+            'status': 'success',
+            'project_id': uuid.uuid4(),
+            'project_name': 'Test Look-Up',
+            'data': {'field': 'value'},
+            'confidence': 0.9,
+            'cached': False,
+            'execution_time_ms': 100
+        }
+        return executor
+
+    @pytest.fixture
+    def mock_merger(self):
+        """Create a mock EnrichmentMerger."""
+        merger = MagicMock()
+        merger.merge.return_value = {
+            'data': {'merged_field': 'merged_value'},
+            'conflicts_resolved': 0,
+            'enrichment_details': []
+        }
+        return merger
+
+    @pytest.fixture
+    def config(self):
+        """Create test configuration."""
+        return {
+            'max_concurrent_executions': 5,
+            'queue_timeout_seconds': 10,
+            'execution_timeout_seconds': 2
+        }
+
+    @pytest.fixture
+    def orchestrator(self, mock_executor, mock_merger, config):
+        """Create a LookUpOrchestrator with mocked dependencies."""
+        return LookUpOrchestrator(
+            executor=mock_executor,
+            merger=mock_merger,
+            config=config
+        )
+
+    @pytest.fixture
+    def sample_input_data(self):
+        """Create sample input data."""
+        return {
+            'vendor': 'Slack Technologies',
+            'amount': 5000
+        }
+
+    @pytest.fixture
+    def mock_projects(self):
+        """Create mock Look-Up projects."""
+        projects = []
+        for i in range(3):
+            project = MagicMock()
+            project.id = uuid.uuid4()
+            project.name = f"Look-Up {i+1}"
+            projects.append(project)
+        return projects
+
+    # ========== Basic Execution Tests ==========
+
+    def test_successful_parallel_execution(
+        self, orchestrator, sample_input_data, mock_projects,
+        mock_executor, mock_merger
+    ):
+        """Test successful parallel execution of multiple Look-Ups."""
+        # Setup executor to return different data for each project
+        def execute_side_effect(project, input_data):
+            return {
+                'status': 'success',
+                'project_id': project.id,
+                'project_name': project.name,
+                'data': {f'field_{project.name}': 'value'},
+                'confidence': 0.9,
+                'cached': False,
+                'execution_time_ms': 100
+            }
+
+        mock_executor.execute.side_effect = execute_side_effect
+
+        # Execute
+        result = orchestrator.execute_lookups(sample_input_data, mock_projects)
+
+        # Verify execution
+        assert mock_executor.execute.call_count == 3
+        assert mock_merger.merge.call_count == 1
+
+        # Check metadata
+        metadata = result['_lookup_metadata']
+        assert metadata['lookups_executed'] == 3
+        assert metadata['lookups_successful'] == 3
+        assert metadata['lookups_failed'] == 0
+        assert 'execution_id' in metadata
+        assert 'executed_at' in metadata
+        assert metadata['total_execution_time_ms'] > 0
+
+    def test_empty_projects_list(self, orchestrator, sample_input_data):
+        """Test execution with empty projects list."""
+        result = orchestrator.execute_lookups(sample_input_data, [])
+
+        assert result['lookup_enrichment'] == {}
+        metadata = result['_lookup_metadata']
+        assert metadata['lookups_executed'] == 0
+        assert metadata['lookups_successful'] == 0
+        assert metadata['lookups_failed'] == 0
+        assert metadata['enrichments'] == []
+
+    def test_single_project_execution(
+        self, orchestrator, sample_input_data, mock_executor
+    ):
+        """Test execution with single Look-Up project."""
+        project = MagicMock()
+        project.id = uuid.uuid4()
+        project.name = "Single Look-Up"
+
+        result = orchestrator.execute_lookups(sample_input_data, [project])
+
+        assert mock_executor.execute.call_count == 1
+        metadata = result['_lookup_metadata']
+        assert metadata['lookups_executed'] == 1
+        assert metadata['lookups_successful'] == 1
+
+    # ========== Failure Handling Tests ==========
+
+    def test_partial_failures(
+        self, orchestrator, sample_input_data, mock_projects,
+        mock_executor, mock_merger
+    ):
+        """Test handling of partial failures."""
+        # Setup: First succeeds, second fails, third succeeds
+        def execute_side_effect(project, input_data):
+            if project.name == "Look-Up 2":
+                return {
+                    'status': 'failed',
+                    'project_id': project.id,
+                    'project_name': project.name,
+                    'error': 'Test error',
+                    'execution_time_ms': 50,
+                    'cached': False
+                }
+            return {
+                'status': 'success',
+                'project_id': project.id,
+                'project_name': project.name,
+                'data': {'field': 'value'},
+                'confidence': 0.9,
+                'cached': False,
+                'execution_time_ms': 100
+            }
+
+        mock_executor.execute.side_effect = execute_side_effect
+
+        result = orchestrator.execute_lookups(sample_input_data, mock_projects)
+
+        # Check results
+        metadata = result['_lookup_metadata']
+        assert metadata['lookups_executed'] == 3
+        assert metadata['lookups_successful'] == 2
+        assert metadata['lookups_failed'] == 1
+
+        # Verify merger was called with only successful enrichments
+        merge_call_args = mock_merger.merge.call_args[0][0]
+        assert len(merge_call_args) == 2  # Only successful ones
+
+    def test_all_failures(
+        self, orchestrator, sample_input_data, mock_projects,
+        mock_executor, mock_merger
+    ):
+        """Test handling when all Look-Ups fail."""
+        mock_executor.execute.return_value = {
+            'status': 'failed',
+            'project_id': uuid.uuid4(),
+            'project_name': 'Failed Look-Up',
+            'error': 'Test error',
+            'execution_time_ms': 50,
+            'cached': False
+        }
+
+        result = orchestrator.execute_lookups(sample_input_data, mock_projects)
+
+        # Check results
+        assert result['lookup_enrichment'] == {}  # Empty merged data
+        metadata = result['_lookup_metadata']
+        assert metadata['lookups_successful'] == 0
+        assert metadata['lookups_failed'] == 3
+        assert metadata['conflicts_resolved'] == 0
+
+    # ========== Timeout Tests ==========
+
+    @patch('lookup.services.lookup_orchestrator.ThreadPoolExecutor')
+    def test_individual_execution_timeout(
+        self, mock_executor_class, orchestrator, sample_input_data,
+        mock_projects
+    ):
+        """Test handling of individual execution timeouts."""
+        # Setup mock executor
+        mock_thread_executor = MagicMock()
+        mock_executor_class.return_value.__enter__.return_value = mock_thread_executor
+
+        # Create futures that will timeout
+        future1 = MagicMock()
+        future1.result.side_effect = FutureTimeoutError()
+
+        future2 = MagicMock()
+        future2.result.return_value = {
+            'status': 'success',
+            'project_id': mock_projects[1].id,
+            'project_name': mock_projects[1].name,
+            'data': {'field': 'value'},
+            'confidence': 0.9,
+            'cached': False,
+            'execution_time_ms': 100
+        }
+
+        # Setup as_completed to return futures
+        with patch('lookup.services.lookup_orchestrator.as_completed') as mock_as_completed:
+            mock_as_completed.return_value = [future1, future2]
+
+            # Setup submit to return futures
+            mock_thread_executor.submit.side_effect = [future1, future2, MagicMock()]
+
+            result = orchestrator.execute_lookups(sample_input_data, mock_projects[:2])
+
+            metadata = result['_lookup_metadata']
+            # One timeout (failed), one success
+            assert metadata['lookups_failed'] >= 1
+            assert metadata['lookups_successful'] >= 1
+
+    @patch('lookup.services.lookup_orchestrator.as_completed')
+    def test_queue_timeout(
+        self, mock_as_completed, orchestrator, sample_input_data,
+        mock_projects
+    ):
+        """Test handling of overall queue timeout."""
+        # Make as_completed raise TimeoutError
+        mock_as_completed.side_effect = FutureTimeoutError()
+
+        result = orchestrator.execute_lookups(sample_input_data, mock_projects)
+
+        metadata = result['_lookup_metadata']
+        assert metadata['lookups_executed'] == 3
+        assert metadata['lookups_successful'] == 0
+        assert metadata['lookups_failed'] == 3  # All marked as failed due to queue timeout
+
+    # ========== Concurrency Tests ==========
+
+    def test_max_concurrent_limit(
+        self, mock_executor, mock_merger, sample_input_data
+    ):
+        """Test that max concurrent executions limit is respected."""
+        # Create orchestrator with low concurrency limit
+        config = {'max_concurrent_executions': 2}
+        orchestrator = LookUpOrchestrator(mock_executor, mock_merger, config)
+
+        # Create many projects
+        projects = []
+        for i in range(10):
+            project = MagicMock()
+            project.id = uuid.uuid4()
+            project.name = f"Look-Up {i+1}"
+            projects.append(project)
+
+        # Add small delay to executor to simulate work
+        def slow_execute(project, input_data):
+            time.sleep(0.01)  # Small delay
+            return {
+                'status': 'success',
+                'project_id': project.id,
+                'project_name': project.name,
+                'data': {'field': 'value'},
+                'confidence': 0.9,
+                'cached': False,
+                'execution_time_ms': 10
+            }
+
+        mock_executor.execute.side_effect = slow_execute
+
+        # Execute
+        result = orchestrator.execute_lookups(sample_input_data, projects)
+
+        # Should complete successfully despite concurrency limit
+        metadata = result['_lookup_metadata']
+        assert metadata['lookups_executed'] == 10
+        assert metadata['lookups_successful'] == 10
+
+    # ========== Result Merging Tests ==========
+
+    def test_successful_merge(
+        self, orchestrator, sample_input_data, mock_projects,
+        mock_executor, mock_merger
+    ):
+        """Test that successful enrichments are properly merged."""
+        # Setup merger to return specific merged data
+        mock_merger.merge.return_value = {
+            'data': {
+                'vendor': 'Slack',
+                'category': 'SaaS',
+                'type': 'Communication'
+            },
+            'conflicts_resolved': 2,
+            'enrichment_details': [
+                {'lookup_project_name': 'Look-Up 1', 'fields_added': ['vendor']},
+                {'lookup_project_name': 'Look-Up 2', 'fields_added': ['category']},
+                {'lookup_project_name': 'Look-Up 3', 'fields_added': ['type']}
+            ]
+        }
+
+        result = orchestrator.execute_lookups(sample_input_data, mock_projects)
+
+        # Check merged enrichment
+        assert result['lookup_enrichment'] == {
+            'vendor': 'Slack',
+            'category': 'SaaS',
+            'type': 'Communication'
+        }
+
+        # Check metadata
+        metadata = result['_lookup_metadata']
+        assert metadata['conflicts_resolved'] == 2
+
+    # ========== Error Recovery Tests ==========
+
+    def test_executor_exception_handling(
+        self, orchestrator, sample_input_data, mock_projects,
+        mock_executor
+    ):
+        """Test handling of unexpected exceptions from executor."""
+        # Make executor raise exception for one project
+        def execute_with_exception(project, input_data):
+            if project.name == "Look-Up 2":
+                raise ValueError("Unexpected error in executor")
+            return {
+                'status': 'success',
+                'project_id': project.id,
+                'project_name': project.name,
+                'data': {'field': 'value'},
+                'confidence': 0.9,
+                'cached': False,
+                'execution_time_ms': 100
+            }
+
+        mock_executor.execute.side_effect = execute_with_exception
+
+        result = orchestrator.execute_lookups(sample_input_data, mock_projects)
+
+        # Should handle exception gracefully
+        metadata = result['_lookup_metadata']
+        assert metadata['lookups_executed'] == 3
+        assert metadata['lookups_successful'] == 2
+        assert metadata['lookups_failed'] == 1
+
+        # Check that error is captured
+        failed_enrichment = next(
+            e for e in metadata['enrichments']
+            if e['status'] == 'failed' and 'Unexpected error' in e['error']
+        )
+        assert failed_enrichment is not None
+
+    # ========== Metadata Tests ==========
+
+    def test_execution_metadata(
+        self, orchestrator, sample_input_data, mock_projects
+    ):
+        """Test that execution metadata is properly populated."""
+        result = orchestrator.execute_lookups(sample_input_data, mock_projects)
+
+        metadata = result['_lookup_metadata']
+
+        # Check all required metadata fields
+        assert 'execution_id' in metadata
+        assert isinstance(metadata['execution_id'], str)
+        assert len(metadata['execution_id']) == 36  # UUID format
+
+        assert 'executed_at' in metadata
+        assert 'T' in metadata['executed_at']  # ISO8601 format
+
+        assert 'total_execution_time_ms' in metadata
+        assert metadata['total_execution_time_ms'] >= 0
+
+        assert 'enrichments' in metadata
+        assert len(metadata['enrichments']) >= metadata['lookups_successful']
+
+    def test_enrichments_list_includes_all_results(
+        self, orchestrator, sample_input_data, mock_projects,
+        mock_executor
+    ):
+        """Test that enrichments list includes both successful and failed results."""
+        # Setup mixed results
+        def execute_side_effect(project, input_data):
+            if project.name == "Look-Up 2":
+                return {
+                    'status': 'failed',
+                    'project_id': project.id,
+                    'project_name': project.name,
+                    'error': 'Test failure',
+                    'execution_time_ms': 50,
+                    'cached': False
+                }
+            return {
+                'status': 'success',
+                'project_id': project.id,
+                'project_name': project.name,
+                'data': {'field': 'value'},
+                'confidence': 0.9,
+                'cached': False,
+                'execution_time_ms': 100
+            }
+
+        mock_executor.execute.side_effect = execute_side_effect
+
+        result = orchestrator.execute_lookups(sample_input_data, mock_projects)
+
+        metadata = result['_lookup_metadata']
+        enrichments = metadata['enrichments']
+
+        # Should have all 3 enrichments (2 success + 1 failed)
+        assert len(enrichments) == 3
+
+        # Check statuses
+        statuses = [e['status'] for e in enrichments]
+        assert statuses.count('success') == 2
+        assert statuses.count('failed') == 1
+
+    # ========== Configuration Tests ==========
+
+    def test_default_configuration(self, mock_executor, mock_merger):
+        """Test orchestrator with default configuration."""
+        orchestrator = LookUpOrchestrator(mock_executor, mock_merger)
+
+        assert orchestrator.max_concurrent == 10
+        assert orchestrator.queue_timeout == 120
+        assert orchestrator.execution_timeout == 30
+
+    def test_custom_configuration(self, mock_executor, mock_merger):
+        """Test orchestrator with custom configuration."""
+        config = {
+            'max_concurrent_executions': 20,
+            'queue_timeout_seconds': 300,
+            'execution_timeout_seconds': 60
+        }
+
+        orchestrator = LookUpOrchestrator(mock_executor, mock_merger, config)
+
+        assert orchestrator.max_concurrent == 20
+        assert orchestrator.queue_timeout == 300
+        assert orchestrator.execution_timeout == 60
+
+    # ========== Integration Tests ==========
+
+    @patch('lookup.services.lookup_orchestrator.logger')
+    def test_logging(
+        self, mock_logger, orchestrator, sample_input_data,
+        mock_projects
+    ):
+        """Test that appropriate logging is performed."""
+        orchestrator.execute_lookups(sample_input_data, mock_projects)
+
+        # Should log start and completion
+        assert mock_logger.info.call_count >= 2
+        start_log = mock_logger.info.call_args_list[0][0][0]
+        assert 'Starting orchestrated execution' in start_log
+
+        completion_log = mock_logger.info.call_args_list[-1][0][0]
+        assert 'completed' in completion_log
+
+    def test_execution_id_propagation(
+        self, orchestrator, sample_input_data, mock_projects,
+        mock_executor
+    ):
+        """Test that execution ID is propagated to individual executions."""
+        # Capture execution results
+        captured_results = []
+
+        def capture_execute(project, input_data):
+            result = {
+                'status': 'success',
+                'project_id': project.id,
+                'project_name': project.name,
+                'data': {'field': 'value'},
+                'confidence': 0.9,
+                'cached': False,
+                'execution_time_ms': 100
+            }
+            captured_results.append(result)
+            return result
+
+        mock_executor.execute.side_effect = capture_execute
+
+        result = orchestrator.execute_lookups(sample_input_data, mock_projects)
+
+        execution_id = result['_lookup_metadata']['execution_id']
+
+        # Check that execution_id is added to enrichments
+        for enrichment in result['_lookup_metadata']['enrichments']:
+            if 'execution_id' in enrichment:
+                assert enrichment['execution_id'] == execution_id
diff --git a/backend/lookup/tests/test_services/test_reference_data_loader.py b/backend/lookup/tests/test_services/test_reference_data_loader.py
new file mode 100644
index 0000000000..6e3e84490d
--- /dev/null
+++ b/backend/lookup/tests/test_services/test_reference_data_loader.py
@@ -0,0 +1,565 @@
+"""
+Tests for Reference Data Loader implementation.
+
+This module tests the ReferenceDataLoader class including loading latest/specific
+versions, concatenation, and extraction validation.
+"""
+
+import uuid
+from datetime import datetime, timezone
+from unittest.mock import MagicMock, Mock
+
+import pytest
+from django.contrib.auth import get_user_model
+
+from lookup.exceptions import ExtractionNotCompleteError
+from lookup.models import LookupDataSource, LookupProject
+from lookup.services.reference_data_loader import ReferenceDataLoader
+
+User = get_user_model()
+
+
+@pytest.mark.django_db
+class TestReferenceDataLoader:
+    """Test cases for ReferenceDataLoader class."""
+
+    @pytest.fixture
+    def mock_storage(self):
+        """Create a mock storage client."""
+        storage = MagicMock()
+        storage.get = Mock(return_value="Default content")
+        return storage
+
+    @pytest.fixture
+    def loader(self, mock_storage):
+        """Create a ReferenceDataLoader instance with mock storage."""
+        return ReferenceDataLoader(mock_storage)
+
+    @pytest.fixture
+    def test_user(self):
+        """Create a test user."""
+        return User.objects.create_user(
+            username='testuser',
+            email='test@example.com',
+            password='testpass123'
+        )
+
+    @pytest.fixture
+    def test_project(self, test_user):
+        """Create a test Look-Up project."""
+        return LookupProject.objects.create(
+            name="Test Project",
+            description="Test project for loader",
+            lookup_type='static_data',
+            llm_provider='openai',
+            llm_model='gpt-4',
+            llm_config={'temperature': 0.7},
+            organization_id=uuid.uuid4(),
+            created_by=test_user
+        )
+
+    @pytest.fixture
+    def data_sources_completed(self, test_project, test_user):
+        """Create 3 completed data sources for testing."""
+        sources = []
+        for i in range(3):
+            source = LookupDataSource.objects.create(
+                project=test_project,
+                file_name=f"file{i+1}.csv",
+                file_path=f"uploads/file{i+1}.csv",
+                file_size=1000 * (i + 1),
+                file_type="text/csv",
+                extracted_content_path=f"extracted/file{i+1}.txt",
+                extraction_status='completed',
+                version_number=1,
+                is_latest=True,
+                uploaded_by=test_user
+            )
+            sources.append(source)
+        return sources
+
+    # ========== Load Latest Tests ==========
+
+    def test_load_latest_success(self, loader, mock_storage, test_project,
+                                 data_sources_completed):
+        """Test successful loading of latest reference data."""
+        # Setup mock storage responses
+        def storage_get(path):
+            if 'file1' in path:
+                return "Content from file 1"
+            elif 'file2' in path:
+                return "Content from file 2"
+            elif 'file3' in path:
+                return "Content from file 3"
+            return "Unknown file"
+
+        mock_storage.get.side_effect = storage_get
+
+        # Load latest data
+        result = loader.load_latest_for_project(test_project.id)
+
+        # Verify result structure
+        assert 'version' in result
+        assert 'content' in result
+        assert 'files' in result
+        assert 'total_size' in result
+
+        # Check version
+        assert result['version'] == 1
+
+        # Check concatenated content
+        expected_content = (
+            "=== File: file1.csv ===\n\n"
+            "Content from file 1\n\n"
+            "=== File: file2.csv ===\n\n"
+            "Content from file 2\n\n"
+            "=== File: file3.csv ===\n\n"
+            "Content from file 3"
+        )
+        assert result['content'] == expected_content
+
+        # Check files metadata
+        assert len(result['files']) == 3
+        assert result['files'][0]['name'] == 'file1.csv'
+        assert result['files'][1]['name'] == 'file2.csv'
+        assert result['files'][2]['name'] == 'file3.csv'
+
+        # Check total size
+        assert result['total_size'] == 6000  # 1000 + 2000 + 3000
+
+        # Verify storage was called for each file
+        assert mock_storage.get.call_count == 3
+
+    def test_load_latest_incomplete_extraction(self, loader, test_project,
+                                              test_user):
+        """Test loading fails when extraction is incomplete."""
+        # Create sources with mixed status
+        LookupDataSource.objects.create(
+            project=test_project,
+            file_name="completed.csv",
+            file_path="uploads/completed.csv",
+            file_size=1000,
+            file_type="text/csv",
+            extraction_status='completed',
+            version_number=1,
+            is_latest=True,
+            uploaded_by=test_user
+        )
+
+        LookupDataSource.objects.create(
+            project=test_project,
+            file_name="pending.csv",
+            file_path="uploads/pending.csv",
+            file_size=2000,
+            file_type="text/csv",
+            extraction_status='pending',
+            version_number=1,
+            is_latest=True,
+            uploaded_by=test_user
+        )
+
+        LookupDataSource.objects.create(
+            project=test_project,
+            file_name="failed.csv",
+            file_path="uploads/failed.csv",
+            file_size=3000,
+            file_type="text/csv",
+            extraction_status='failed',
+            extraction_error='Parse error',
+            version_number=1,
+            is_latest=True,
+            uploaded_by=test_user
+        )
+
+        # Attempt to load should raise exception
+        with pytest.raises(ExtractionNotCompleteError) as exc_info:
+            loader.load_latest_for_project(test_project.id)
+
+        # Check error message includes failed files
+        assert 'pending.csv' in str(exc_info.value)
+        assert 'failed.csv' in str(exc_info.value)
+        assert exc_info.value.failed_files == ['pending.csv', 'failed.csv']
+
+    def test_load_latest_no_data_sources(self, loader):
+        """Test loading when no data sources exist."""
+        non_existent_id = uuid.uuid4()
+
+        with pytest.raises(LookupDataSource.DoesNotExist) as exc_info:
+            loader.load_latest_for_project(non_existent_id)
+
+        assert str(non_existent_id) in str(exc_info.value)
+
+    def test_load_latest_order_by_upload(self, loader, mock_storage, test_project,
+                                        test_user):
+        """Test that files are concatenated in upload order."""
+        # Create sources with specific creation times
+        source1 = LookupDataSource.objects.create(
+            project=test_project,
+            file_name="third.csv",  # Named third but uploaded first
+            file_path="uploads/third.csv",
+            file_size=1000,
+            file_type="text/csv",
+            extracted_content_path="extracted/third.txt",
+            extraction_status='completed',
+            version_number=1,
+            is_latest=True,
+            uploaded_by=test_user
+        )
+        source1.created_at = datetime(2024, 1, 1, 10, 0, tzinfo=timezone.utc)
+        source1.save()
+
+        source2 = LookupDataSource.objects.create(
+            project=test_project,
+            file_name="first.csv",  # Named first but uploaded second
+            file_path="uploads/first.csv",
+            file_size=2000,
+            file_type="text/csv",
+            extracted_content_path="extracted/first.txt",
+            extraction_status='completed',
+            version_number=1,
+            is_latest=True,
+            uploaded_by=test_user
+        )
+        source2.created_at = datetime(2024, 1, 1, 11, 0, tzinfo=timezone.utc)
+        source2.save()
+
+        def storage_get(path):
+            if 'third' in path:
+                return "Third content"
+            elif 'first' in path:
+                return "First content"
+            return "Unknown"
+
+        mock_storage.get.side_effect = storage_get
+
+        result = loader.load_latest_for_project(test_project.id)
+
+        # Verify order is by upload time, not name
+        assert "=== File: third.csv ===" in result['content']
+        assert "=== File: first.csv ===" in result['content']
+        assert result['content'].index('third.csv') < result['content'].index('first.csv')
+
+    # ========== Load Specific Version Tests ==========
+
+    def test_load_specific_version(self, loader, mock_storage, test_project,
+                                  test_user):
+        """Test loading a specific version of reference data."""
+        # Create multiple versions
+        # Version 1
+        LookupDataSource.objects.create(
+            project=test_project,
+            file_name="v1_file.csv",
+            file_path="uploads/v1_file.csv",
+            file_size=1000,
+            file_type="text/csv",
+            extracted_content_path="extracted/v1_file.txt",
+            extraction_status='completed',
+            version_number=1,
+            is_latest=False,
+            uploaded_by=test_user
+        )
+
+        # Version 2
+        LookupDataSource.objects.create(
+            project=test_project,
+            file_name="v2_file.csv",
+            file_path="uploads/v2_file.csv",
+            file_size=2000,
+            file_type="text/csv",
+            extracted_content_path="extracted/v2_file.txt",
+            extraction_status='completed',
+            version_number=2,
+            is_latest=False,
+            uploaded_by=test_user
+        )
+
+        # Version 3 (latest)
+        LookupDataSource.objects.create(
+            project=test_project,
+            file_name="v3_file.csv",
+            file_path="uploads/v3_file.csv",
+            file_size=3000,
+            file_type="text/csv",
+            extracted_content_path="extracted/v3_file.txt",
+            extraction_status='completed',
+            version_number=3,
+            is_latest=True,
+            uploaded_by=test_user
+        )
+
+        def storage_get(path):
+            if 'v1' in path:
+                return "Version 1 content"
+            elif 'v2' in path:
+                return "Version 2 content"
+            elif 'v3' in path:
+                return "Version 3 content"
+            return "Unknown"
+
+        mock_storage.get.side_effect = storage_get
+
+        # Load version 2
+        result = loader.load_specific_version(test_project.id, 2)
+
+        assert result['version'] == 2
+        assert "Version 2 content" in result['content']
+        assert "v2_file.csv" in result['content']
+        assert result['files'][0]['name'] == 'v2_file.csv'
+
+        # Load version 1
+        result = loader.load_specific_version(test_project.id, 1)
+
+        assert result['version'] == 1
+        assert "Version 1 content" in result['content']
+        assert "v1_file.csv" in result['content']
+
+    def test_load_specific_version_not_found(self, loader, test_project):
+        """Test loading non-existent version."""
+        with pytest.raises(LookupDataSource.DoesNotExist) as exc_info:
+            loader.load_specific_version(test_project.id, 999)
+
+        assert "Version 999 not found" in str(exc_info.value)
+
+    # ========== Concatenation Tests ==========
+
+    def test_concatenate_sources(self, loader, mock_storage, data_sources_completed):
+        """Test concatenation of multiple sources."""
+        def storage_get(path):
+            if 'file1' in path:
+                return "Alpha content"
+            elif 'file2' in path:
+                return "Beta content"
+            elif 'file3' in path:
+                return "Gamma content"
+            return "Unknown"
+
+        mock_storage.get.side_effect = storage_get
+
+        result = loader.concatenate_sources(data_sources_completed)
+
+        # Check all files are included with headers
+        assert "=== File: file1.csv ===" in result
+        assert "=== File: file2.csv ===" in result
+        assert "=== File: file3.csv ===" in result
+
+        # Check all content is included
+        assert "Alpha content" in result
+        assert "Beta content" in result
+        assert "Gamma content" in result
+
+        # Check double newline separators
+        assert "\n\n" in result
+
+    def test_concatenate_with_missing_path(self, loader, test_project, test_user):
+        """Test concatenation when extracted_content_path is missing."""
+        source = LookupDataSource.objects.create(
+            project=test_project,
+            file_name="no_path.csv",
+            file_path="uploads/no_path.csv",
+            file_size=1000,
+            file_type="text/csv",
+            extracted_content_path=None,  # No extracted path
+            extraction_status='completed',  # But marked as completed
+            version_number=1,
+            is_latest=True,
+            uploaded_by=test_user
+        )
+
+        result = loader.concatenate_sources([source])
+
+        assert "=== File: no_path.csv ===" in result
+        assert "[No extracted content path]" in result
+
+    def test_concatenate_with_storage_error(self, loader, mock_storage,
+                                           data_sources_completed):
+        """Test concatenation handles storage errors gracefully."""
+        mock_storage.get.side_effect = Exception("Storage unavailable")
+
+        result = loader.concatenate_sources(data_sources_completed)
+
+        # Should include error messages instead of content
+        assert "[Error loading file: Storage unavailable]" in result
+        # But should still have file headers
+        assert "=== File: file1.csv ===" in result
+
+    # ========== Validation Tests ==========
+
+    def test_validate_extraction_complete_all_success(self, loader,
+                                                     data_sources_completed):
+        """Test validation when all extractions are complete."""
+        is_complete, failed_files = loader.validate_extraction_complete(
+            data_sources_completed
+        )
+
+        assert is_complete is True
+        assert failed_files == []
+
+    def test_validate_extraction_with_failures(self, loader, test_project, test_user):
+        """Test validation identifies incomplete extractions."""
+        sources = []
+
+        # Completed
+        sources.append(LookupDataSource.objects.create(
+            project=test_project,
+            file_name="good.csv",
+            file_path="uploads/good.csv",
+            file_size=1000,
+            file_type="text/csv",
+            extraction_status='completed',
+            version_number=1,
+            is_latest=True,
+            uploaded_by=test_user
+        ))
+
+        # Pending
+        sources.append(LookupDataSource.objects.create(
+            project=test_project,
+            file_name="pending.csv",
+            file_path="uploads/pending.csv",
+            file_size=2000,
+            file_type="text/csv",
+            extraction_status='pending',
+            version_number=1,
+            is_latest=True,
+            uploaded_by=test_user
+        ))
+
+        # Processing
+        sources.append(LookupDataSource.objects.create(
+            project=test_project,
+            file_name="processing.csv",
+            file_path="uploads/processing.csv",
+            file_size=3000,
+            file_type="text/csv",
+            extraction_status='processing',
+            version_number=1,
+            is_latest=True,
+            uploaded_by=test_user
+        ))
+
+        # Failed
+        sources.append(LookupDataSource.objects.create(
+            project=test_project,
+            file_name="failed.csv",
+            file_path="uploads/failed.csv",
+            file_size=4000,
+            file_type="text/csv",
+            extraction_status='failed',
+            version_number=1,
+            is_latest=True,
+            uploaded_by=test_user
+        ))
+
+        is_complete, failed_files = loader.validate_extraction_complete(sources)
+
+        assert is_complete is False
+        assert len(failed_files) == 3
+        assert 'pending.csv' in failed_files
+        assert 'processing.csv' in failed_files
+        assert 'failed.csv' in failed_files
+        assert 'good.csv' not in failed_files
+
+    # ========== Integration Tests ==========
+
+    def test_end_to_end_multi_file_loading(self, loader, mock_storage, test_project,
+                                          test_user):
+        """Test complete workflow with multiple files and versions."""
+        # Create version 1 with 2 files
+        v1_file1 = LookupDataSource.objects.create(
+            project=test_project,
+            file_name="vendors_v1.csv",
+            file_path="uploads/vendors_v1.csv",
+            file_size=5000,
+            file_type="text/csv",
+            extracted_content_path="extracted/vendors_v1.txt",
+            extraction_status='completed',
+            version_number=1,
+            is_latest=False,
+            uploaded_by=test_user
+        )
+
+        v1_file2 = LookupDataSource.objects.create(
+            project=test_project,
+            file_name="products_v1.csv",
+            file_path="uploads/products_v1.csv",
+            file_size=3000,
+            file_type="text/csv",
+            extracted_content_path="extracted/products_v1.txt",
+            extraction_status='completed',
+            version_number=1,
+            is_latest=False,
+            uploaded_by=test_user
+        )
+
+        # Create version 2 with 3 files (latest)
+        v2_file1 = LookupDataSource.objects.create(
+            project=test_project,
+            file_name="vendors_v2.csv",
+            file_path="uploads/vendors_v2.csv",
+            file_size=6000,
+            file_type="text/csv",
+            extracted_content_path="extracted/vendors_v2.txt",
+            extraction_status='completed',
+            version_number=2,
+            is_latest=True,
+            uploaded_by=test_user
+        )
+
+        v2_file2 = LookupDataSource.objects.create(
+            project=test_project,
+            file_name="products_v2.csv",
+            file_path="uploads/products_v2.csv",
+            file_size=4000,
+            file_type="text/csv",
+            extracted_content_path="extracted/products_v2.txt",
+            extraction_status='completed',
+            version_number=2,
+            is_latest=True,
+            uploaded_by=test_user
+        )
+
+        v2_file3 = LookupDataSource.objects.create(
+            project=test_project,
+            file_name="categories.csv",
+            file_path="uploads/categories.csv",
+            file_size=2000,
+            file_type="text/csv",
+            extracted_content_path="extracted/categories.txt",
+            extraction_status='completed',
+            version_number=2,
+            is_latest=True,
+            uploaded_by=test_user
+        )
+
+        def storage_get(path):
+            content_map = {
+                'vendors_v1': "Slack\nMicrosoft",
+                'products_v1': "Slack Workspace\nTeams",
+                'vendors_v2': "Slack\nMicrosoft\nGoogle",
+                'products_v2': "Slack Workspace\nTeams\nGoogle Workspace",
+                'categories': "Communication\nProductivity"
+            }
+            for key, value in content_map.items():
+                if key in path:
+                    return value
+            return "Unknown content"
+
+        mock_storage.get.side_effect = storage_get
+
+        # Load latest (v2)
+        latest_result = loader.load_latest_for_project(test_project.id)
+
+        assert latest_result['version'] == 2
+        assert len(latest_result['files']) == 3
+        assert latest_result['total_size'] == 12000  # 6000 + 4000 + 2000
+        assert "Google" in latest_result['content']
+        assert "categories.csv" in latest_result['content']
+
+        # Load specific version (v1)
+        v1_result = loader.load_specific_version(test_project.id, 1)
+
+        assert v1_result['version'] == 1
+        assert len(v1_result['files']) == 2
+        assert v1_result['total_size'] == 8000  # 5000 + 3000
+        assert "Google" not in v1_result['content']  # v1 doesn't have Google
+        assert "categories" not in v1_result['content']  # v1 doesn't have categories
diff --git a/backend/lookup/tests/test_variable_resolver.py b/backend/lookup/tests/test_variable_resolver.py
new file mode 100644
index 0000000000..826f961b10
--- /dev/null
+++ b/backend/lookup/tests/test_variable_resolver.py
@@ -0,0 +1,289 @@
+"""Tests for the VariableResolver class."""
+
+import json
+import pytest
+from lookup.services.variable_resolver import VariableResolver
+
+
+class TestVariableResolver:
+    """Test suite for VariableResolver."""
+
+    @pytest.fixture
+    def sample_input_data(self):
+        """Sample input data for testing."""
+        return {
+            "vendor_name": "Slack India Pvt Ltd",
+            "contract_value": 50000,
+            "contract_date": "2024-01-15",
+            "line_items": [
+                {"product": "Slack Pro", "quantity": 100, "price": 500}
+            ],
+            "metadata": {
+                "region": "APAC",
+                "currency": "INR"
+            },
+            "none_field": None
+        }
+
+    @pytest.fixture
+    def sample_reference_data(self):
+        """Sample reference data for testing."""
+        return """Canonical Vendors:
+- Slack (variations: Slack Inc, Slack India, Slack Singapore)
+- Microsoft (variations: Microsoft Corp, MSFT)
+- Google (variations: Google LLC, Google India)"""
+
+    @pytest.fixture
+    def resolver(self, sample_input_data, sample_reference_data):
+        """Create a VariableResolver instance for testing."""
+        return VariableResolver(sample_input_data, sample_reference_data)
+
+    # ==========================================================================
+    # Basic Resolution Tests
+    # ==========================================================================
+
+    def test_simple_variable_replacement(self, resolver):
+        """Test simple variable replacement."""
+        template = "Vendor: {{input_data.vendor_name}}"
+        result = resolver.resolve(template)
+        assert result == "Vendor: Slack India Pvt Ltd"
+
+    def test_reference_data_replacement(self, resolver):
+        """Test reference data replacement."""
+        template = "Database: {{reference_data}}"
+        result = resolver.resolve(template)
+        assert "Canonical Vendors" in result
+        assert "Slack" in result
+
+    def test_multiple_variables(self, resolver):
+        """Test multiple variable replacements in one template."""
+        template = "Match {{input_data.vendor_name}} from {{reference_data}}"
+        result = resolver.resolve(template)
+        assert "Slack India Pvt Ltd" in result
+        assert "Canonical Vendors" in result
+
+    # ==========================================================================
+    # Dot Notation Tests
+    # ==========================================================================
+
+    def test_one_level_dot_notation(self, resolver):
+        """Test one level dot notation."""
+        template = "Value: {{input_data.contract_value}}"
+        result = resolver.resolve(template)
+        assert result == "Value: 50000"
+
+    def test_two_level_dot_notation(self, resolver):
+        """Test two level dot notation."""
+        template = "Region: {{input_data.metadata.region}}"
+        result = resolver.resolve(template)
+        assert result == "Region: APAC"
+
+    def test_array_indexing(self, resolver):
+        """Test array indexing with dot notation."""
+        template = "Product: {{input_data.line_items.0.product}}"
+        result = resolver.resolve(template)
+        assert result == "Product: Slack Pro"
+
+    def test_deep_nesting(self, resolver):
+        """Test deep nested path resolution."""
+        template = "Price: {{input_data.line_items.0.price}}"
+        result = resolver.resolve(template)
+        assert result == "Price: 500"
+
+    # ==========================================================================
+    # Complex Object Serialization Tests
+    # ==========================================================================
+
+    def test_dict_serialization(self, resolver):
+        """Test that dicts are serialized to JSON."""
+        template = "Metadata: {{input_data.metadata}}"
+        result = resolver.resolve(template)
+        # Parse the JSON portion to verify it's valid
+        json_str = result.replace("Metadata: ", "")
+        parsed = json.loads(json_str)
+        assert parsed["region"] == "APAC"
+        assert parsed["currency"] == "INR"
+
+    def test_list_serialization(self, resolver):
+        """Test that lists are serialized to JSON."""
+        template = "Items: {{input_data.line_items}}"
+        result = resolver.resolve(template)
+        # Parse the JSON portion to verify it's valid
+        json_str = result.replace("Items: ", "")
+        parsed = json.loads(json_str)
+        assert len(parsed) == 1
+        assert parsed[0]["product"] == "Slack Pro"
+
+    def test_full_input_serialization(self, resolver):
+        """Test serializing the entire input_data object."""
+        template = "Full data: {{input_data}}"
+        result = resolver.resolve(template)
+        # Should contain JSON representation
+        assert '"vendor_name"' in result
+        assert '"contract_value"' in result
+
+    # ==========================================================================
+    # Missing Value Tests
+    # ==========================================================================
+
+    def test_missing_root_variable(self, resolver):
+        """Test missing root variable returns empty string."""
+        template = "Missing: {{missing_data}}"
+        result = resolver.resolve(template)
+        assert result == "Missing: "
+
+    def test_missing_nested_field(self, resolver):
+        """Test missing nested field returns empty string."""
+        template = "Missing: {{input_data.missing.field}}"
+        result = resolver.resolve(template)
+        assert result == "Missing: "
+
+    def test_partial_path_missing(self, resolver):
+        """Test partially missing path returns empty string."""
+        template = "Missing: {{input_data.metadata.missing}}"
+        result = resolver.resolve(template)
+        assert result == "Missing: "
+
+    def test_none_value(self, resolver):
+        """Test that None values are converted to empty string."""
+        template = "None field: {{input_data.none_field}}"
+        result = resolver.resolve(template)
+        assert result == "None field: "
+
+    def test_out_of_bounds_array_index(self, resolver):
+        """Test out of bounds array index returns empty string."""
+        template = "Missing: {{input_data.line_items.999.product}}"
+        result = resolver.resolve(template)
+        assert result == "Missing: "
+
+    # ==========================================================================
+    # Edge Cases Tests
+    # ==========================================================================
+
+    def test_empty_template(self, resolver):
+        """Test empty template returns empty string."""
+        assert resolver.resolve("") == ""
+
+    def test_no_variables(self, resolver):
+        """Test template without variables returns unchanged."""
+        template = "Plain text without variables"
+        assert resolver.resolve(template) == template
+
+    def test_malformed_variable(self, resolver):
+        """Test malformed variable syntax is left unchanged."""
+        template = "Malformed: {{unclosed"
+        result = resolver.resolve(template)
+        assert result == "Malformed: {{unclosed"
+
+    def test_whitespace_in_variable(self, resolver):
+        """Test variables with whitespace are handled correctly."""
+        template = "Vendor: {{ input_data.vendor_name }}"
+        result = resolver.resolve(template)
+        assert result == "Vendor: Slack India Pvt Ltd"
+
+    def test_empty_braces(self, resolver):
+        """Test empty braces are handled."""
+        template = "Empty: {{}}"
+        result = resolver.resolve(template)
+        assert result == "Empty: "
+
+    # ==========================================================================
+    # Variable Detection Tests
+    # ==========================================================================
+
+    def test_detect_single_variable(self, resolver):
+        """Test detecting a single variable."""
+        template = "{{input_data.vendor_name}}"
+        variables = resolver.detect_variables(template)
+        assert variables == ["input_data.vendor_name"]
+
+    def test_detect_multiple_variables(self, resolver):
+        """Test detecting multiple variables."""
+        template = "{{input_data.vendor_name}} and {{reference_data}}"
+        variables = resolver.detect_variables(template)
+        assert set(variables) == {"input_data.vendor_name", "reference_data"}
+
+    def test_detect_duplicate_variables(self, resolver):
+        """Test that duplicate variables are deduplicated."""
+        template = "{{var}} and {{var}} and {{var}}"
+        variables = resolver.detect_variables(template)
+        assert variables == ["var"]
+
+    def test_detect_no_variables(self, resolver):
+        """Test detecting no variables in plain text."""
+        template = "Plain text without variables"
+        variables = resolver.detect_variables(template)
+        assert variables == []
+
+    def test_detect_variables_with_whitespace(self, resolver):
+        """Test detecting variables with whitespace."""
+        template = "{{ input_data.vendor }} and {{reference_data}}"
+        variables = resolver.detect_variables(template)
+        assert set(variables) == {"input_data.vendor", "reference_data"}
+
+    # ==========================================================================
+    # Variable Validation Tests
+    # ==========================================================================
+
+    def test_validate_existing_variables(self, resolver):
+        """Test validation of existing variables."""
+        template = "{{input_data.vendor_name}} and {{reference_data}}"
+        validation = resolver.validate_variables(template)
+        assert validation["input_data.vendor_name"] is True
+        assert validation["reference_data"] is True
+
+    def test_validate_missing_variables(self, resolver):
+        """Test validation of missing variables."""
+        template = "{{input_data.missing}} and {{nonexistent}}"
+        validation = resolver.validate_variables(template)
+        assert validation["input_data.missing"] is False
+        assert validation["nonexistent"] is False
+
+    def test_get_missing_variables(self, resolver):
+        """Test getting list of missing variables."""
+        template = "{{input_data.vendor_name}} {{missing}} {{input_data.nope}}"
+        missing = resolver.get_missing_variables(template)
+        assert set(missing) == {"missing", "input_data.nope"}
+
+    # ==========================================================================
+    # Integration Tests
+    # ==========================================================================
+
+    def test_complete_vendor_matching_template(self, resolver):
+        """Test complete vendor matching template from spec."""
+        template = """Match vendor "{{input_data.vendor_name}}" from:
+{{reference_data}}
+
+Contract value: {{input_data.contract_value}}
+Region: {{input_data.metadata.region}}"""
+
+        result = resolver.resolve(template)
+
+        # Verify all variables were replaced correctly
+        assert "Slack India Pvt Ltd" in result
+        assert "Canonical Vendors" in result
+        assert "50000" in result
+        assert "APAC" in result
+        assert "{{" not in result  # No unresolved variables
+
+    def test_complex_nested_template(self, resolver):
+        """Test complex template with various variable types."""
+        template = """Input Summary:
+- Vendor: {{input_data.vendor_name}}
+- Date: {{input_data.contract_date}}
+- First Item: {{input_data.line_items.0.product}}
+- Metadata: {{input_data.metadata}}
+- Missing: {{input_data.nonexistent}}
+
+Reference Database:
+{{reference_data}}"""
+
+        result = resolver.resolve(template)
+
+        # Verify each part
+        assert "Slack India Pvt Ltd" in result
+        assert "2024-01-15" in result
+        assert "Slack Pro" in result
+        assert '"region": "APAC"' in result  # JSON serialized
+        assert "Missing: \n" in result  # Empty for missing field
+        assert "Canonical Vendors" in result
diff --git a/backend/lookup/urls.py b/backend/lookup/urls.py
new file mode 100644
index 0000000000..bc30dfa21d
--- /dev/null
+++ b/backend/lookup/urls.py
@@ -0,0 +1,34 @@
+"""URL configuration for Look-Up API endpoints."""
+
+from django.urls import include, path
+from rest_framework.routers import DefaultRouter
+
+from .views import (
+    LookupDataSourceViewSet,
+    LookupDebugView,
+    LookupExecutionAuditViewSet,
+    LookupProfileManagerViewSet,
+    LookupProjectViewSet,
+    LookupPromptTemplateViewSet,
+    PromptStudioLookupLinkViewSet,
+)
+
+# Create router for viewsets
+router = DefaultRouter()
+router.register(r"lookup-projects", LookupProjectViewSet, basename="lookupproject")
+router.register(
+    r"lookup-templates", LookupPromptTemplateViewSet, basename="lookuptemplate"
+)
+router.register(r"lookup-profiles", LookupProfileManagerViewSet, basename="lookupprofile")
+router.register(r"data-sources", LookupDataSourceViewSet, basename="lookupdatasource")
+router.register(r"lookup-links", PromptStudioLookupLinkViewSet, basename="lookuplink")
+router.register(
+    r"execution-audits", LookupExecutionAuditViewSet, basename="executionaudit"
+)
+router.register(r"lookup-debug", LookupDebugView, basename="lookupdebug")
+
+app_name = "lookup"
+
+urlpatterns = [
+    path("", include(router.urls)),
+]
diff --git a/backend/lookup/views.py b/backend/lookup/views.py
new file mode 100644
index 0000000000..de6311f4f2
--- /dev/null
+++ b/backend/lookup/views.py
@@ -0,0 +1,924 @@
+"""Django REST Framework views for Look-Up API.
+
+This module provides RESTful API endpoints for managing Look-Up projects,
+templates, reference data, and executing Look-Ups.
+"""
+
+import logging
+import uuid
+
+from account_v2.custom_exceptions import DuplicateData
+from django.db import IntegrityError, transaction
+from permissions.permission import IsOwner
+from rest_framework import status, viewsets
+from rest_framework.decorators import action
+from rest_framework.parsers import MultiPartParser
+from rest_framework.permissions import IsAuthenticated
+from rest_framework.response import Response
+from rest_framework.versioning import URLPathVersioning
+from utils.filtering import FilterHelper
+from utils.pagination import CustomPagination
+
+from .constants import LookupProfileManagerErrors, LookupProfileManagerKeys
+from .exceptions import ExtractionNotCompleteError
+from .models import (
+    LookupDataSource,
+    LookupExecutionAudit,
+    LookupProfileManager,
+    LookupProject,
+    LookupPromptTemplate,
+    PromptStudioLookupLink,
+)
+from .serializers import (
+    BulkLinkSerializer,
+    LookupDataSourceSerializer,
+    LookupExecutionAuditSerializer,
+    LookupExecutionRequestSerializer,
+    LookupExecutionResponseSerializer,
+    LookupProfileManagerSerializer,
+    LookupProjectSerializer,
+    LookupPromptTemplateSerializer,
+    PromptStudioLookupLinkSerializer,
+    ReferenceDataUploadSerializer,
+    TemplateValidationSerializer,
+)
+from .services import (
+    AuditLogger,
+    EnrichmentMerger,
+    LLMResponseCache,
+    LookUpExecutor,
+    LookUpOrchestrator,
+    ReferenceDataLoader,
+    VariableResolver,
+)
+
+logger = logging.getLogger(__name__)
+
+
+class LookupProjectViewSet(viewsets.ModelViewSet):
+    """ViewSet for managing Look-Up projects.
+
+    Provides CRUD operations and additional actions for
+    executing Look-Ups and managing reference data.
+    """
+
+    queryset = LookupProject.objects.all()
+    serializer_class = LookupProjectSerializer
+    permission_classes = [IsAuthenticated]
+    pagination_class = CustomPagination
+
+    def get_queryset(self):
+        """Filter projects by organization and active status."""
+        # Note: Organization filtering is handled automatically by
+        # DefaultOrganizationMixin's save() method and queryset filtering
+        # should be handled by a custom manager if needed (like Prompt Studio)
+        queryset = super().get_queryset()
+
+        # Filter by active status if requested
+        is_active = self.request.query_params.get("is_active")
+        if is_active is not None:
+            queryset = queryset.filter(is_active=is_active.lower() == "true")
+
+        return queryset.select_related("template")
+
+    def perform_create(self, serializer):
+        """Set created_by from request."""
+        # Note: organization is set automatically by DefaultOrganizationMixin's save() method
+        serializer.save(created_by=self.request.user)
+
+    @action(detail=True, methods=["post"])
+    def execute(self, request, pk=None):
+        """Execute a Look-Up project with provided input data.
+
+        POST /api/v1/lookup-projects/{id}/execute/
+        """
+        project = self.get_object()
+
+        # Validate request
+        request_serializer = LookupExecutionRequestSerializer(data=request.data)
+        request_serializer.is_valid(raise_exception=True)
+
+        input_data = request_serializer.validated_data["input_data"]
+        use_cache = request_serializer.validated_data["use_cache"]
+        timeout = request_serializer.validated_data["timeout_seconds"]
+
+        try:
+            # Get the LLM adapter from Lookup profile
+            from .integrations.file_storage_client import FileStorageClient
+            from .integrations.unstract_llm_client import UnstractLLMClient
+
+            # Get profile for this project
+            profile = LookupProfileManager.objects.filter(lookup_project=project).first()
+
+            if not profile or not profile.llm:
+                return Response(
+                    {"error": "No LLM profile configured for this Look-Up project"},
+                    status=status.HTTP_400_BAD_REQUEST,
+                )
+
+            # Create real LLM client using the profile's adapter
+            llm_client = UnstractLLMClient(profile.llm)
+            storage_client = FileStorageClient()
+            cache = LLMResponseCache() if use_cache else None
+            ref_loader = ReferenceDataLoader(storage_client)
+            merger = EnrichmentMerger()
+
+            executor = LookUpExecutor(
+                variable_resolver=VariableResolver,
+                cache_manager=cache,
+                reference_loader=ref_loader,
+                llm_client=llm_client,
+            )
+
+            orchestrator = LookUpOrchestrator(
+                executor=executor,
+                merger=merger,
+                config={"execution_timeout_seconds": timeout},
+            )
+
+            # Execute Look-Up
+            result = orchestrator.execute_lookups(
+                input_data=input_data, lookup_projects=[project]
+            )
+
+            # Serialize response
+            response_serializer = LookupExecutionResponseSerializer(data=result)
+            response_serializer.is_valid(raise_exception=True)
+
+            return Response(response_serializer.validated_data, status=status.HTTP_200_OK)
+
+        except ExtractionNotCompleteError as e:
+            return Response({"error": str(e)}, status=status.HTTP_400_BAD_REQUEST)
+        except Exception:
+            logger.exception(f"Error executing Look-Up project {project.id}")
+            return Response(
+                {"error": "Internal error during execution"},
+                status=status.HTTP_500_INTERNAL_SERVER_ERROR,
+            )
+
+    @action(detail=True, methods=["post"], parser_classes=[MultiPartParser])
+    def upload_reference_data(self, request, pk=None):
+        """Upload reference data for a Look-Up project.
+
+        POST /api/v1/lookup-projects/{id}/upload_reference_data/
+        """
+        project = self.get_object()
+
+        upload_serializer = ReferenceDataUploadSerializer(data=request.data)
+        upload_serializer.is_valid(raise_exception=True)
+
+        file = upload_serializer.validated_data["file"]
+        extract_text = upload_serializer.validated_data["extract_text"]
+
+        try:
+            from django.conf import settings
+            from utils.file_storage.constants import FileStorageKeys
+
+            from unstract.sdk1.file_storage.constants import StorageType
+            from unstract.sdk1.file_storage.env_helper import EnvHelper
+
+            # Get file storage instance
+            fs_instance = EnvHelper.get_storage(
+                storage_type=StorageType.PERMANENT,
+                env_name=FileStorageKeys.PERMANENT_REMOTE_STORAGE,
+            )
+
+            # Determine file type from extension
+            file_ext = file.name.split(".")[-1].lower()
+            file_type = (
+                file_ext
+                if file_ext in ["pdf", "xlsx", "csv", "docx", "txt", "json"]
+                else "txt"
+            )
+
+            # Upload file to storage following Prompt Studio's path structure
+            # Pattern: {base_path}/{org_id}/{project_id}/{filename}
+            # Keep Lookup file storage independent of PS project linkage
+            from utils.user_context import UserContext
+
+            org_id = UserContext.get_organization_identifier()
+            base_path = settings.PROMPT_STUDIO_FILE_PATH
+
+            # Store files under Lookup project ID, not PS tool ID
+            # This ensures files remain accessible regardless of PS linkage changes
+            file_path = f"{base_path}/{org_id}/{project.id}/{file.name}"
+
+            # Create parent directories if they don't exist
+            fs_instance.mkdir(f"{base_path}/{org_id}/{project.id}", create_parents=True)
+            fs_instance.mkdir(
+                f"{base_path}/{org_id}/{project.id}/extract", create_parents=True
+            )
+
+            # Upload the file
+            fs_instance.write(path=file_path, mode="wb", data=file.read())
+
+            logger.info(f"Uploaded file to storage: {file_path}")
+
+            # Create a data source record
+            data_source = LookupDataSource.objects.create(
+                project=project,
+                file_name=file.name,
+                file_path=file_path,
+                file_size=file.size,
+                file_type=file_type,
+                extraction_status="pending" if extract_text else "completed",
+                uploaded_by=request.user,
+            )
+
+            serializer = LookupDataSourceSerializer(data_source)
+            return Response(serializer.data, status=status.HTTP_201_CREATED)
+
+        except Exception:
+            logger.exception(f"Error uploading reference data for project {project.id}")
+            return Response(
+                {"error": "Failed to upload reference data"},
+                status=status.HTTP_500_INTERNAL_SERVER_ERROR,
+            )
+
+    @action(detail=True, methods=["get"])
+    def data_sources(self, request, pk=None):
+        """List all data sources for a Look-Up project.
+
+        GET /api/v1/lookup-projects/{id}/data_sources/
+        """
+        project = self.get_object()
+        data_sources = project.data_sources.all().order_by("-version_number")
+
+        # Filter by is_latest if requested
+        is_latest = request.query_params.get("is_latest")
+        if is_latest is not None:
+            data_sources = data_sources.filter(is_latest=is_latest.lower() == "true")
+
+        serializer = LookupDataSourceSerializer(data_sources, many=True)
+        return Response(serializer.data)
+
+    @action(detail=True, methods=["post"])
+    def index_all(self, request, pk=None):
+        """Index all reference data using the project's default profile.
+
+        POST /api/v1/lookup-projects/{id}/index_all/
+
+        Triggers indexing of all completed data sources using the
+        configured default profile's adapters and settings.
+
+        This calls external extraction and indexing services via PromptTool SDK.
+        """
+        project = self.get_object()
+
+        try:
+            from utils.user_context import UserContext
+
+            from .exceptions import DefaultProfileError
+            from .services import IndexingService
+
+            # Get organization and user context
+            org_id = UserContext.get_organization_identifier()
+            user_id = str(request.user.user_id) if request.user else None
+
+            logger.info(
+                f"Starting indexing for project {project.id} "
+                f"(org: {org_id}, user: {user_id})"
+            )
+
+            # Index all using default profile
+            results = IndexingService.index_with_default_profile(
+                project_id=str(project.id), org_id=org_id, user_id=user_id
+            )
+
+            logger.info(
+                f"Indexing completed for project {project.id}: "
+                f"{results['success']} successful, {results['failed']} failed"
+            )
+
+            return Response(
+                {"message": "Indexing completed", "results": results},
+                status=status.HTTP_200_OK,
+            )
+
+        except DefaultProfileError as e:
+            logger.error(f"Default profile error for project {project.id}: {e}")
+            return Response({"error": str(e)}, status=status.HTTP_400_BAD_REQUEST)
+        except Exception as e:
+            logger.exception(f"Error indexing reference data for project {project.id}")
+            return Response(
+                {"error": f"Failed to index reference data: {str(e)}"},
+                status=status.HTTP_500_INTERNAL_SERVER_ERROR,
+            )
+
+
+class LookupPromptTemplateViewSet(viewsets.ModelViewSet):
+    """ViewSet for managing Look-Up prompt templates.
+
+    Provides CRUD operations and template validation.
+    """
+
+    queryset = LookupPromptTemplate.objects.all()
+    serializer_class = LookupPromptTemplateSerializer
+    permission_classes = [IsAuthenticated]
+    pagination_class = CustomPagination
+
+    def get_queryset(self):
+        """Filter templates by active status if requested."""
+        queryset = super().get_queryset()
+        is_active = self.request.query_params.get("is_active")
+
+        if is_active is not None:
+            queryset = queryset.filter(is_active=is_active.lower() == "true")
+
+        return queryset
+
+    def perform_create(self, serializer):
+        """Set created_by from request and update project's template reference."""
+        template = serializer.save(created_by=self.request.user)
+        # Update the project's template field to point to this template
+        if template.project:
+            template.project.template = template
+            template.project.save(update_fields=["template"])
+
+    def perform_update(self, serializer):
+        """Update template and ensure project reference is maintained."""
+        template = serializer.save()
+        # Ensure the project's template field points to this template
+        if template.project and template.project.template != template:
+            template.project.template = template
+            template.project.save(update_fields=["template"])
+
+    @action(detail=False, methods=["post"])
+    def validate(self, request):
+        """Validate a template with optional sample data.
+
+        POST /api/v1/lookup-templates/validate/
+        """
+        validator = TemplateValidationSerializer(data=request.data)
+        validator.is_valid(raise_exception=True)
+
+        template_text = validator.validated_data["template_text"]
+        sample_data = validator.validated_data.get("sample_data", {})
+        sample_reference = validator.validated_data.get("sample_reference", "")
+
+        try:
+            # Test variable resolution
+            resolver = VariableResolver(sample_data, sample_reference)
+            resolved = resolver.resolve(template_text)
+
+            return Response(
+                {
+                    "valid": True,
+                    "resolved_template": resolved[:1000],  # First 1000 chars
+                    "variables_found": list(resolver.get_all_variables(template_text)),
+                }
+            )
+
+        except Exception as e:
+            return Response(
+                {"valid": False, "error": str(e)}, status=status.HTTP_400_BAD_REQUEST
+            )
+
+
+class PromptStudioLookupLinkViewSet(viewsets.ModelViewSet):
+    """ViewSet for managing links between Prompt Studio projects and Look-Ups."""
+
+    queryset = PromptStudioLookupLink.objects.all()
+    serializer_class = PromptStudioLookupLinkSerializer
+    permission_classes = [IsAuthenticated]
+    pagination_class = CustomPagination
+
+    def get_queryset(self):
+        """Filter links by PS project if requested."""
+        queryset = super().get_queryset()
+
+        ps_project_id = self.request.query_params.get("prompt_studio_project_id")
+        if ps_project_id:
+            queryset = queryset.filter(prompt_studio_project_id=ps_project_id)
+
+        lookup_project_id = self.request.query_params.get("lookup_project_id")
+        if lookup_project_id:
+            queryset = queryset.filter(lookup_project_id=lookup_project_id)
+
+        return queryset.select_related("lookup_project")
+
+    @action(detail=False, methods=["post"])
+    def bulk_link(self, request):
+        """Create or remove multiple links at once.
+
+        POST /api/v1/lookup-links/bulk_link/
+        """
+        serializer = BulkLinkSerializer(data=request.data)
+        serializer.is_valid(raise_exception=True)
+
+        ps_project_id = serializer.validated_data["prompt_studio_project_id"]
+        lookup_project_ids = serializer.validated_data["lookup_project_ids"]
+        unlink = serializer.validated_data["unlink"]
+
+        results = []
+
+        with transaction.atomic():
+            for lookup_id in lookup_project_ids:
+                if unlink:
+                    # Remove link
+                    deleted_count, _ = PromptStudioLookupLink.objects.filter(
+                        prompt_studio_project_id=ps_project_id,
+                        lookup_project_id=lookup_id,
+                    ).delete()
+                    results.append(
+                        {
+                            "lookup_project_id": str(lookup_id),
+                            "unlinked": deleted_count > 0,
+                        }
+                    )
+                else:
+                    # Create link
+                    link, created = PromptStudioLookupLink.objects.get_or_create(
+                        prompt_studio_project_id=ps_project_id,
+                        lookup_project_id=lookup_id,
+                    )
+                    results.append(
+                        {
+                            "lookup_project_id": str(lookup_id),
+                            "linked": created,
+                            "link_id": str(link.id) if created else None,
+                        }
+                    )
+
+        return Response({"results": results, "total_processed": len(results)})
+
+
+class LookupExecutionAuditViewSet(viewsets.ReadOnlyModelViewSet):
+    """ViewSet for viewing execution audit records.
+
+    Read-only access to execution history and statistics.
+    """
+
+    queryset = LookupExecutionAudit.objects.all()
+    serializer_class = LookupExecutionAuditSerializer
+    permission_classes = [IsAuthenticated]
+
+    def get_queryset(self):
+        """Filter audit records by various parameters."""
+        queryset = super().get_queryset()
+
+        # Filter by Look-Up project
+        lookup_project_id = self.request.query_params.get("lookup_project_id")
+        if lookup_project_id:
+            queryset = queryset.filter(lookup_project_id=lookup_project_id)
+
+        # Filter by PS project
+        ps_project_id = self.request.query_params.get("prompt_studio_project_id")
+        if ps_project_id:
+            queryset = queryset.filter(prompt_studio_project_id=ps_project_id)
+
+        # Filter by execution ID
+        execution_id = self.request.query_params.get("execution_id")
+        if execution_id:
+            queryset = queryset.filter(execution_id=execution_id)
+
+        # Filter by status
+        status_filter = self.request.query_params.get("status")
+        if status_filter:
+            queryset = queryset.filter(status=status_filter)
+
+        return queryset.select_related("lookup_project").order_by("-executed_at")
+
+    @action(detail=False, methods=["get"])
+    def statistics(self, request):
+        """Get execution statistics for a project.
+
+        GET /api/v1/execution-audits/statistics/?lookup_project_id={id}
+        """
+        lookup_project_id = request.query_params.get("lookup_project_id")
+        if not lookup_project_id:
+            return Response(
+                {"error": "lookup_project_id is required"},
+                status=status.HTTP_400_BAD_REQUEST,
+            )
+
+        try:
+            audit_logger = AuditLogger()
+            stats = audit_logger.get_project_stats(
+                project_id=uuid.UUID(lookup_project_id), limit=1000
+            )
+            return Response(stats)
+
+        except ValueError:
+            return Response(
+                {"error": "Invalid UUID format"}, status=status.HTTP_400_BAD_REQUEST
+            )
+
+
+class LookupDebugView(viewsets.ViewSet):
+    """Debug endpoints for testing Look-Up execution with Prompt Studio."""
+
+    permission_classes = [IsAuthenticated]
+
+    @action(detail=False, methods=["post"])
+    def enrich_ps_output(self, request):
+        """Enrich Prompt Studio extracted output with linked Look-Ups.
+
+        Uses real LLM clients configured in each Look-Up project's profile.
+
+        POST /api/v1/lookup-debug/enrich_ps_output/
+
+        Request body:
+            {
+                "prompt_studio_project_id": "uuid",
+                "extracted_data": {"vendor_name": "Amzn Web Services Inc", ...}
+            }
+
+        Response:
+            {
+                "original_data": {...},
+                "enriched_data": {...},
+                "lookup_enrichment": {...},
+                "_lookup_metadata": {...}
+            }
+        """
+        ps_project_id = request.data.get("prompt_studio_project_id")
+        extracted_data = request.data.get("extracted_data", {})
+
+        if not ps_project_id:
+            return Response(
+                {"error": "prompt_studio_project_id is required"},
+                status=status.HTTP_400_BAD_REQUEST,
+            )
+
+        if not extracted_data:
+            return Response(
+                {"error": "extracted_data is required"},
+                status=status.HTTP_400_BAD_REQUEST,
+            )
+
+        try:
+            # Get linked Look-Ups
+            links = (
+                PromptStudioLookupLink.objects.filter(
+                    prompt_studio_project_id=ps_project_id
+                )
+                .select_related("lookup_project")
+                .order_by("execution_order")
+            )
+
+            if not links:
+                return Response(
+                    {
+                        "original_data": extracted_data,
+                        "enriched_data": extracted_data,
+                        "lookup_enrichment": {},
+                        "_lookup_metadata": {
+                            "lookups_executed": 0,
+                            "message": "No Look-Ups linked to this Prompt Studio project",
+                        },
+                    }
+                )
+
+            # Get Look-Up projects
+            lookup_projects = [link.lookup_project for link in links]
+
+            # Initialize services with real clients
+            from .integrations.file_storage_client import FileStorageClient
+            from .integrations.unstract_llm_client import UnstractLLMClient
+
+            storage_client = FileStorageClient()
+            cache = LLMResponseCache()
+            ref_loader = ReferenceDataLoader(storage_client)
+            merger = EnrichmentMerger()
+
+            # Execute each Look-Up with its own LLM profile
+            all_enrichment = {}
+            all_metadata = {"lookups_executed": 0, "lookup_details": []}
+
+            for project in lookup_projects:
+                # Get profile for this project
+                profile = LookupProfileManager.objects.filter(
+                    lookup_project=project
+                ).first()
+
+                if not profile or not profile.llm:
+                    all_metadata["lookup_details"].append(
+                        {
+                            "project_id": str(project.id),
+                            "project_name": project.name,
+                            "status": "skipped",
+                            "reason": "No LLM profile configured",
+                        }
+                    )
+                    continue
+
+                try:
+                    # Create LLM client for this project's profile
+                    llm_client = UnstractLLMClient(profile.llm)
+
+                    executor = LookUpExecutor(
+                        variable_resolver=VariableResolver,
+                        cache_manager=cache,
+                        reference_loader=ref_loader,
+                        llm_client=llm_client,
+                    )
+
+                    orchestrator = LookUpOrchestrator(executor=executor, merger=merger)
+
+                    # Execute Look-Up with extracted data as input
+                    result = orchestrator.execute_lookups(
+                        input_data=extracted_data, lookup_projects=[project]
+                    )
+
+                    # Merge results
+                    if result.get("lookup_enrichment"):
+                        all_enrichment.update(result["lookup_enrichment"])
+
+                    all_metadata["lookups_executed"] += 1
+                    all_metadata["lookup_details"].append(
+                        {
+                            "project_id": str(project.id),
+                            "project_name": project.name,
+                            "status": "success",
+                            "enrichment_keys": list(
+                                result.get("lookup_enrichment", {}).keys()
+                            ),
+                        }
+                    )
+
+                except Exception as e:
+                    logger.exception(f"Error executing Look-Up {project.id}")
+                    all_metadata["lookup_details"].append(
+                        {
+                            "project_id": str(project.id),
+                            "project_name": project.name,
+                            "status": "error",
+                            "error": str(e),
+                        }
+                    )
+
+            # Merge enrichment into extracted data
+            enriched_data = {**extracted_data, **all_enrichment}
+
+            return Response(
+                {
+                    "original_data": extracted_data,
+                    "enriched_data": enriched_data,
+                    "lookup_enrichment": all_enrichment,
+                    "_lookup_metadata": all_metadata,
+                }
+            )
+
+        except Exception as e:
+            logger.exception(f"Error enriching PS output for project {ps_project_id}")
+            return Response(
+                {"error": str(e)}, status=status.HTTP_500_INTERNAL_SERVER_ERROR
+            )
+
+    @action(detail=False, methods=["post"])
+    def test_with_ps_project(self, request):
+        """Test Look-Up execution with a Prompt Studio project context.
+
+        POST /api/v1/lookup-debug/test_with_ps_project/
+        """
+        ps_project_id = request.data.get("prompt_studio_project_id")
+        input_data = request.data.get("input_data", {})
+
+        if not ps_project_id:
+            return Response(
+                {"error": "prompt_studio_project_id is required"},
+                status=status.HTTP_400_BAD_REQUEST,
+            )
+
+        try:
+            # Get linked Look-Ups
+            links = PromptStudioLookupLink.objects.filter(
+                prompt_studio_project_id=ps_project_id
+            ).select_related("lookup_project")
+
+            if not links:
+                return Response(
+                    {
+                        "message": "No Look-Ups linked to this Prompt Studio project",
+                        "lookup_enrichment": {},
+                        "_lookup_metadata": {"lookups_executed": 0},
+                    }
+                )
+
+            # Get Look-Up projects
+            lookup_projects = [link.lookup_project for link in links]
+
+            # Initialize services
+            from .services.mock_clients import MockLLMClient, MockStorageClient
+
+            llm_client = MockLLMClient()
+            storage_client = MockStorageClient()
+            cache = LLMResponseCache()
+            ref_loader = ReferenceDataLoader(storage_client)
+            merger = EnrichmentMerger()
+
+            executor = LookUpExecutor(
+                variable_resolver=VariableResolver,
+                cache_manager=cache,
+                reference_loader=ref_loader,
+                llm_client=llm_client,
+            )
+
+            orchestrator = LookUpOrchestrator(executor=executor, merger=merger)
+
+            # Execute Look-Ups
+            result = orchestrator.execute_lookups(
+                input_data=input_data, lookup_projects=lookup_projects
+            )
+
+            return Response(result)
+
+        except Exception as e:
+            logger.exception(f"Error in debug execution for PS project {ps_project_id}")
+            return Response(
+                {"error": str(e)}, status=status.HTTP_500_INTERNAL_SERVER_ERROR
+            )
+
+
+class LookupDataSourceViewSet(viewsets.ModelViewSet):
+    """ViewSet for managing LookupDataSource instances.
+
+    Provides CRUD operations for Look-Up data sources (reference data files).
+    Supports listing, retrieving, and deleting data sources.
+    """
+
+    queryset = LookupDataSource.objects.all()
+    serializer_class = LookupDataSourceSerializer
+    permission_classes = [IsAuthenticated]
+    pagination_class = CustomPagination
+
+    def get_queryset(self):
+        """Filter data sources by project if specified."""
+        queryset = super().get_queryset()
+
+        # Filter by project if provided
+        project_id = self.request.query_params.get("project")
+        if project_id:
+            queryset = queryset.filter(project_id=project_id)
+
+        # Filter by is_latest if requested
+        is_latest = self.request.query_params.get("is_latest")
+        if is_latest is not None:
+            queryset = queryset.filter(is_latest=is_latest.lower() == "true")
+
+        return queryset.select_related("project", "uploaded_by").order_by(
+            "-version_number"
+        )
+
+    def destroy(self, request, *args, **kwargs):
+        """Delete a data source and its associated files from storage.
+
+        DELETE /api/v1/unstract/{org_id}/data-sources/{id}/
+        """
+        instance = self.get_object()
+
+        try:
+            from utils.file_storage.constants import FileStorageKeys
+
+            from unstract.sdk1.file_storage.constants import StorageType
+            from unstract.sdk1.file_storage.env_helper import EnvHelper
+
+            # Get file storage instance
+            fs_instance = EnvHelper.get_storage(
+                storage_type=StorageType.PERMANENT,
+                env_name=FileStorageKeys.PERMANENT_REMOTE_STORAGE,
+            )
+
+            # Delete the file from storage if it exists
+            if instance.file_path:
+                try:
+                    if fs_instance.exists(instance.file_path):
+                        fs_instance.rm(instance.file_path)
+                        logger.info(f"Deleted file from storage: {instance.file_path}")
+                except Exception as e:
+                    logger.warning(f"Failed to delete file from storage: {e}")
+
+            # Delete extracted content if it exists
+            if instance.extracted_content_path:
+                try:
+                    if fs_instance.exists(instance.extracted_content_path):
+                        fs_instance.rm(instance.extracted_content_path)
+                        logger.info(
+                            f"Deleted extracted content: {instance.extracted_content_path}"
+                        )
+                except Exception as e:
+                    logger.warning(f"Failed to delete extracted content: {e}")
+
+            # Delete associated index manager if exists
+            try:
+                from .models import LookupIndexManager
+
+                LookupIndexManager.objects.filter(data_source=instance).delete()
+                logger.info(f"Deleted index manager for data source: {instance.id}")
+            except Exception as e:
+                logger.warning(f"Failed to delete index manager: {e}")
+
+            # Delete the database record
+            instance.delete()
+
+            logger.info(f"Successfully deleted data source: {instance.id}")
+            return Response(status=status.HTTP_204_NO_CONTENT)
+
+        except Exception as e:
+            logger.exception(f"Error deleting data source {instance.id}")
+            return Response(
+                {"error": f"Failed to delete data source: {str(e)}"},
+                status=status.HTTP_500_INTERNAL_SERVER_ERROR,
+            )
+
+
+class LookupProfileManagerViewSet(viewsets.ModelViewSet):
+    """ViewSet for managing LookupProfileManager instances.
+
+    Provides CRUD operations for Look-Up project profiles.
+    Each profile defines the set of adapters to use for a Look-Up project.
+
+    Follows the same pattern as Prompt Studio's ProfileManagerView.
+    """
+
+    versioning_class = URLPathVersioning
+    permission_classes = [IsOwner]
+    serializer_class = LookupProfileManagerSerializer
+    pagination_class = CustomPagination
+
+    def get_queryset(self):
+        """Filter queryset by created_by if specified in query params.
+        Otherwise return all profiles the user has access to.
+        """
+        filter_args = FilterHelper.build_filter_args(
+            self.request,
+            LookupProfileManagerKeys.CREATED_BY,
+        )
+        if filter_args:
+            queryset = LookupProfileManager.objects.filter(**filter_args)
+        else:
+            queryset = LookupProfileManager.objects.all()
+
+        # Filter by lookup_project if provided in query params
+        lookup_project_id = self.request.query_params.get("lookup_project")
+        if lookup_project_id:
+            queryset = queryset.filter(lookup_project_id=lookup_project_id)
+
+        return queryset.order_by("-created_at")
+
+    def create(self, request, *args, **kwargs):
+        """Create a new profile.
+
+        Handles IntegrityError for duplicate profile names within the same project.
+        """
+        serializer = self.get_serializer(data=request.data)
+        serializer.is_valid(raise_exception=True)
+
+        try:
+            self.perform_create(serializer)
+        except IntegrityError:
+            raise DuplicateData(LookupProfileManagerErrors.PROFILE_NAME_EXISTS)
+
+        return Response(serializer.data, status=status.HTTP_201_CREATED)
+
+    @action(detail=False, methods=["get"], url_path="default")
+    def get_default(self, request):
+        """Get the default profile for a lookup project.
+
+        Query params:
+            - lookup_project: UUID of the lookup project (required)
+
+        Returns:
+            Profile data or 404 if no default profile exists
+        """
+        lookup_project_id = request.query_params.get("lookup_project")
+
+        if not lookup_project_id:
+            return Response(
+                {"error": "lookup_project query parameter is required"},
+                status=status.HTTP_400_BAD_REQUEST,
+            )
+
+        try:
+            project = LookupProject.objects.get(id=lookup_project_id)
+            profile = LookupProfileManager.get_default_profile(project)
+            serializer = self.get_serializer(profile)
+            return Response(serializer.data)
+        except LookupProject.DoesNotExist:
+            return Response(
+                {"error": "Lookup project not found"}, status=status.HTTP_404_NOT_FOUND
+            )
+        except Exception as e:
+            return Response({"error": str(e)}, status=status.HTTP_404_NOT_FOUND)
+
+    @action(detail=True, methods=["post"], url_path="set-default")
+    def set_default(self, request, pk=None):
+        """Set a profile as the default for its project.
+
+        Unsets any existing default profile for the same project.
+        """
+        profile = self.get_object()
+
+        with transaction.atomic():
+            # Unset existing default for this project
+            LookupProfileManager.objects.filter(
+                lookup_project=profile.lookup_project, is_default=True
+            ).update(is_default=False)
+
+            # Set this profile as default
+            profile.is_default = True
+            profile.save()
+
+        serializer = self.get_serializer(profile)
+        return Response(serializer.data)
diff --git a/frontend/src/assets/lookups.svg b/frontend/src/assets/lookups.svg
new file mode 100644
index 0000000000..db41980604
--- /dev/null
+++ b/frontend/src/assets/lookups.svg
@@ -0,0 +1,6 @@
+<svg width="20" height="20" viewBox="0 0 20 20" fill="none" xmlns="http://www.w3.org/2000/svg">
+    <path d="M8.33333 2.5C5.11167 2.5 2.5 5.11167 2.5 8.33333C2.5 11.555 5.11167 14.1667 8.33333 14.1667C9.625 14.1667 10.8083 13.7417 11.7667 13.0167L16.0417 17.2917C16.2667 17.5167 16.6333 17.5167 16.8583 17.2917C17.0833 17.0667 17.0833 16.7 16.8583 16.475L12.5833 12.2C13.3083 11.2417 13.7333 10.0583 13.7333 8.76667C13.7333 5.545 11.1217 2.93333 7.9 2.93333M8.33333 4.16667C10.5917 4.16667 12.5 6.075 12.5 8.33333C12.5 10.5917 10.5917 12.5 8.33333 12.5C6.075 12.5 4.16667 10.5917 4.16667 8.33333C4.16667 6.075 6.075 4.16667 8.33333 4.16667Z" fill="#90A4B7"/>
+    <rect x="6" y="7" width="1.5" height="3" rx="0.3" fill="#90A4B7"/>
+    <rect x="8" y="7" width="1.5" height="3" rx="0.3" fill="#90A4B7"/>
+    <rect x="10" y="7" width="1.5" height="3" rx="0.3" fill="#90A4B7"/>
+</svg>
diff --git a/frontend/src/components/custom-tools/combined-output/CombinedOutput.css b/frontend/src/components/custom-tools/combined-output/CombinedOutput.css
index 13302b7e92..24c43a1104 100644
--- a/frontend/src/components/custom-tools/combined-output/CombinedOutput.css
+++ b/frontend/src/components/custom-tools/combined-output/CombinedOutput.css
@@ -1,39 +1,54 @@
 /* Styles for CombinedOutput */
 
 .combined-op-layout {
-    display: flex;
-    flex-direction: column;
-    height: 100%;
-    overflow-y: hidden;
+  display: flex;
+  flex-direction: column;
+  height: 100%;
+  overflow-y: hidden;
 }
 
 .combined-op-header {
-    display: flex;
-    margin-top: 7px;
+  display: flex;
+  margin-top: 7px;
 }
 
 .combined-op-segment {
-    margin-left: auto;
+  margin-left: auto;
 }
 
 .combined-op-body {
-    flex: 1;
-    overflow-y: auto;
+  flex: 1;
+  overflow-y: auto;
 }
 
 .combined-op-divider {
-    margin-bottom: 10px;
+  margin-bottom: 10px;
 }
 
 .code-snippet {
-    border: 1px solid #ECEFF3;
+  border: 1px solid #eceff3;
 }
 
 .code-snippet > .language-javascript {
-    margin: 0px !important;
-    height: 100%;
+  margin: 0px !important;
+  height: 100%;
 }
 
 .combined-op-layout .gap {
-    margin-bottom: 12px;
+  margin-bottom: 12px;
+}
+
+/* Enrichment info bar styling */
+.enrichment-info-bar {
+  padding: 8px 12px;
+  background-color: #f6ffed;
+  border: 1px solid #b7eb8f;
+  border-radius: 4px;
+  margin-bottom: 10px;
+}
+
+.combined-op-segment {
+  display: flex;
+  align-items: center;
+  gap: 8px;
 }
diff --git a/frontend/src/components/custom-tools/combined-output/CombinedOutput.jsx b/frontend/src/components/custom-tools/combined-output/CombinedOutput.jsx
index 36c043d0d0..e42f61715a 100644
--- a/frontend/src/components/custom-tools/combined-output/CombinedOutput.jsx
+++ b/frontend/src/components/custom-tools/combined-output/CombinedOutput.jsx
@@ -2,7 +2,7 @@ import "prismjs/components/prism-json";
 import "prismjs/plugins/line-numbers/prism-line-numbers.css";
 import "prismjs/plugins/line-numbers/prism-line-numbers.js";
 import "prismjs/themes/prism.css";
-import { useEffect, useState, useCallback } from "react";
+import { useEffect, useState, useCallback, useRef } from "react";
 import { useParams } from "react-router-dom";
 import PropTypes from "prop-types";
 
@@ -64,6 +64,12 @@ function CombinedOutput({ docId, setFilledFields, selectedPrompts }) {
   const [selectedProfile, setSelectedProfile] = useState(defaultLlmProfile);
   const [filteredCombinedOutput, setFilteredCombinedOutput] = useState({});
 
+  // Lookup enrichment state
+  const [isEnriching, setIsEnriching] = useState(false);
+  const [enrichmentResult, setEnrichmentResult] = useState(null);
+  const [hasLinkedLookups, setHasLinkedLookups] = useState(false);
+  const enrichmentCheckedRef = useRef(false);
+
   const { id } = useParams();
   const { sessionDetails } = useSessionStore();
   const { setAlertDetails } = useAlertStore();
@@ -97,6 +103,90 @@ function CombinedOutput({ docId, setFilledFields, selectedPrompts }) {
     setSelectedProfile(singlePassExtractMode ? defaultLlmProfile : null);
   }, [singlePassExtractMode]);
 
+  // Check if there are linked Look-Ups for this project
+  useEffect(() => {
+    if (isSimplePromptStudio || isPublicSource) return;
+
+    // Use id from URL params as fallback (same as tool_id)
+    const toolId = details?.tool_id || id;
+    if (!toolId || !sessionDetails?.orgId) return;
+
+    // Skip if already checked for this tool
+    if (enrichmentCheckedRef.current === toolId) return;
+
+    const checkLinkedLookups = async () => {
+      try {
+        const url = `/api/v1/unstract/${sessionDetails?.orgId}/lookup-links/?prompt_studio_project_id=${toolId}`;
+        const res = await axiosPrivate.get(url);
+        const links = res?.data?.results || res?.data || [];
+        setHasLinkedLookups(links.length > 0);
+        enrichmentCheckedRef.current = toolId;
+      } catch (err) {
+        // Silently fail - lookups may not be available
+        console.debug("Could not check for linked Look-Ups:", err);
+        setHasLinkedLookups(false);
+      }
+    };
+
+    checkLinkedLookups();
+  }, [details?.tool_id, id, sessionDetails?.orgId]);
+
+  // Reset enrichment when document changes
+  useEffect(() => {
+    setEnrichmentResult(null);
+  }, [docId]);
+
+  // Handler for enriching output with Look-Ups
+  const handleEnrichWithLookups = useCallback(async () => {
+    if (isEnriching || Object.keys(filteredCombinedOutput).length === 0) return;
+
+    setIsEnriching(true);
+    try {
+      const toolId = details?.tool_id || id;
+      const url = `/api/v1/unstract/${sessionDetails?.orgId}/lookup-debug/enrich_ps_output/`;
+
+      // Get fresh CSRF token from cookie
+      const csrfToken =
+        sessionDetails?.csrfToken ||
+        document.cookie
+          .split("; ")
+          .find((row) => row.startsWith("csrftoken="))
+          ?.split("=")[1];
+
+      const res = await axiosPrivate.post(
+        url,
+        {
+          prompt_studio_project_id: toolId,
+          extracted_data: filteredCombinedOutput,
+        },
+        {
+          headers: {
+            "X-CSRFToken": csrfToken,
+            "Content-Type": "application/json",
+          },
+        }
+      );
+
+      setEnrichmentResult(res.data);
+      setAlertDetails({
+        type: "success",
+        content: `Successfully enriched with ${
+          res.data._lookup_metadata?.lookups_executed || 0
+        } Look-Up(s)`,
+      });
+    } catch (err) {
+      setAlertDetails(handleException(err, "Failed to enrich with Look-Ups"));
+    } finally {
+      setIsEnriching(false);
+    }
+  }, [
+    filteredCombinedOutput,
+    details?.tool_id,
+    id,
+    sessionDetails?.orgId,
+    isEnriching,
+  ]);
+
   useEffect(() => {
     if (!docId || isSinglePassExtractLoading) return;
 
@@ -229,6 +319,10 @@ function CombinedOutput({ docId, setFilledFields, selectedPrompts }) {
       adapterData={adapterData}
       isSinglePass={singlePassExtractMode}
       isLoading={isOutputLoading}
+      onEnrichWithLookups={handleEnrichWithLookups}
+      isEnriching={isEnriching}
+      enrichmentResult={enrichmentResult}
+      hasLinkedLookups={hasLinkedLookups}
     />
   );
 }
diff --git a/frontend/src/components/custom-tools/combined-output/JsonView.jsx b/frontend/src/components/custom-tools/combined-output/JsonView.jsx
index aee6c297a5..f803bab378 100644
--- a/frontend/src/components/custom-tools/combined-output/JsonView.jsx
+++ b/frontend/src/components/custom-tools/combined-output/JsonView.jsx
@@ -1,8 +1,9 @@
 import PropTypes from "prop-types";
 import Prism from "prismjs";
-import { useEffect } from "react";
+import { useEffect, useState } from "react";
 import TabPane from "antd/es/tabs/TabPane";
-import { Tabs } from "antd";
+import { Tabs, Button, Tooltip, Badge } from "antd";
+import { ThunderboltOutlined, CheckCircleOutlined } from "@ant-design/icons";
 
 import { JsonViewBody } from "./JsonViewBody";
 
@@ -15,10 +16,32 @@ function JsonView({
   llmProfiles,
   isSinglePass,
   isLoading,
+  onEnrichWithLookups,
+  isEnriching,
+  enrichmentResult,
+  hasLinkedLookups,
 }) {
+  const [showEnriched, setShowEnriched] = useState(false);
+
   useEffect(() => {
     Prism.highlightAll();
-  }, [combinedOutput]);
+  }, [combinedOutput, enrichmentResult, showEnriched]);
+
+  // Determine what output to display
+  const displayOutput =
+    showEnriched && enrichmentResult?.enriched_data
+      ? enrichmentResult.enriched_data
+      : combinedOutput;
+
+  const handleEnrichClick = () => {
+    if (enrichmentResult) {
+      // Toggle between original and enriched view
+      setShowEnriched(!showEnriched);
+    } else if (onEnrichWithLookups) {
+      // Trigger enrichment
+      onEnrichWithLookups();
+    }
+  };
 
   return (
     <div className="combined-op-layout">
@@ -34,15 +57,58 @@ function JsonView({
             />
           ))}
         </Tabs>
-        <div className="combined-op-segment"></div>
+        <div className="combined-op-segment">
+          {hasLinkedLookups && onEnrichWithLookups && (
+            <Tooltip
+              title={
+                enrichmentResult
+                  ? showEnriched
+                    ? "Show original output"
+                    : "Show enriched output"
+                  : "Enrich output with linked Look-Ups"
+              }
+            >
+              <Badge
+                dot={enrichmentResult && !showEnriched}
+                status="success"
+                offset={[-2, 2]}
+              >
+                <Button
+                  type={showEnriched ? "primary" : "default"}
+                  size="small"
+                  icon={
+                    enrichmentResult ? (
+                      <CheckCircleOutlined />
+                    ) : (
+                      <ThunderboltOutlined />
+                    )
+                  }
+                  loading={isEnriching}
+                  onClick={handleEnrichClick}
+                  disabled={
+                    isLoading || Object.keys(combinedOutput).length === 0
+                  }
+                >
+                  {enrichmentResult
+                    ? showEnriched
+                      ? "Show Original"
+                      : "Show Enriched"
+                    : "Enrich with Look-Ups"}
+                </Button>
+              </Badge>
+            </Tooltip>
+          )}
+        </div>
       </div>
       <div className="combined-op-divider" />
       <JsonViewBody
         activeKey={activeKey}
         selectedProfile={selectedProfile}
         llmProfiles={llmProfiles}
-        combinedOutput={combinedOutput}
+        combinedOutput={displayOutput}
         isLoading={isLoading}
+        isEnriched={showEnriched}
+        enrichmentMetadata={enrichmentResult?._lookup_metadata}
       />
       <div className="gap" />
     </div>
@@ -58,6 +124,10 @@ JsonView.propTypes = {
   activeKey: PropTypes.string,
   isSinglePass: PropTypes.bool,
   isLoading: PropTypes.bool.isRequired,
+  onEnrichWithLookups: PropTypes.func,
+  isEnriching: PropTypes.bool,
+  enrichmentResult: PropTypes.object,
+  hasLinkedLookups: PropTypes.bool,
 };
 
 export { JsonView };
diff --git a/frontend/src/components/custom-tools/combined-output/JsonViewBody.jsx b/frontend/src/components/custom-tools/combined-output/JsonViewBody.jsx
index 97ddcd212e..2947a79e18 100644
--- a/frontend/src/components/custom-tools/combined-output/JsonViewBody.jsx
+++ b/frontend/src/components/custom-tools/combined-output/JsonViewBody.jsx
@@ -1,4 +1,6 @@
 import PropTypes from "prop-types";
+import { Tag, Space } from "antd";
+import { CheckCircleOutlined, ThunderboltOutlined } from "@ant-design/icons";
 
 import { ProfileInfoBar } from "../profile-info-bar/ProfileInfoBar";
 import { SpinnerLoader } from "../../widgets/spinner-loader/SpinnerLoader";
@@ -9,6 +11,8 @@ function JsonViewBody({
   llmProfiles,
   combinedOutput,
   isLoading,
+  isEnriched,
+  enrichmentMetadata,
 }) {
   if (isLoading) {
     return <SpinnerLoader />;
@@ -19,6 +23,38 @@ function JsonViewBody({
       {activeKey !== "0" && (
         <ProfileInfoBar profileId={selectedProfile} profiles={llmProfiles} />
       )}
+      {isEnriched && enrichmentMetadata && (
+        <div className="enrichment-info-bar">
+          <Space size="small">
+            <Tag icon={<ThunderboltOutlined />} color="success">
+              Enriched with Look-Ups
+            </Tag>
+            <Tag color="blue">
+              {enrichmentMetadata.lookups_executed} Look-Up
+              {enrichmentMetadata.lookups_executed !== 1 ? "s" : ""} executed
+            </Tag>
+            {enrichmentMetadata.lookup_details?.map((detail, idx) => (
+              <Tag
+                key={idx}
+                icon={
+                  detail.status === "success" ? (
+                    <CheckCircleOutlined />
+                  ) : undefined
+                }
+                color={
+                  detail.status === "success"
+                    ? "green"
+                    : detail.status === "error"
+                    ? "red"
+                    : "default"
+                }
+              >
+                {detail.project_name}
+              </Tag>
+            ))}
+          </Space>
+        </div>
+      )}
       <div className="combined-op-body code-snippet">
         {combinedOutput && (
           <pre className="line-numbers width-100">
@@ -38,6 +74,8 @@ JsonViewBody.propTypes = {
   llmProfiles: PropTypes.string,
   combinedOutput: PropTypes.object,
   isLoading: PropTypes.bool.isRequired,
+  isEnriched: PropTypes.bool,
+  enrichmentMetadata: PropTypes.object,
 };
 
 export { JsonViewBody };
diff --git a/frontend/src/components/lookups/create-project-modal/CreateProjectModal.jsx b/frontend/src/components/lookups/create-project-modal/CreateProjectModal.jsx
new file mode 100644
index 0000000000..1fb765b035
--- /dev/null
+++ b/frontend/src/components/lookups/create-project-modal/CreateProjectModal.jsx
@@ -0,0 +1,92 @@
+import { Form, Input, Modal, Select } from "antd";
+import PropTypes from "prop-types";
+
+const { TextArea } = Input;
+
+const REFERENCE_DATA_TYPES = [
+  { value: "vendor_catalog", label: "Vendor Catalog" },
+  { value: "product_catalog", label: "Product Catalog" },
+  { value: "customer_database", label: "Customer Database" },
+  { value: "pricing_data", label: "Pricing Data" },
+  { value: "compliance_rules", label: "Compliance Rules" },
+  { value: "custom", label: "Custom" },
+];
+
+export function CreateProjectModal({ open, onCancel, onCreate }) {
+  const [form] = Form.useForm();
+
+  const handleSubmit = async () => {
+    try {
+      const values = await form.validateFields();
+      await onCreate(values);
+      form.resetFields();
+    } catch (error) {
+      console.error("Validation failed:", error);
+    }
+  };
+
+  return (
+    <Modal
+      title="Create Look-Up Project"
+      open={open}
+      onCancel={onCancel}
+      onOk={handleSubmit}
+      okText="Create"
+      width={600}
+    >
+      <Form
+        form={form}
+        layout="vertical"
+        initialValues={{
+          is_active: true,
+        }}
+      >
+        <Form.Item
+          name="name"
+          label="Project Name"
+          rules={[
+            { required: true, message: "Please enter a project name" },
+            { max: 100, message: "Name must be less than 100 characters" },
+          ]}
+        >
+          <Input placeholder="e.g., Vendor Enrichment" />
+        </Form.Item>
+
+        <Form.Item
+          name="description"
+          label="Description"
+          rules={[
+            {
+              max: 500,
+              message: "Description must be less than 500 characters",
+            },
+          ]}
+        >
+          <TextArea
+            rows={3}
+            placeholder="Describe the purpose of this Look-Up project..."
+          />
+        </Form.Item>
+
+        <Form.Item
+          name="reference_data_type"
+          label="Reference Data Type"
+          rules={[
+            { required: true, message: "Please select a reference data type" },
+          ]}
+        >
+          <Select
+            placeholder="Select reference data type"
+            options={REFERENCE_DATA_TYPES}
+          />
+        </Form.Item>
+      </Form>
+    </Modal>
+  );
+}
+
+CreateProjectModal.propTypes = {
+  open: PropTypes.bool.isRequired,
+  onCancel: PropTypes.func.isRequired,
+  onCreate: PropTypes.func.isRequired,
+};
diff --git a/frontend/src/components/lookups/debug-tab/DebugTab.css b/frontend/src/components/lookups/debug-tab/DebugTab.css
new file mode 100644
index 0000000000..57a713628d
--- /dev/null
+++ b/frontend/src/components/lookups/debug-tab/DebugTab.css
@@ -0,0 +1,8 @@
+.debug-tab {
+  padding: 24px;
+  max-width: 1000px;
+  height: 100%;
+  max-height: calc(100vh - 380px);
+  overflow-y: auto;
+  overflow-x: hidden;
+}
diff --git a/frontend/src/components/lookups/debug-tab/DebugTab.jsx b/frontend/src/components/lookups/debug-tab/DebugTab.jsx
new file mode 100644
index 0000000000..2427851f77
--- /dev/null
+++ b/frontend/src/components/lookups/debug-tab/DebugTab.jsx
@@ -0,0 +1,249 @@
+import { useState } from "react";
+import { Button, Card, Space, Typography, Alert, Divider, Spin } from "antd";
+import {
+  PlayCircleOutlined,
+  BugOutlined,
+  ClearOutlined,
+} from "@ant-design/icons";
+import PropTypes from "prop-types";
+import CodeMirror from "@uiw/react-codemirror";
+import { json } from "@codemirror/lang-json";
+import { oneDark } from "@codemirror/theme-one-dark";
+
+import { useAxiosPrivate } from "../../../hooks/useAxiosPrivate";
+import { useAlertStore } from "../../../store/alert-store";
+import { useSessionStore } from "../../../store/session-store";
+import "./DebugTab.css";
+
+const { Title, Text } = Typography;
+
+export function DebugTab({ project }) {
+  const [inputData, setInputData] = useState("{}");
+  const [executing, setExecuting] = useState(false);
+  const [result, setResult] = useState(null);
+  const [error, setError] = useState(null);
+
+  const axiosPrivate = useAxiosPrivate();
+  const { setAlertDetails } = useAlertStore();
+  const { sessionDetails } = useSessionStore();
+
+  const handleExecute = async () => {
+    setExecuting(true);
+    setResult(null);
+    setError(null);
+
+    try {
+      // Parse input JSON
+      let parsedInput;
+      try {
+        parsedInput = JSON.parse(inputData);
+      } catch (e) {
+        setError("Invalid JSON input");
+        setExecuting(false);
+        return;
+      }
+
+      const response = await axiosPrivate.post(
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/${project.id}/execute/`,
+        {
+          input_data: parsedInput,
+          use_cache: false,
+          timeout_seconds: 60,
+        },
+        {
+          headers: {
+            "X-CSRFToken": sessionDetails?.csrfToken,
+          },
+        }
+      );
+
+      setResult(response.data);
+      setAlertDetails({
+        type: "success",
+        content: "Execution completed successfully",
+      });
+    } catch (error) {
+      const errorMessage =
+        error.response?.data?.error ||
+        error.response?.data?.detail ||
+        "Execution failed";
+      setError(errorMessage);
+      setAlertDetails({
+        type: "error",
+        content: errorMessage,
+      });
+    } finally {
+      setExecuting(false);
+    }
+  };
+
+  const handleClear = () => {
+    setInputData("{}");
+    setResult(null);
+    setError(null);
+  };
+
+  const formatJSON = () => {
+    try {
+      const parsed = JSON.parse(inputData);
+      setInputData(JSON.stringify(parsed, null, 2));
+    } catch (e) {
+      setAlertDetails({
+        type: "warning",
+        content: "Invalid JSON format",
+      });
+    }
+  };
+
+  return (
+    <div className="debug-tab">
+      <Title level={4}>Debug Console</Title>
+      <Text type="secondary">
+        Test your Look-Up configuration with sample data
+      </Text>
+
+      <Divider />
+
+      <Alert
+        message="Debug Mode"
+        description="Executions in debug mode do not use caching and are not counted in statistics."
+        type="info"
+        showIcon
+        icon={<BugOutlined />}
+        style={{ marginBottom: 16 }}
+      />
+
+      <Card title="Input Data" style={{ marginBottom: 16 }}>
+        <Space direction="vertical" style={{ width: "100%" }}>
+          <Text>
+            Enter JSON data with variables that match your template
+            placeholders:
+          </Text>
+          <CodeMirror
+            value={inputData}
+            height="200px"
+            theme={oneDark}
+            extensions={[json()]}
+            onChange={(value) => setInputData(value)}
+            editable={!executing}
+          />
+          <Space>
+            <Button onClick={formatJSON} size="small">
+              Format JSON
+            </Button>
+            <Text type="secondary">
+              Example: {`{ "vendor_name": "Acme Corp", "product_id": "123" }`}
+            </Text>
+          </Space>
+        </Space>
+      </Card>
+
+      <Space style={{ marginBottom: 16 }}>
+        <Button
+          type="primary"
+          icon={<PlayCircleOutlined />}
+          onClick={handleExecute}
+          loading={executing}
+          disabled={!project.template}
+        >
+          Execute Look-Up
+        </Button>
+        <Button icon={<ClearOutlined />} onClick={handleClear}>
+          Clear
+        </Button>
+      </Space>
+
+      {!project.template && (
+        <Alert
+          message="No Template Configured"
+          description="Please configure a template in the Template tab before debugging."
+          type="warning"
+          showIcon
+          style={{ marginBottom: 16 }}
+        />
+      )}
+
+      {executing && (
+        <Card style={{ marginBottom: 16 }}>
+          <Space direction="vertical" align="center" style={{ width: "100%" }}>
+            <Spin size="large" />
+            <Text>Executing Look-Up...</Text>
+          </Space>
+        </Card>
+      )}
+
+      {error && (
+        <Alert
+          message="Execution Error"
+          description={error}
+          type="error"
+          showIcon
+          style={{ marginBottom: 16 }}
+        />
+      )}
+
+      {result && (
+        <Card title="Execution Result">
+          <Space direction="vertical" style={{ width: "100%" }}>
+            {result.lookup_enrichment && (
+              <>
+                <Title level={5}>Enrichment Data</Title>
+                <CodeMirror
+                  value={JSON.stringify(result.lookup_enrichment, null, 2)}
+                  height="200px"
+                  theme={oneDark}
+                  extensions={[json()]}
+                  editable={false}
+                />
+              </>
+            )}
+
+            {result._lookup_metadata && (
+              <>
+                <Divider />
+                <Title level={5}>Execution Metadata</Title>
+                <Space direction="vertical">
+                  <Text>
+                    <strong>Lookups Executed:</strong>{" "}
+                    {result._lookup_metadata.lookups_executed}
+                  </Text>
+                  <Text>
+                    <strong>Successful:</strong>{" "}
+                    {result._lookup_metadata.successful_lookups}
+                  </Text>
+                  <Text>
+                    <strong>Failed:</strong>{" "}
+                    {result._lookup_metadata.failed_lookups}
+                  </Text>
+                  <Text>
+                    <strong>Execution Time:</strong>{" "}
+                    {result._lookup_metadata.execution_time_ms}ms
+                  </Text>
+                  {result._lookup_metadata.conflicts_resolved > 0 && (
+                    <Text type="warning">
+                      <strong>Conflicts Resolved:</strong>{" "}
+                      {result._lookup_metadata.conflicts_resolved}
+                    </Text>
+                  )}
+                  {result._lookup_metadata.execution_id && (
+                    <Text type="secondary">
+                      <strong>Execution ID:</strong>{" "}
+                      <Text code>{result._lookup_metadata.execution_id}</Text>
+                    </Text>
+                  )}
+                </Space>
+              </>
+            )}
+          </Space>
+        </Card>
+      )}
+    </div>
+  );
+}
+
+DebugTab.propTypes = {
+  project: PropTypes.shape({
+    id: PropTypes.string.isRequired,
+    template: PropTypes.object,
+  }).isRequired,
+};
diff --git a/frontend/src/components/lookups/execution-history-tab/ExecutionHistoryTab.css b/frontend/src/components/lookups/execution-history-tab/ExecutionHistoryTab.css
new file mode 100644
index 0000000000..ad759462cb
--- /dev/null
+++ b/frontend/src/components/lookups/execution-history-tab/ExecutionHistoryTab.css
@@ -0,0 +1,17 @@
+.execution-history-tab {
+  padding: 24px;
+  height: 100%;
+  max-height: calc(100vh - 380px);
+  overflow-y: auto;
+  overflow-x: hidden;
+}
+
+.tab-header {
+  display: flex;
+  justify-content: space-between;
+  align-items: center;
+  margin-bottom: 24px;
+  flex-shrink: 0;
+  flex-wrap: wrap;
+  gap: 12px;
+}
diff --git a/frontend/src/components/lookups/execution-history-tab/ExecutionHistoryTab.jsx b/frontend/src/components/lookups/execution-history-tab/ExecutionHistoryTab.jsx
new file mode 100644
index 0000000000..d873da7da1
--- /dev/null
+++ b/frontend/src/components/lookups/execution-history-tab/ExecutionHistoryTab.jsx
@@ -0,0 +1,283 @@
+import { useState, useEffect } from "react";
+import {
+  Table,
+  Tag,
+  Typography,
+  Space,
+  Button,
+  Statistic,
+  Card,
+  Row,
+  Col,
+  Progress,
+  Tooltip,
+} from "antd";
+import {
+  CheckCircleOutlined,
+  CloseCircleOutlined,
+  ClockCircleOutlined,
+  SyncOutlined,
+  ThunderboltOutlined,
+  DatabaseOutlined,
+} from "@ant-design/icons";
+import PropTypes from "prop-types";
+
+import { useAxiosPrivate } from "../../../hooks/useAxiosPrivate";
+import { useAlertStore } from "../../../store/alert-store";
+import { useSessionStore } from "../../../store/session-store";
+import "./ExecutionHistoryTab.css";
+
+const { Title, Text } = Typography;
+
+export function ExecutionHistoryTab({ project }) {
+  const [executions, setExecutions] = useState([]);
+  const [statistics, setStatistics] = useState(null);
+  const [loading, setLoading] = useState(false);
+  const [refreshing, setRefreshing] = useState(false);
+
+  const axiosPrivate = useAxiosPrivate();
+  const { setAlertDetails } = useAlertStore();
+  const { sessionDetails } = useSessionStore();
+
+  useEffect(() => {
+    fetchExecutions();
+    fetchStatistics();
+  }, [project.id]);
+
+  const fetchExecutions = async () => {
+    setLoading(true);
+    try {
+      const response = await axiosPrivate.get(
+        `/api/v1/unstract/${sessionDetails?.orgId}/execution-audits/`,
+        {
+          params: { lookup_project_id: project.id },
+        }
+      );
+      setExecutions(response.data.results || []);
+    } catch (error) {
+      setAlertDetails({
+        type: "error",
+        content: "Failed to fetch execution history",
+      });
+    } finally {
+      setLoading(false);
+    }
+  };
+
+  const fetchStatistics = async () => {
+    try {
+      const response = await axiosPrivate.get(
+        `/api/v1/unstract/${sessionDetails?.orgId}/execution-audits/statistics/`,
+        {
+          params: { lookup_project_id: project.id },
+        }
+      );
+      setStatistics(response.data);
+    } catch (error) {
+      console.error("Failed to fetch statistics:", error);
+    }
+  };
+
+  const handleRefresh = async () => {
+    setRefreshing(true);
+    await Promise.all([fetchExecutions(), fetchStatistics()]);
+    setRefreshing(false);
+  };
+
+  const getStatusIcon = (status) => {
+    switch (status) {
+      case "success":
+        return <CheckCircleOutlined style={{ color: "#52c41a" }} />;
+      case "failure":
+        return <CloseCircleOutlined style={{ color: "#f5222d" }} />;
+      case "partial":
+        return <ClockCircleOutlined style={{ color: "#faad14" }} />;
+      default:
+        return null;
+    }
+  };
+
+  const columns = [
+    {
+      title: "Execution ID",
+      dataIndex: "execution_id",
+      key: "execution_id",
+      render: (id) => (
+        <Tooltip title={id}>
+          <Text code>{id.substring(0, 8)}...</Text>
+        </Tooltip>
+      ),
+    },
+    {
+      title: "Status",
+      dataIndex: "status",
+      key: "status",
+      render: (status) => (
+        <Space>
+          {getStatusIcon(status)}
+          <Tag
+            color={
+              status === "success"
+                ? "green"
+                : status === "failure"
+                ? "red"
+                : "orange"
+            }
+          >
+            {status.toUpperCase()}
+          </Tag>
+        </Space>
+      ),
+    },
+    {
+      title: "Confidence",
+      dataIndex: "confidence_score",
+      key: "confidence_score",
+      render: (score) => {
+        if (!score) return "-";
+        const percent = Math.round(score * 100);
+        return (
+          <Progress
+            percent={percent}
+            size="small"
+            strokeColor={
+              percent >= 80 ? "#52c41a" : percent >= 60 ? "#faad14" : "#f5222d"
+            }
+            style={{ width: 80 }}
+          />
+        );
+      },
+    },
+    {
+      title: "Execution Time",
+      dataIndex: "execution_time_ms",
+      key: "execution_time_ms",
+      render: (time) => (time ? `${time}ms` : "-"),
+    },
+    {
+      title: "Cache Hit",
+      dataIndex: "llm_response_cached",
+      key: "llm_response_cached",
+      render: (cached) => (
+        <Tag color={cached ? "green" : "default"}>
+          {cached ? "Cached" : "Fresh"}
+        </Tag>
+      ),
+    },
+    {
+      title: "Executed At",
+      dataIndex: "executed_at",
+      key: "executed_at",
+      render: (date) => new Date(date).toLocaleString(),
+    },
+    {
+      title: "Error",
+      dataIndex: "error_message",
+      key: "error_message",
+      render: (error) =>
+        error ? (
+          <Tooltip title={error}>
+            <Text type="danger" ellipsis style={{ maxWidth: 150 }}>
+              {error}
+            </Text>
+          </Tooltip>
+        ) : (
+          "-"
+        ),
+    },
+  ];
+
+  return (
+    <div className="execution-history-tab">
+      <div className="tab-header">
+        <div>
+          <Title level={4}>Execution History</Title>
+          <Text type="secondary">
+            View past Look-Up executions and statistics
+          </Text>
+        </div>
+        <Button
+          icon={<SyncOutlined />}
+          onClick={handleRefresh}
+          loading={refreshing}
+        >
+          Refresh
+        </Button>
+      </div>
+
+      {statistics && (
+        <Row gutter={16} style={{ marginBottom: 24 }}>
+          <Col span={6}>
+            <Card>
+              <Statistic
+                title="Total Executions"
+                value={statistics.total_executions || 0}
+                prefix={<DatabaseOutlined />}
+              />
+            </Card>
+          </Col>
+          <Col span={6}>
+            <Card>
+              <Statistic
+                title="Success Rate"
+                value={Math.round((statistics.success_rate || 0) * 100)}
+                suffix="%"
+                prefix={<CheckCircleOutlined />}
+                valueStyle={{
+                  color:
+                    statistics.success_rate >= 0.9
+                      ? "#52c41a"
+                      : statistics.success_rate >= 0.7
+                      ? "#faad14"
+                      : "#f5222d",
+                }}
+              />
+            </Card>
+          </Col>
+          <Col span={6}>
+            <Card>
+              <Statistic
+                title="Avg Execution Time"
+                value={Math.round(statistics.avg_execution_time_ms || 0)}
+                suffix="ms"
+                prefix={<ThunderboltOutlined />}
+              />
+            </Card>
+          </Col>
+          <Col span={6}>
+            <Card>
+              <Statistic
+                title="Cache Hit Rate"
+                value={Math.round((statistics.cache_hit_rate || 0) * 100)}
+                suffix="%"
+                prefix={<DatabaseOutlined />}
+                valueStyle={{
+                  color:
+                    statistics.cache_hit_rate >= 0.5 ? "#52c41a" : "#1890ff",
+                }}
+              />
+            </Card>
+          </Col>
+        </Row>
+      )}
+
+      <Table
+        columns={columns}
+        dataSource={executions}
+        loading={loading}
+        rowKey="id"
+        pagination={{
+          pageSize: 10,
+          showSizeChanger: true,
+          showTotal: (total) => `Total ${total} executions`,
+        }}
+      />
+    </div>
+  );
+}
+
+ExecutionHistoryTab.propTypes = {
+  project: PropTypes.shape({
+    id: PropTypes.string.isRequired,
+  }).isRequired,
+};
diff --git a/frontend/src/components/lookups/linked-projects-tab/LinkedProjectsTab.css b/frontend/src/components/lookups/linked-projects-tab/LinkedProjectsTab.css
new file mode 100644
index 0000000000..2725a02f46
--- /dev/null
+++ b/frontend/src/components/lookups/linked-projects-tab/LinkedProjectsTab.css
@@ -0,0 +1,17 @@
+.linked-projects-tab {
+  padding: 24px;
+  height: 100%;
+  max-height: calc(100vh - 380px);
+  overflow-y: auto;
+  overflow-x: hidden;
+}
+
+.tab-header {
+  display: flex;
+  justify-content: space-between;
+  align-items: center;
+  margin-bottom: 24px;
+  flex-shrink: 0;
+  flex-wrap: wrap;
+  gap: 12px;
+}
diff --git a/frontend/src/components/lookups/linked-projects-tab/LinkedProjectsTab.jsx b/frontend/src/components/lookups/linked-projects-tab/LinkedProjectsTab.jsx
new file mode 100644
index 0000000000..91a549d09d
--- /dev/null
+++ b/frontend/src/components/lookups/linked-projects-tab/LinkedProjectsTab.jsx
@@ -0,0 +1,376 @@
+import {
+  DisconnectOutlined,
+  FolderOutlined,
+  PlusOutlined,
+} from "@ant-design/icons";
+import {
+  Button,
+  Form,
+  Modal,
+  Select,
+  Space,
+  Table,
+  Tag,
+  Typography,
+} from "antd";
+import PropTypes from "prop-types";
+import { useEffect, useState } from "react";
+
+import { useAxiosPrivate } from "../../../hooks/useAxiosPrivate";
+import { useAlertStore } from "../../../store/alert-store";
+import { useSessionStore } from "../../../store/session-store";
+import "./LinkedProjectsTab.css";
+
+const { Title, Text } = Typography;
+const { Option } = Select;
+
+export function LinkedProjectsTab({ project }) {
+  const [links, setLinks] = useState([]);
+  const [loading, setLoading] = useState(false);
+  const [linkModalOpen, setLinkModalOpen] = useState(false);
+  const [availableProjects, setAvailableProjects] = useState([]);
+  const [psProjectsMap, setPsProjectsMap] = useState({});
+  const [loadingProjects, setLoadingProjects] = useState(false);
+  const [form] = Form.useForm();
+
+  const axiosPrivate = useAxiosPrivate();
+  const { setAlertDetails } = useAlertStore();
+  const { sessionDetails } = useSessionStore();
+
+  useEffect(() => {
+    fetchLinks();
+    fetchPSProjects(); // Fetch PS projects to build name mapping
+  }, [project.id]);
+
+  const fetchPSProjects = async () => {
+    try {
+      const response = await axiosPrivate.get(
+        `/api/v1/unstract/${sessionDetails?.orgId}/prompt-studio/`
+      );
+      const projects = response.data.results || response.data || [];
+      // Build a map of PS project ID -> tool name
+      const projectsMap = {};
+      projects.forEach((proj) => {
+        projectsMap[proj.id] = proj.tool_name || "Unnamed Project";
+      });
+      setPsProjectsMap(projectsMap);
+    } catch (error) {
+      console.error("Failed to fetch PS projects for name mapping:", error);
+    }
+  };
+
+  const fetchLinks = async () => {
+    setLoading(true);
+    try {
+      const response = await axiosPrivate.get(
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-links/`,
+        {
+          params: { lookup_project_id: project.id },
+        }
+      );
+      setLinks(response.data.results || []);
+    } catch (error) {
+      console.error("Failed to fetch linked projects:", error);
+      setAlertDetails({
+        type: "error",
+        content:
+          error.response?.data?.detail || "Failed to fetch linked projects",
+      });
+    } finally {
+      setLoading(false);
+    }
+  };
+
+  const fetchAvailableProjects = async () => {
+    setLoadingProjects(true);
+    try {
+      const response = await axiosPrivate.get(
+        `/api/v1/unstract/${sessionDetails?.orgId}/prompt-studio/`
+      );
+      const projects = response.data.results || response.data || [];
+      console.log("Fetched available projects:", projects);
+      console.log("Number of projects fetched:", projects.length);
+
+      // Filter out already linked projects
+      const linkedProjectIds = links.map(
+        (link) => link.prompt_studio_project_id
+      );
+      console.log("Already linked project IDs:", linkedProjectIds);
+
+      const unlinkedProjects = projects.filter(
+        (p) => !linkedProjectIds.includes(p.tool_id)
+      );
+      console.log(
+        "Unlinked projects after filter:",
+        unlinkedProjects.map((p) => ({ tool_id: p.tool_id, id: p.id }))
+      );
+      console.log("Unlinked projects:", unlinkedProjects);
+      console.log("Number of unlinked projects:", unlinkedProjects.length);
+      console.log("Projects for selection:", projects);
+
+      setAvailableProjects(unlinkedProjects);
+
+      // Check for duplicate IDs
+      console.log(
+        "Raw projects before filter:",
+        projects.map((p) => ({ tool_id: p.tool_id, id: p.id }))
+      );
+      const ids = unlinkedProjects.map((p) => p.tool_id);
+      const uniqueIds = new Set(ids);
+      if (ids.length !== uniqueIds.size) {
+        console.warn("Warning: Duplicate project IDs detected!", ids);
+      }
+
+      console.log(
+        "Available projects for selection:",
+        unlinkedProjects.map((p) => ({ id: p.tool_id, name: p.tool_name }))
+      );
+
+      if (unlinkedProjects.length === 0 && projects.length > 0) {
+        setAlertDetails({
+          type: "info",
+          content: "All Prompt Studio projects are already linked",
+        });
+      }
+    } catch (error) {
+      console.error("Failed to fetch Prompt Studio projects:", error);
+      setAlertDetails({
+        type: "error",
+        content: "Failed to fetch available Prompt Studio projects",
+      });
+    } finally {
+      setLoadingProjects(false);
+    }
+  };
+
+  const handleLink = async () => {
+    try {
+      console.log("handleLink called");
+      console.log("Current form field values:", form.getFieldsValue());
+
+      const values = await form.validateFields();
+      console.log("Validated form values:", values);
+      const selectedProject = values.prompt_studio_project;
+      console.log("Selected project ID:", selectedProject);
+
+      if (!selectedProject) {
+        console.error("No project selected!");
+        setAlertDetails({
+          type: "error",
+          content: "Please select a project to link",
+        });
+        return;
+      }
+
+      await axiosPrivate.post(
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-links/`,
+        {
+          prompt_studio_project_id: selectedProject,
+          lookup_project: project.id,
+        },
+        {
+          headers: {
+            "X-CSRFToken": sessionDetails?.csrfToken,
+          },
+        }
+      );
+
+      setAlertDetails({
+        type: "success",
+        content: "Project linked successfully",
+      });
+      setLinkModalOpen(false);
+      form.resetFields();
+      fetchLinks();
+    } catch (error) {
+      console.error("Link error:", error);
+      if (error.errorFields) {
+        // Form validation error
+        console.log("Validation errors:", error.errorFields);
+        return;
+      }
+      setAlertDetails({
+        type: "error",
+        content: error.response?.data?.detail || "Failed to link project",
+      });
+    }
+  };
+
+  const handleUnlink = async (linkId) => {
+    Modal.confirm({
+      title: "Unlink Project",
+      content: "Are you sure you want to unlink this Prompt Studio project?",
+      okText: "Unlink",
+      okType: "danger",
+      onOk: async () => {
+        try {
+          await axiosPrivate.delete(
+            `/api/v1/unstract/${sessionDetails?.orgId}/lookup-links/${linkId}/`,
+            {
+              headers: {
+                "X-CSRFToken": sessionDetails?.csrfToken,
+              },
+            }
+          );
+          setAlertDetails({
+            type: "success",
+            content: "Project unlinked successfully",
+          });
+          fetchLinks();
+        } catch (error) {
+          console.error("Failed to unlink project:", error);
+          setAlertDetails({
+            type: "error",
+            content: error.response?.data?.detail || "Failed to unlink project",
+          });
+        }
+      },
+    });
+  };
+
+  const columns = [
+    {
+      title: "Prompt Studio Project",
+      key: "project",
+      render: (_, record) => (
+        <Space>
+          <FolderOutlined />
+          <Text strong>
+            {psProjectsMap[record.prompt_studio_project_id] ||
+              `Project ${record.prompt_studio_project_id.substring(0, 8)}...`}
+          </Text>
+        </Space>
+      ),
+    },
+    {
+      title: "Linked Date",
+      dataIndex: "created_at",
+      key: "created_at",
+      render: (date) => new Date(date).toLocaleDateString(),
+    },
+    {
+      title: "Status",
+      key: "status",
+      render: () => <Tag color="green">Active</Tag>,
+    },
+    {
+      title: "Actions",
+      key: "actions",
+      render: (_, record) => (
+        <Button
+          icon={<DisconnectOutlined />}
+          danger
+          size="small"
+          onClick={() => handleUnlink(record.id)}
+        >
+          Unlink
+        </Button>
+      ),
+    },
+  ];
+
+  return (
+    <div className="linked-projects-tab">
+      <div className="tab-header">
+        <div>
+          <Title level={4}>Linked Prompt Studio Projects</Title>
+          <Text type="secondary">
+            Prompt Studio projects that can use this Look-Up for enrichment
+          </Text>
+        </div>
+        <Button
+          type="primary"
+          icon={<PlusOutlined />}
+          onClick={async () => {
+            setLinkModalOpen(true);
+            await fetchAvailableProjects();
+          }}
+        >
+          Link Project
+        </Button>
+      </div>
+
+      <Table
+        columns={columns}
+        dataSource={links}
+        loading={loading}
+        rowKey="id"
+        pagination={{
+          pageSize: 10,
+          showSizeChanger: true,
+        }}
+        locale={{
+          emptyText: "No linked projects. Click 'Link Project' to get started.",
+        }}
+      />
+
+      <Modal
+        title="Link Prompt Studio Project"
+        open={linkModalOpen}
+        onCancel={() => {
+          setLinkModalOpen(false);
+          form.resetFields();
+          setAvailableProjects([]);
+        }}
+        onOk={handleLink}
+        okText="Link"
+        confirmLoading={loading}
+        centered
+        maskClosable={false}
+      >
+        <Form form={form} layout="vertical">
+          <Form.Item
+            name="prompt_studio_project"
+            label="Select a Prompt Studio project to link with this Look-Up:"
+            rules={[
+              { required: true, message: "Please select a project to link" },
+            ]}
+          >
+            <Select
+              placeholder="Select a Prompt Studio project"
+              loading={loadingProjects}
+              showSearch
+              optionFilterProp="children"
+              notFoundContent={
+                loadingProjects ? "Loading..." : "No available projects"
+              }
+              onSelect={(value) => {
+                console.log("onSelect fired - value:", value);
+                const selected = availableProjects.find(
+                  (p) => p.tool_id === value
+                );
+                console.log("Selected project:", selected);
+              }}
+              onDropdownVisibleChange={(open) => {
+                console.log("Dropdown visible:", open);
+                if (open) {
+                  console.log(
+                    "Available projects count:",
+                    availableProjects.length
+                  );
+                  console.log("Projects:", availableProjects);
+                }
+              }}
+            >
+              {availableProjects.map((p) => (
+                <Option key={p.tool_id} value={p.tool_id}>
+                  {p.tool_name || "Unnamed Project"}
+                </Option>
+              ))}
+            </Select>
+          </Form.Item>
+          <Text type="secondary">
+            Linked projects will be able to use this Look-Up for data enrichment
+            during prompt execution.
+          </Text>
+        </Form>
+      </Modal>
+    </div>
+  );
+}
+
+LinkedProjectsTab.propTypes = {
+  project: PropTypes.shape({
+    id: PropTypes.string.isRequired,
+  }).isRequired,
+};
diff --git a/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.css b/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.css
new file mode 100644
index 0000000000..c8f4f5171f
--- /dev/null
+++ b/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.css
@@ -0,0 +1,17 @@
+/* Profile Form Modal Styles */
+
+.ant-modal-title {
+  font-weight: 600;
+}
+
+.ant-form-item-label > label {
+  font-weight: 500;
+}
+
+.ant-typography-secondary {
+  font-size: 12px;
+}
+
+.ant-form-vertical .ant-form-item-label {
+  padding: 0 0 4px;
+}
diff --git a/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx b/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx
new file mode 100644
index 0000000000..4275512186
--- /dev/null
+++ b/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx
@@ -0,0 +1,433 @@
+import {
+  Modal,
+  Form,
+  Input,
+  Select,
+  InputNumber,
+  Row,
+  Col,
+  Typography,
+} from "antd";
+import { useEffect, useState } from "react";
+import PropTypes from "prop-types";
+
+import { useAxiosPrivate } from "../../../hooks/useAxiosPrivate";
+import { useExceptionHandler } from "../../../hooks/useExceptionHandler";
+import { useAlertStore } from "../../../store/alert-store";
+import { useSessionStore } from "../../../store/session-store";
+import "./ProfileFormModal.css";
+
+const { Option } = Select;
+
+function ProfileFormModal({ projectId, profileId, onClose }) {
+  const [form] = Form.useForm();
+  const [loading, setLoading] = useState(false);
+  const [adaptersLoading, setAdaptersLoading] = useState(false);
+
+  const [llmItems, setLlmItems] = useState([]);
+  const [vectorDbItems, setVectorDbItems] = useState([]);
+  const [embeddingItems, setEmbeddingItems] = useState([]);
+  const [x2TextItems, setX2TextItems] = useState([]);
+  const [adaptersLoaded, setAdaptersLoaded] = useState(false);
+
+  const axiosPrivate = useAxiosPrivate();
+  const { sessionDetails } = useSessionStore();
+  const { setAlertDetails } = useAlertStore();
+  const handleException = useExceptionHandler();
+
+  const isEdit = !!profileId;
+  const modalTitle = isEdit ? "Edit Profile" : "Add New Profile";
+
+  // Fetch adapters
+  useEffect(() => {
+    fetchAdapters();
+  }, []);
+
+  // Load profile data for editing (only after adapters are loaded)
+  useEffect(() => {
+    if (profileId && adaptersLoaded) {
+      fetchProfileData();
+    }
+  }, [profileId, adaptersLoaded]);
+
+  const fetchAdapters = () => {
+    setAdaptersLoading(true);
+    const requestOptions = {
+      method: "GET",
+      url: `/api/v1/unstract/${sessionDetails?.orgId}/adapter`,
+    };
+
+    axiosPrivate(requestOptions)
+      .then((res) => {
+        const data = res?.data || [];
+
+        const llmList = [];
+        const vectorDbList = [];
+        const embeddingList = [];
+        const x2TextList = [];
+
+        data.forEach((item) => {
+          const option = {
+            value: item?.id,
+            label: item?.adapter_name,
+          };
+
+          if (item?.adapter_type === "LLM") {
+            llmList.push(option);
+          } else if (item?.adapter_type === "VECTOR_DB") {
+            vectorDbList.push(option);
+          } else if (item?.adapter_type === "EMBEDDING") {
+            embeddingList.push(option);
+          } else if (item?.adapter_type === "X2TEXT") {
+            x2TextList.push(option);
+          }
+        });
+
+        setLlmItems(llmList);
+        setVectorDbItems(vectorDbList);
+        setEmbeddingItems(embeddingList);
+        setX2TextItems(x2TextList);
+      })
+      .catch((err) => {
+        handleException(err, "Failed to fetch adapters");
+      })
+      .finally(() => {
+        setAdaptersLoading(false);
+        setAdaptersLoaded(true);
+      });
+  };
+
+  const fetchProfileData = () => {
+    setLoading(true);
+    const requestOptions = {
+      method: "GET",
+      url: `/api/v1/unstract/${sessionDetails?.orgId}/lookup-profiles/${profileId}/`,
+      headers: {
+        "X-CSRFToken": sessionDetails?.csrfToken,
+      },
+    };
+
+    axiosPrivate(requestOptions)
+      .then((res) => {
+        const profile = res?.data;
+
+        // Find adapter IDs by matching adapter names from the profile response
+        // The API returns adapter names as strings (e.g., "Azure LLM")
+        const llmItem = llmItems.find((item) => item?.label === profile?.llm);
+        const embeddingItem = embeddingItems.find(
+          (item) => item?.label === profile?.embedding_model
+        );
+        const vectorDbItem = vectorDbItems.find(
+          (item) => item?.label === profile?.vector_store
+        );
+        const x2textItem = x2TextItems.find(
+          (item) => item?.label === profile?.x2text
+        );
+
+        form.setFieldsValue({
+          profile_name: profile?.profile_name,
+          llm: llmItem?.value || null,
+          embedding_model: embeddingItem?.value || null,
+          vector_store: vectorDbItem?.value || null,
+          x2text: x2textItem?.value || null,
+          chunk_size: profile?.chunk_size,
+          chunk_overlap: profile?.chunk_overlap,
+          similarity_top_k: profile?.similarity_top_k,
+        });
+      })
+      .catch((err) => {
+        handleException(err, "Failed to fetch profile data");
+      })
+      .finally(() => {
+        setLoading(false);
+      });
+  };
+
+  const handleSubmit = () => {
+    form
+      .validateFields()
+      .then((values) => {
+        setLoading(true);
+
+        const payload = {
+          profile_name: values.profile_name,
+          lookup_project: projectId,
+          llm: values.llm,
+          embedding_model: values.embedding_model,
+          vector_store: values.vector_store,
+          x2text: values.x2text,
+          chunk_size: values.chunk_size,
+          chunk_overlap: values.chunk_overlap,
+          similarity_top_k: values.similarity_top_k,
+        };
+
+        const requestOptions = {
+          method: isEdit ? "PATCH" : "POST",
+          url: isEdit
+            ? `/api/v1/unstract/${sessionDetails?.orgId}/lookup-profiles/${profileId}/`
+            : `/api/v1/unstract/${sessionDetails?.orgId}/lookup-profiles/`,
+          headers: {
+            "X-CSRFToken": sessionDetails?.csrfToken,
+            "Content-Type": "application/json",
+          },
+          data: payload,
+        };
+
+        axiosPrivate(requestOptions)
+          .then(() => {
+            setAlertDetails({
+              type: "success",
+              content: `Profile ${isEdit ? "updated" : "created"} successfully`,
+            });
+            onClose(true); // Close and refresh
+          })
+          .catch((err) => {
+            handleException(
+              err,
+              `Failed to ${isEdit ? "update" : "create"} profile`
+            );
+          })
+          .finally(() => {
+            setLoading(false);
+          });
+      })
+      .catch((info) => {
+        console.log("Validation Failed:", info);
+      });
+  };
+
+  return (
+    <Modal
+      title={modalTitle}
+      open={true}
+      onOk={handleSubmit}
+      onCancel={() => onClose(false)}
+      width={700}
+      confirmLoading={loading}
+      okText={isEdit ? "Update" : "Create"}
+      cancelText="Cancel"
+    >
+      <Form
+        form={form}
+        layout="vertical"
+        initialValues={{
+          chunk_size: 1000,
+          chunk_overlap: 200,
+          similarity_top_k: 5,
+        }}
+      >
+        <Form.Item
+          label="Profile Name"
+          name="profile_name"
+          rules={[
+            { required: true, message: "Please enter profile name" },
+            { whitespace: true, message: "Profile name cannot be empty" },
+          ]}
+        >
+          <Input placeholder="Enter profile name" />
+        </Form.Item>
+
+        <Typography.Text strong>Adapter Configuration</Typography.Text>
+        <div style={{ marginTop: 16 }}>
+          <Row gutter={16}>
+            <Col span={12}>
+              <Form.Item
+                label="LLM"
+                name="llm"
+                rules={[{ required: true, message: "Please select an LLM" }]}
+              >
+                <Select
+                  placeholder="Select LLM"
+                  loading={adaptersLoading}
+                  showSearch
+                  optionFilterProp="label"
+                >
+                  {llmItems.map((item) => (
+                    <Option
+                      key={item.value}
+                      value={item.value}
+                      label={item.label}
+                    >
+                      {item.label}
+                    </Option>
+                  ))}
+                </Select>
+              </Form.Item>
+            </Col>
+
+            <Col span={12}>
+              <Form.Item
+                label="Embedding Model"
+                name="embedding_model"
+                rules={[
+                  {
+                    required: true,
+                    message: "Please select an embedding model",
+                  },
+                ]}
+              >
+                <Select
+                  placeholder="Select embedding model"
+                  loading={adaptersLoading}
+                  showSearch
+                  optionFilterProp="label"
+                >
+                  {embeddingItems.map((item) => (
+                    <Option
+                      key={item.value}
+                      value={item.value}
+                      label={item.label}
+                    >
+                      {item.label}
+                    </Option>
+                  ))}
+                </Select>
+              </Form.Item>
+            </Col>
+          </Row>
+
+          <Row gutter={16}>
+            <Col span={12}>
+              <Form.Item
+                label="Vector Database"
+                name="vector_store"
+                rules={[
+                  {
+                    required: true,
+                    message: "Please select a vector database",
+                  },
+                ]}
+              >
+                <Select
+                  placeholder="Select vector database"
+                  loading={adaptersLoading}
+                  showSearch
+                  optionFilterProp="label"
+                >
+                  {vectorDbItems.map((item) => (
+                    <Option
+                      key={item.value}
+                      value={item.value}
+                      label={item.label}
+                    >
+                      {item.label}
+                    </Option>
+                  ))}
+                </Select>
+              </Form.Item>
+            </Col>
+
+            <Col span={12}>
+              <Form.Item
+                label="Text Extractor"
+                name="x2text"
+                rules={[
+                  { required: true, message: "Please select a text extractor" },
+                ]}
+              >
+                <Select
+                  placeholder="Select text extractor"
+                  loading={adaptersLoading}
+                  showSearch
+                  optionFilterProp="label"
+                >
+                  {x2TextItems.map((item) => (
+                    <Option
+                      key={item.value}
+                      value={item.value}
+                      label={item.label}
+                    >
+                      {item.label}
+                    </Option>
+                  ))}
+                </Select>
+              </Form.Item>
+            </Col>
+          </Row>
+        </div>
+
+        <Typography.Text strong>Chunking Configuration</Typography.Text>
+        <div style={{ marginTop: 16 }}>
+          <Row gutter={16}>
+            <Col span={8}>
+              <Form.Item
+                label="Chunk Size"
+                name="chunk_size"
+                rules={[
+                  { required: true, message: "Please enter chunk size" },
+                  {
+                    type: "number",
+                    min: 100,
+                    max: 10000,
+                    message: "Chunk size must be between 100 and 10000",
+                  },
+                ]}
+              >
+                <InputNumber
+                  style={{ width: "100%" }}
+                  placeholder="1000"
+                  min={100}
+                  max={10000}
+                />
+              </Form.Item>
+            </Col>
+
+            <Col span={8}>
+              <Form.Item
+                label="Chunk Overlap"
+                name="chunk_overlap"
+                rules={[
+                  { required: true, message: "Please enter chunk overlap" },
+                  {
+                    type: "number",
+                    min: 0,
+                    max: 1000,
+                    message: "Chunk overlap must be between 0 and 1000",
+                  },
+                ]}
+              >
+                <InputNumber
+                  style={{ width: "100%" }}
+                  placeholder="200"
+                  min={0}
+                  max={1000}
+                />
+              </Form.Item>
+            </Col>
+
+            <Col span={8}>
+              <Form.Item
+                label="Similarity Top K"
+                name="similarity_top_k"
+                rules={[
+                  { required: true, message: "Please enter similarity top k" },
+                  {
+                    type: "number",
+                    min: 1,
+                    max: 20,
+                    message: "Similarity top k must be between 1 and 20",
+                  },
+                ]}
+              >
+                <InputNumber
+                  style={{ width: "100%" }}
+                  placeholder="5"
+                  min={1}
+                  max={20}
+                />
+              </Form.Item>
+            </Col>
+          </Row>
+        </div>
+      </Form>
+    </Modal>
+  );
+}
+
+ProfileFormModal.propTypes = {
+  projectId: PropTypes.string.isRequired,
+  profileId: PropTypes.string,
+  onClose: PropTypes.func.isRequired,
+};
+
+export { ProfileFormModal };
diff --git a/frontend/src/components/lookups/profile-management-tab/ProfileManagementTab.css b/frontend/src/components/lookups/profile-management-tab/ProfileManagementTab.css
new file mode 100644
index 0000000000..9a85d74d0a
--- /dev/null
+++ b/frontend/src/components/lookups/profile-management-tab/ProfileManagementTab.css
@@ -0,0 +1,42 @@
+.profile-management-container {
+  padding: 20px 0;
+  height: 100%;
+  max-height: calc(100vh - 380px);
+  overflow-y: auto;
+  overflow-x: hidden;
+}
+
+.profile-header {
+  font-size: 16px;
+  font-weight: 600;
+  margin-bottom: 8px;
+}
+
+.profile-description {
+  margin-bottom: 16px;
+  font-size: 13px;
+}
+
+.action-buttons-container {
+  display: flex;
+  gap: 8px;
+  align-items: center;
+  justify-content: center;
+}
+
+.profile-icon {
+  font-size: 14px;
+}
+
+.display-flex-right {
+  display: flex;
+  justify-content: flex-end;
+  margin-top: 16px;
+  padding-right: 20px;
+}
+
+.display-flex-align-center {
+  display: flex;
+  align-items: center;
+  justify-content: center;
+}
diff --git a/frontend/src/components/lookups/profile-management-tab/ProfileManagementTab.jsx b/frontend/src/components/lookups/profile-management-tab/ProfileManagementTab.jsx
new file mode 100644
index 0000000000..90cd8c6849
--- /dev/null
+++ b/frontend/src/components/lookups/profile-management-tab/ProfileManagementTab.jsx
@@ -0,0 +1,293 @@
+import { DeleteOutlined, EditOutlined, CopyOutlined } from "@ant-design/icons";
+import { Button, Radio, Table, Tooltip, Typography } from "antd";
+import { useEffect, useState } from "react";
+import PropTypes from "prop-types";
+
+import { useAxiosPrivate } from "../../../hooks/useAxiosPrivate";
+import { useExceptionHandler } from "../../../hooks/useExceptionHandler";
+import { useAlertStore } from "../../../store/alert-store";
+import { useSessionStore } from "../../../store/session-store";
+import { ConfirmModal } from "../../widgets/confirm-modal/ConfirmModal";
+import { CustomButton } from "../../widgets/custom-button/CustomButton";
+import SpaceWrapper from "../../widgets/space-wrapper/SpaceWrapper";
+import { ProfileFormModal } from "./ProfileFormModal";
+import "./ProfileManagementTab.css";
+
+const columns = [
+  {
+    title: "Name",
+    dataIndex: "name",
+    key: "name",
+  },
+  {
+    title: "LLM",
+    dataIndex: "llm",
+    key: "llm",
+  },
+  {
+    title: "Embedding Model",
+    dataIndex: "embedding_model",
+    key: "embedding_model",
+  },
+  {
+    title: "Vector Database",
+    dataIndex: "vector_db",
+    key: "vector_db",
+  },
+  {
+    title: "Text Extractor",
+    dataIndex: "text_extractor",
+    key: "text_extractor",
+  },
+  {
+    title: "Actions",
+    dataIndex: "actions",
+    key: "actions",
+    width: 120,
+  },
+  {
+    title: "Select Default",
+    dataIndex: "select",
+    key: "select",
+    align: "center",
+  },
+];
+
+function ProfileManagementTab({ projectId }) {
+  const [rows, setRows] = useState([]);
+  const [profiles, setProfiles] = useState([]);
+  const [defaultProfile, setDefaultProfile] = useState(null);
+  const [isModalOpen, setIsModalOpen] = useState(false);
+  const [editProfileId, setEditProfileId] = useState(null);
+  const [loading, setLoading] = useState(false);
+
+  const axiosPrivate = useAxiosPrivate();
+  const { sessionDetails } = useSessionStore();
+  const { setAlertDetails } = useAlertStore();
+  const handleException = useExceptionHandler();
+
+  const MAX_PROFILE_COUNT = 10;
+  const isMaxProfile = profiles.length >= MAX_PROFILE_COUNT;
+
+  // Fetch profiles for the lookup project
+  const fetchProfiles = () => {
+    setLoading(true);
+    const requestOptions = {
+      method: "GET",
+      url: `/api/v1/unstract/${sessionDetails?.orgId}/lookup-profiles/?lookup_project=${projectId}`,
+      headers: {
+        "X-CSRFToken": sessionDetails?.csrfToken,
+      },
+    };
+
+    axiosPrivate(requestOptions)
+      .then((res) => {
+        const profilesData = res?.data?.results || [];
+        setProfiles(profilesData);
+
+        // Find default profile
+        const defaultProf = profilesData.find((p) => p.is_default);
+        if (defaultProf) {
+          setDefaultProfile(defaultProf.profile_id);
+        }
+      })
+      .catch((err) => {
+        handleException(err, "Failed to fetch profiles");
+      })
+      .finally(() => {
+        setLoading(false);
+      });
+  };
+
+  useEffect(() => {
+    if (projectId) {
+      fetchProfiles();
+    }
+  }, [projectId]);
+
+  const handleSetDefault = (profileId) => {
+    const requestOptions = {
+      method: "POST",
+      url: `/api/v1/unstract/${sessionDetails?.orgId}/lookup-profiles/${profileId}/set-default/`,
+      headers: {
+        "X-CSRFToken": sessionDetails?.csrfToken,
+        "Content-Type": "application/json",
+      },
+    };
+
+    axiosPrivate(requestOptions)
+      .then(() => {
+        setDefaultProfile(profileId);
+        setAlertDetails({
+          type: "success",
+          content: "Default profile updated successfully",
+        });
+        fetchProfiles(); // Refresh to get updated state
+      })
+      .catch((err) => {
+        handleException(err, "Failed to set default profile");
+      });
+  };
+
+  const handleEdit = (profileId) => {
+    setEditProfileId(profileId);
+    setIsModalOpen(true);
+  };
+
+  const copyProfileId = (profileId) => {
+    navigator.clipboard.writeText(profileId);
+    setAlertDetails({
+      type: "success",
+      content: "Profile ID copied to clipboard",
+    });
+  };
+
+  const handleDelete = (profileId) => {
+    const requestOptions = {
+      method: "DELETE",
+      url: `/api/v1/unstract/${sessionDetails?.orgId}/lookup-profiles/${profileId}/`,
+      headers: {
+        "X-CSRFToken": sessionDetails?.csrfToken,
+      },
+    };
+
+    axiosPrivate(requestOptions)
+      .then(() => {
+        setAlertDetails({
+          type: "success",
+          content: "Profile deleted successfully",
+        });
+        fetchProfiles(); // Refresh list
+      })
+      .catch((err) => {
+        handleException(err, "Failed to delete profile");
+      });
+  };
+
+  const handleModalClose = (shouldRefresh) => {
+    setIsModalOpen(false);
+    setEditProfileId(null);
+    if (shouldRefresh) {
+      fetchProfiles();
+    }
+  };
+
+  useEffect(() => {
+    const modifiedRows = profiles.map((item) => {
+      return {
+        key: item?.profile_id,
+        name: item?.profile_name || "",
+        llm: item?.llm || "N/A",
+        embedding_model: item?.embedding_model || "N/A",
+        vector_db: item?.vector_store || "N/A",
+        text_extractor: item?.x2text || "N/A",
+        actions: (
+          <div className="action-buttons-container">
+            <Tooltip title="Copy Profile ID">
+              <Button
+                size="small"
+                className="display-flex-align-center"
+                onClick={() => copyProfileId(item?.profile_id)}
+              >
+                <CopyOutlined className="profile-icon" />
+              </Button>
+            </Tooltip>
+            <Button
+              size="small"
+              className="display-flex-align-center"
+              onClick={() => handleEdit(item?.profile_id)}
+            >
+              <EditOutlined className="profile-icon" />
+            </Button>
+            <ConfirmModal
+              handleConfirm={() => handleDelete(item?.profile_id)}
+              content="The profile will be permanently deleted."
+            >
+              <Tooltip
+                title={
+                  defaultProfile === item?.profile_id &&
+                  "Default profile cannot be deleted"
+                }
+              >
+                <Button
+                  size="small"
+                  className="display-flex-align-center"
+                  disabled={defaultProfile === item?.profile_id}
+                >
+                  <DeleteOutlined className="profile-icon" />
+                </Button>
+              </Tooltip>
+            </ConfirmModal>
+          </div>
+        ),
+        select: (
+          <Radio
+            checked={defaultProfile === item?.profile_id}
+            onClick={() => handleSetDefault(item?.profile_id)}
+          />
+        ),
+      };
+    });
+    setRows(modifiedRows);
+  }, [profiles, defaultProfile]);
+
+  return (
+    <div className="profile-management-container">
+      <SpaceWrapper>
+        <div>
+          <Typography.Text className="profile-header">
+            Profile Settings
+          </Typography.Text>
+          <Typography.Paragraph
+            type="secondary"
+            className="profile-description"
+          >
+            Manage adapter configurations for text extraction, embeddings,
+            vector storage, and LLM processing.
+          </Typography.Paragraph>
+        </div>
+        <div>
+          <Table
+            columns={columns}
+            dataSource={rows}
+            size="small"
+            bordered
+            loading={loading}
+            pagination={{ pageSize: 10 }}
+          />
+        </div>
+      </SpaceWrapper>
+      <div className="display-flex-right">
+        <Tooltip
+          title={
+            isMaxProfile
+              ? `Max profile count (${MAX_PROFILE_COUNT})`
+              : "Add New Profile"
+          }
+        >
+          <CustomButton
+            type="primary"
+            onClick={() => setIsModalOpen(true)}
+            disabled={isMaxProfile}
+          >
+            Add New Profile
+          </CustomButton>
+        </Tooltip>
+      </div>
+
+      {isModalOpen && (
+        <ProfileFormModal
+          projectId={projectId}
+          profileId={editProfileId}
+          onClose={handleModalClose}
+        />
+      )}
+    </div>
+  );
+}
+
+ProfileManagementTab.propTypes = {
+  projectId: PropTypes.string.isRequired,
+};
+
+export { ProfileManagementTab };
diff --git a/frontend/src/components/lookups/project-detail/LookUpProjectDetail.css b/frontend/src/components/lookups/project-detail/LookUpProjectDetail.css
new file mode 100644
index 0000000000..b2f210c32b
--- /dev/null
+++ b/frontend/src/components/lookups/project-detail/LookUpProjectDetail.css
@@ -0,0 +1,39 @@
+.lookup-project-detail {
+  padding: 24px;
+  height: 100%;
+  max-height: calc(100vh - 120px);
+  overflow-y: auto;
+  overflow-x: hidden;
+}
+
+.project-header {
+  margin-bottom: 24px;
+  flex-shrink: 0;
+}
+
+.project-info {
+  display: flex;
+  justify-content: space-between;
+  align-items: center;
+  margin-top: 16px;
+  flex-wrap: wrap;
+  gap: 12px;
+}
+
+.loading-container {
+  display: flex;
+  justify-content: center;
+  align-items: center;
+  min-height: 400px;
+}
+
+/* Ensure tabs content is scrollable */
+.lookup-project-detail .ant-card {
+  flex: 1;
+  overflow: hidden;
+}
+
+.lookup-project-detail .ant-tabs-content {
+  max-height: calc(100vh - 320px);
+  overflow-y: auto;
+}
diff --git a/frontend/src/components/lookups/project-detail/LookUpProjectDetail.jsx b/frontend/src/components/lookups/project-detail/LookUpProjectDetail.jsx
new file mode 100644
index 0000000000..f1a4b7e85e
--- /dev/null
+++ b/frontend/src/components/lookups/project-detail/LookUpProjectDetail.jsx
@@ -0,0 +1,321 @@
+import { useEffect, useState } from "react";
+import { useParams, useNavigate } from "react-router-dom";
+import {
+  Card,
+  Tabs,
+  Typography,
+  Button,
+  Space,
+  Spin,
+  Tag,
+  Modal,
+  Form,
+  Input,
+  Select,
+  Popconfirm,
+} from "antd";
+import {
+  ArrowLeftOutlined,
+  EditOutlined,
+  DeleteOutlined,
+} from "@ant-design/icons";
+
+import { useAxiosPrivate } from "../../../hooks/useAxiosPrivate";
+import { useAlertStore } from "../../../store/alert-store";
+import { useSessionStore } from "../../../store/session-store";
+import { ReferenceDataTab } from "../reference-data-tab/ReferenceDataTab";
+import { TemplateTab } from "../template-tab/TemplateTab";
+import { ProfileManagementTab } from "../profile-management-tab/ProfileManagementTab";
+import { LinkedProjectsTab } from "../linked-projects-tab/LinkedProjectsTab";
+import { ExecutionHistoryTab } from "../execution-history-tab/ExecutionHistoryTab";
+import { DebugTab } from "../debug-tab/DebugTab";
+import "./LookUpProjectDetail.css";
+
+const { Title, Text } = Typography;
+const { TextArea } = Input;
+
+const REFERENCE_DATA_TYPES = [
+  { value: "vendor_catalog", label: "Vendor Catalog" },
+  { value: "product_catalog", label: "Product Catalog" },
+  { value: "customer_database", label: "Customer Database" },
+  { value: "pricing_data", label: "Pricing Data" },
+  { value: "compliance_rules", label: "Compliance Rules" },
+  { value: "custom", label: "Custom" },
+];
+
+export function LookUpProjectDetail() {
+  const [project, setProject] = useState(null);
+  const [loading, setLoading] = useState(true);
+  const [activeTab, setActiveTab] = useState("reference");
+  const [editModalOpen, setEditModalOpen] = useState(false);
+  const [editLoading, setEditLoading] = useState(false);
+  const [deleteLoading, setDeleteLoading] = useState(false);
+
+  const [form] = Form.useForm();
+  const { projectId } = useParams();
+  const navigate = useNavigate();
+  const axiosPrivate = useAxiosPrivate();
+  const { setAlertDetails } = useAlertStore();
+  const { sessionDetails } = useSessionStore();
+
+  useEffect(() => {
+    fetchProject();
+  }, [projectId]);
+
+  const fetchProject = async () => {
+    setLoading(true);
+    try {
+      const response = await axiosPrivate.get(
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/${projectId}/`
+      );
+      setProject(response.data);
+    } catch (error) {
+      setAlertDetails({
+        type: "error",
+        content: "Failed to fetch project details",
+      });
+      navigate("../");
+    } finally {
+      setLoading(false);
+    }
+  };
+
+  const handleOpenEditModal = () => {
+    form.setFieldsValue({
+      name: project.name,
+      description: project.description || "",
+      reference_data_type: project.reference_data_type,
+    });
+    setEditModalOpen(true);
+  };
+
+  const handleEditProject = async () => {
+    try {
+      const values = await form.validateFields();
+      setEditLoading(true);
+
+      // Get CSRF token from cookie as fallback
+      const csrfToken =
+        sessionDetails?.csrfToken ||
+        document.cookie
+          .split("; ")
+          .find((row) => row.startsWith("csrftoken="))
+          ?.split("=")[1];
+
+      await axiosPrivate.patch(
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/${projectId}/`,
+        values,
+        {
+          headers: {
+            "X-CSRFToken": csrfToken,
+            "Content-Type": "application/json",
+          },
+        }
+      );
+
+      setAlertDetails({
+        type: "success",
+        content: "Project updated successfully",
+      });
+      setEditModalOpen(false);
+      fetchProject();
+    } catch (error) {
+      setAlertDetails({
+        type: "error",
+        content: error.response?.data?.detail || "Failed to update project",
+      });
+    } finally {
+      setEditLoading(false);
+    }
+  };
+
+  const handleDeleteProject = async () => {
+    try {
+      setDeleteLoading(true);
+
+      // Get CSRF token from cookie as fallback
+      const csrfToken =
+        sessionDetails?.csrfToken ||
+        document.cookie
+          .split("; ")
+          .find((row) => row.startsWith("csrftoken="))
+          ?.split("=")[1];
+
+      await axiosPrivate.delete(
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/${projectId}/`,
+        {
+          headers: {
+            "X-CSRFToken": csrfToken,
+          },
+        }
+      );
+
+      setAlertDetails({
+        type: "success",
+        content: "Project deleted successfully",
+      });
+      navigate("../");
+    } catch (error) {
+      setAlertDetails({
+        type: "error",
+        content: error.response?.data?.detail || "Failed to delete project",
+      });
+    } finally {
+      setDeleteLoading(false);
+    }
+  };
+
+  if (loading) {
+    return (
+      <div className="loading-container">
+        <Spin size="large" />
+      </div>
+    );
+  }
+
+  if (!project) {
+    return null;
+  }
+
+  const tabItems = [
+    {
+      key: "reference",
+      label: "Reference Data",
+      children: <ReferenceDataTab project={project} onUpdate={fetchProject} />,
+    },
+    {
+      key: "template",
+      label: "Template",
+      children: <TemplateTab project={project} onUpdate={fetchProject} />,
+    },
+    {
+      key: "profiles",
+      label: "Profiles",
+      children: <ProfileManagementTab projectId={projectId} />,
+    },
+    {
+      key: "linked",
+      label: "Linked Projects",
+      children: <LinkedProjectsTab project={project} />,
+    },
+    {
+      key: "history",
+      label: "Execution History",
+      children: <ExecutionHistoryTab project={project} />,
+    },
+    {
+      key: "debug",
+      label: "Debug",
+      children: <DebugTab project={project} />,
+    },
+  ];
+
+  return (
+    <div className="lookup-project-detail">
+      <div className="project-header">
+        <Space>
+          <Button icon={<ArrowLeftOutlined />} onClick={() => navigate("../")}>
+            Back
+          </Button>
+        </Space>
+
+        <div className="project-info">
+          <div>
+            <Title level={3}>{project.name}</Title>
+            {project.description && (
+              <Text type="secondary">{project.description}</Text>
+            )}
+          </div>
+          <Space>
+            <Tag color={project.is_active ? "green" : "orange"}>
+              {project.is_active ? "Active" : "Inactive"}
+            </Tag>
+            <Tag color="blue">
+              {project.reference_data_type?.replace(/_/g, " ").toUpperCase()}
+            </Tag>
+            <Button icon={<EditOutlined />} onClick={handleOpenEditModal}>
+              Edit
+            </Button>
+            <Popconfirm
+              title="Delete Project"
+              description="Are you sure you want to delete this project? This action cannot be undone."
+              onConfirm={handleDeleteProject}
+              okText="Delete"
+              cancelText="Cancel"
+              okButtonProps={{ danger: true, loading: deleteLoading }}
+            >
+              <Button icon={<DeleteOutlined />} danger loading={deleteLoading}>
+                Delete
+              </Button>
+            </Popconfirm>
+          </Space>
+        </div>
+      </div>
+
+      <Card>
+        <Tabs
+          activeKey={activeTab}
+          onChange={setActiveTab}
+          items={tabItems}
+          size="large"
+        />
+      </Card>
+
+      {/* Edit Project Modal */}
+      <Modal
+        title="Edit Project"
+        open={editModalOpen}
+        onCancel={() => setEditModalOpen(false)}
+        onOk={handleEditProject}
+        okText="Save"
+        confirmLoading={editLoading}
+        width={600}
+      >
+        <Form form={form} layout="vertical">
+          <Form.Item
+            name="name"
+            label="Project Name"
+            rules={[
+              { required: true, message: "Please enter a project name" },
+              { max: 100, message: "Name must be less than 100 characters" },
+            ]}
+          >
+            <Input placeholder="e.g., Vendor Enrichment" />
+          </Form.Item>
+
+          <Form.Item
+            name="description"
+            label="Description"
+            rules={[
+              {
+                max: 500,
+                message: "Description must be less than 500 characters",
+              },
+            ]}
+          >
+            <TextArea
+              rows={3}
+              placeholder="Describe the purpose of this Look-Up project..."
+            />
+          </Form.Item>
+
+          <Form.Item
+            name="reference_data_type"
+            label="Reference Data Type"
+            rules={[
+              {
+                required: true,
+                message: "Please select a reference data type",
+              },
+            ]}
+          >
+            <Select
+              placeholder="Select reference data type"
+              options={REFERENCE_DATA_TYPES}
+            />
+          </Form.Item>
+        </Form>
+      </Modal>
+    </div>
+  );
+}
diff --git a/frontend/src/components/lookups/project-list/LookUpProjectList.css b/frontend/src/components/lookups/project-list/LookUpProjectList.css
new file mode 100644
index 0000000000..e1fd34219e
--- /dev/null
+++ b/frontend/src/components/lookups/project-list/LookUpProjectList.css
@@ -0,0 +1,15 @@
+.lookup-project-list {
+  padding: 24px;
+  height: 100%;
+  max-height: calc(100vh - 120px);
+  overflow-y: auto;
+  overflow-x: hidden;
+}
+
+.lookup-header {
+  display: flex;
+  justify-content: space-between;
+  align-items: center;
+  margin-bottom: 24px;
+  flex-shrink: 0;
+}
diff --git a/frontend/src/components/lookups/project-list/LookUpProjectList.jsx b/frontend/src/components/lookups/project-list/LookUpProjectList.jsx
new file mode 100644
index 0000000000..1e935ed0e1
--- /dev/null
+++ b/frontend/src/components/lookups/project-list/LookUpProjectList.jsx
@@ -0,0 +1,278 @@
+import {
+  Button,
+  Card,
+  Input,
+  Space,
+  Table,
+  Tag,
+  Typography,
+  Popconfirm,
+} from "antd";
+import {
+  PlusOutlined,
+  SearchOutlined,
+  FileTextOutlined,
+  CloudUploadOutlined,
+  DeleteOutlined,
+} from "@ant-design/icons";
+import { useEffect, useState } from "react";
+import { useNavigate } from "react-router-dom";
+
+import { useAlertStore } from "../../../store/alert-store";
+import { useSessionStore } from "../../../store/session-store";
+import { useAxiosPrivate } from "../../../hooks/useAxiosPrivate";
+import { CreateProjectModal } from "../create-project-modal/CreateProjectModal";
+import "./LookUpProjectList.css";
+
+const { Title, Text } = Typography;
+const { Search } = Input;
+
+export function LookUpProjectList() {
+  const [projects, setProjects] = useState([]);
+  const [loading, setLoading] = useState(false);
+  const [searchText, setSearchText] = useState("");
+  const [createModalOpen, setCreateModalOpen] = useState(false);
+
+  const navigate = useNavigate();
+  const axiosPrivate = useAxiosPrivate();
+  const { setAlertDetails } = useAlertStore();
+  const { sessionDetails } = useSessionStore();
+
+  useEffect(() => {
+    if (sessionDetails?.orgId) {
+      fetchProjects();
+    }
+  }, [sessionDetails?.orgId]);
+
+  const fetchProjects = async () => {
+    setLoading(true);
+    try {
+      const response = await axiosPrivate.get(
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/`
+      );
+      setProjects(response.data.results || response.data || []);
+    } catch (error) {
+      setAlertDetails({
+        type: "error",
+        content: "Failed to fetch Look-Up projects",
+      });
+    } finally {
+      setLoading(false);
+    }
+  };
+
+  const handleCreateProject = async (values) => {
+    try {
+      const response = await axiosPrivate.post(
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/`,
+        values,
+        {
+          headers: {
+            "X-CSRFToken": sessionDetails?.csrfToken,
+          },
+        }
+      );
+      setAlertDetails({
+        type: "success",
+        content: "Look-Up project created successfully",
+      });
+      setCreateModalOpen(false);
+      fetchProjects();
+      navigate(response.data.id);
+    } catch (error) {
+      setAlertDetails({
+        type: "error",
+        content: error.response?.data?.detail || "Failed to create project",
+      });
+    }
+  };
+
+  const handleDeleteProject = async (projectId) => {
+    try {
+      // Get CSRF token from cookie as fallback
+      const csrfToken =
+        sessionDetails?.csrfToken ||
+        document.cookie
+          .split("; ")
+          .find((row) => row.startsWith("csrftoken="))
+          ?.split("=")[1];
+
+      await axiosPrivate.delete(
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/${projectId}/`,
+        {
+          headers: {
+            "X-CSRFToken": csrfToken,
+          },
+        }
+      );
+
+      setAlertDetails({
+        type: "success",
+        content: "Project deleted successfully",
+      });
+      fetchProjects();
+    } catch (error) {
+      setAlertDetails({
+        type: "error",
+        content: error.response?.data?.detail || "Failed to delete project",
+      });
+    }
+  };
+
+  const filteredProjects = projects.filter(
+    (project) =>
+      project.name.toLowerCase().includes(searchText.toLowerCase()) ||
+      project.description?.toLowerCase().includes(searchText.toLowerCase())
+  );
+
+  const columns = [
+    {
+      title: "Name",
+      dataIndex: "name",
+      key: "name",
+      render: (text, record) => (
+        <Button
+          type="link"
+          onClick={() => navigate(record.id)}
+          style={{ padding: 0 }}
+        >
+          {text}
+        </Button>
+      ),
+    },
+    {
+      title: "Description",
+      dataIndex: "description",
+      key: "description",
+      ellipsis: true,
+    },
+    {
+      title: "Type",
+      dataIndex: "reference_data_type",
+      key: "reference_data_type",
+      render: (type) => (
+        <Tag color="blue">{type?.replace(/_/g, " ").toUpperCase()}</Tag>
+      ),
+    },
+    {
+      title: "Data Sources",
+      dataIndex: "data_source_count",
+      key: "data_source_count",
+      render: (count) => (
+        <Space>
+          <CloudUploadOutlined />
+          <Text>{count || 0}</Text>
+        </Space>
+      ),
+    },
+    {
+      title: "Template",
+      dataIndex: "template",
+      key: "template",
+      render: (template) =>
+        template ? (
+          <Space>
+            <FileTextOutlined />
+            <Text>{template.name}</Text>
+          </Space>
+        ) : (
+          <Text type="secondary">No template</Text>
+        ),
+    },
+    {
+      title: "Status",
+      dataIndex: "is_active",
+      key: "is_active",
+      render: (isActive) => (
+        <Tag color={isActive ? "green" : "orange"}>
+          {isActive ? "Active" : "Inactive"}
+        </Tag>
+      ),
+    },
+    {
+      title: "Created",
+      dataIndex: "created_at",
+      key: "created_at",
+      render: (date) => new Date(date).toLocaleDateString(),
+    },
+    {
+      title: "Actions",
+      key: "actions",
+      width: 100,
+      render: (_, record) => (
+        <Popconfirm
+          title="Delete Project"
+          description="Are you sure you want to delete this project?"
+          onConfirm={(e) => {
+            e.stopPropagation();
+            handleDeleteProject(record.id);
+          }}
+          onCancel={(e) => e.stopPropagation()}
+          okText="Delete"
+          cancelText="Cancel"
+          okButtonProps={{ danger: true }}
+        >
+          <Button
+            type="text"
+            danger
+            icon={<DeleteOutlined />}
+            onClick={(e) => e.stopPropagation()}
+          />
+        </Popconfirm>
+      ),
+    },
+  ];
+
+  return (
+    <div className="lookup-project-list">
+      <div className="lookup-header">
+        <div>
+          <Title level={3}>Look-Up Projects</Title>
+          <Text type="secondary">
+            Manage your static data enrichment projects
+          </Text>
+        </div>
+        <Button
+          type="primary"
+          icon={<PlusOutlined />}
+          onClick={() => setCreateModalOpen(true)}
+        >
+          Create Project
+        </Button>
+      </div>
+
+      <Card>
+        <Space direction="vertical" size="large" style={{ width: "100%" }}>
+          <Search
+            placeholder="Search projects..."
+            prefix={<SearchOutlined />}
+            allowClear
+            enterButton
+            size="large"
+            value={searchText}
+            onChange={(e) => setSearchText(e.target.value)}
+            style={{ maxWidth: 400 }}
+          />
+
+          <Table
+            columns={columns}
+            dataSource={filteredProjects}
+            loading={loading}
+            rowKey="id"
+            pagination={{
+              pageSize: 10,
+              showSizeChanger: true,
+              showTotal: (total) => `Total ${total} projects`,
+            }}
+          />
+        </Space>
+      </Card>
+
+      <CreateProjectModal
+        open={createModalOpen}
+        onCancel={() => setCreateModalOpen(false)}
+        onCreate={handleCreateProject}
+      />
+    </div>
+  );
+}
diff --git a/frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.css b/frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.css
new file mode 100644
index 0000000000..1780ea6a0b
--- /dev/null
+++ b/frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.css
@@ -0,0 +1,17 @@
+.reference-data-tab {
+  padding: 24px;
+  height: 100%;
+  max-height: calc(100vh - 380px);
+  overflow-y: auto;
+  overflow-x: hidden;
+}
+
+.tab-header {
+  display: flex;
+  justify-content: space-between;
+  align-items: center;
+  margin-bottom: 24px;
+  flex-shrink: 0;
+  flex-wrap: wrap;
+  gap: 12px;
+}
diff --git a/frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.jsx b/frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.jsx
new file mode 100644
index 0000000000..a9ce5bb96c
--- /dev/null
+++ b/frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.jsx
@@ -0,0 +1,342 @@
+import { useState, useEffect } from "react";
+import PropTypes from "prop-types";
+import {
+  Table,
+  Button,
+  Upload,
+  Space,
+  Tag,
+  Typography,
+  Progress,
+  Modal,
+  Tooltip,
+} from "antd";
+import {
+  UploadOutlined,
+  FileTextOutlined,
+  DeleteOutlined,
+  SyncOutlined,
+  CheckCircleOutlined,
+  CloseCircleOutlined,
+  LoadingOutlined,
+  DatabaseOutlined,
+} from "@ant-design/icons";
+
+import { useAxiosPrivate } from "../../../hooks/useAxiosPrivate";
+import { useAlertStore } from "../../../store/alert-store";
+import { useSessionStore } from "../../../store/session-store";
+import "./ReferenceDataTab.css";
+
+const { Title, Text } = Typography;
+const { Dragger } = Upload;
+
+export function ReferenceDataTab({ project, onUpdate }) {
+  const [dataSources, setDataSources] = useState([]);
+  const [loading, setLoading] = useState(false);
+  const [uploadModalOpen, setUploadModalOpen] = useState(false);
+  const [uploading, setUploading] = useState(false);
+  const [indexing, setIndexing] = useState(false);
+
+  const axiosPrivate = useAxiosPrivate();
+  const { setAlertDetails } = useAlertStore();
+  const { sessionDetails } = useSessionStore();
+
+  useEffect(() => {
+    fetchDataSources();
+  }, [project.id]);
+
+  const fetchDataSources = async () => {
+    setLoading(true);
+    try {
+      const response = await axiosPrivate.get(
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/${project.id}/data_sources/`
+      );
+      setDataSources(response.data || []);
+    } catch (error) {
+      setAlertDetails({
+        type: "error",
+        content: "Failed to fetch data sources",
+      });
+    } finally {
+      setLoading(false);
+    }
+  };
+
+  const handleUpload = async (file) => {
+    setUploading(true);
+    const formData = new FormData();
+    formData.append("file", file);
+    formData.append("extract_text", "true");
+    formData.append("metadata", JSON.stringify({ source: "manual_upload" }));
+
+    try {
+      await axiosPrivate.post(
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/${project.id}/upload_reference_data/`,
+        formData,
+        {
+          headers: {
+            "Content-Type": "multipart/form-data",
+            "X-CSRFToken": sessionDetails?.csrfToken,
+          },
+        }
+      );
+
+      setAlertDetails({
+        type: "success",
+        content: "Reference data uploaded successfully",
+      });
+      setUploadModalOpen(false);
+      fetchDataSources();
+      onUpdate();
+    } catch (error) {
+      setAlertDetails({
+        type: "error",
+        content: error.response?.data?.detail || "Failed to upload file",
+      });
+    } finally {
+      setUploading(false);
+    }
+
+    return false; // Prevent default upload
+  };
+
+  const handleDelete = async (dataSourceId) => {
+    Modal.confirm({
+      title: "Delete Reference Data",
+      content: "Are you sure you want to delete this reference data?",
+      okText: "Delete",
+      okType: "danger",
+      onOk: async () => {
+        try {
+          await axiosPrivate.delete(
+            `/api/v1/unstract/${sessionDetails?.orgId}/data-sources/${dataSourceId}/`,
+            {
+              headers: {
+                "X-CSRFToken": sessionDetails?.csrfToken,
+              },
+            }
+          );
+          setAlertDetails({
+            type: "success",
+            content: "Reference data deleted successfully",
+          });
+          fetchDataSources();
+          onUpdate();
+        } catch (error) {
+          setAlertDetails({
+            type: "error",
+            content: "Failed to delete reference data",
+          });
+        }
+      },
+    });
+  };
+
+  const handleIndexAll = async () => {
+    Modal.confirm({
+      title: "Index All Reference Data",
+      content:
+        "This will index all completed reference data using the default profile. Continue?",
+      okText: "Index All",
+      okType: "primary",
+      onOk: async () => {
+        setIndexing(true);
+        try {
+          const response = await axiosPrivate.post(
+            `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/${project.id}/index_all/`,
+            {},
+            {
+              headers: {
+                "X-CSRFToken": sessionDetails?.csrfToken,
+              },
+            }
+          );
+
+          const results = response.data?.results || {};
+          setAlertDetails({
+            type: "success",
+            content: `Indexing completed: ${results.success || 0} successful, ${
+              results.failed || 0
+            } failed`,
+          });
+
+          fetchDataSources();
+          onUpdate();
+        } catch (error) {
+          setAlertDetails({
+            type: "error",
+            content:
+              error.response?.data?.error || "Failed to index reference data",
+          });
+        } finally {
+          setIndexing(false);
+        }
+      },
+    });
+  };
+
+  const getExtractionStatusIcon = (status) => {
+    switch (status) {
+      case "complete":
+        return <CheckCircleOutlined style={{ color: "#52c41a" }} />;
+      case "failed":
+        return <CloseCircleOutlined style={{ color: "#f5222d" }} />;
+      case "processing":
+        return <LoadingOutlined style={{ color: "#1890ff" }} />;
+      case "pending":
+        return <SyncOutlined style={{ color: "#faad14" }} />;
+      default:
+        return null;
+    }
+  };
+
+  const columns = [
+    {
+      title: "File",
+      dataIndex: "file_name",
+      key: "file_name",
+      render: (fileName) => (
+        <Space>
+          <FileTextOutlined />
+          <Text>{fileName}</Text>
+        </Space>
+      ),
+    },
+    {
+      title: "Version",
+      dataIndex: "version_number",
+      key: "version_number",
+      render: (version, record) => (
+        <Space>
+          <Tag color={record.is_latest ? "green" : "default"}>v{version}</Tag>
+          {record.is_latest && <Tag color="blue">Latest</Tag>}
+        </Space>
+      ),
+    },
+    {
+      title: "Extraction Status",
+      dataIndex: "extraction_status",
+      key: "extraction_status",
+      render: (status, record) => (
+        <Space>
+          {getExtractionStatusIcon(status)}
+          <Text>{record.extraction_status_display || status}</Text>
+        </Space>
+      ),
+    },
+    {
+      title: "Size",
+      dataIndex: "file_size",
+      key: "file_size",
+      render: (size) => {
+        if (!size) return "-";
+        const sizeInMB = (size / 1024 / 1024).toFixed(2);
+        return `${sizeInMB} MB`;
+      },
+    },
+    {
+      title: "Uploaded",
+      dataIndex: "created_at",
+      key: "created_at",
+      render: (date) => new Date(date).toLocaleString(),
+    },
+    {
+      title: "Actions",
+      key: "actions",
+      render: (_, record) => (
+        <Space>
+          <Tooltip title="Delete">
+            <Button
+              icon={<DeleteOutlined />}
+              danger
+              size="small"
+              onClick={() => handleDelete(record.id)}
+            />
+          </Tooltip>
+        </Space>
+      ),
+    },
+  ];
+
+  return (
+    <div className="reference-data-tab">
+      <div className="tab-header">
+        <div>
+          <Title level={4}>Reference Data</Title>
+          <Text type="secondary">
+            Upload and manage reference data files for enrichment
+          </Text>
+        </div>
+        <Space>
+          <Button
+            type="default"
+            icon={<DatabaseOutlined />}
+            onClick={handleIndexAll}
+            loading={indexing}
+            disabled={indexing || dataSources.length === 0}
+          >
+            Index All
+          </Button>
+          <Button
+            type="primary"
+            icon={<UploadOutlined />}
+            onClick={() => setUploadModalOpen(true)}
+          >
+            Upload Data
+          </Button>
+        </Space>
+      </div>
+
+      <Table
+        columns={columns}
+        dataSource={dataSources}
+        loading={loading}
+        rowKey="id"
+        pagination={{
+          pageSize: 10,
+          showSizeChanger: true,
+        }}
+      />
+
+      <Modal
+        title="Upload Reference Data"
+        open={uploadModalOpen}
+        onCancel={() => setUploadModalOpen(false)}
+        footer={null}
+        width={600}
+      >
+        <Dragger
+          name="file"
+          multiple={false}
+          beforeUpload={handleUpload}
+          disabled={uploading}
+          accept=".csv,.json,.txt,.pdf,.xlsx,.xls,.docx,.doc"
+        >
+          <p className="ant-upload-drag-icon">
+            <UploadOutlined />
+          </p>
+          <p className="ant-upload-text">
+            Click or drag file to this area to upload
+          </p>
+          <p className="ant-upload-hint">
+            Support for CSV, JSON, TXT, PDF, Excel, and Word documents. Files
+            will be processed for text extraction automatically.
+          </p>
+        </Dragger>
+        {uploading && (
+          <div style={{ marginTop: 16 }}>
+            <Progress percent={50} status="active" />
+            <Text>Uploading and processing file...</Text>
+          </div>
+        )}
+      </Modal>
+    </div>
+  );
+}
+
+ReferenceDataTab.propTypes = {
+  project: PropTypes.shape({
+    id: PropTypes.string.isRequired,
+  }).isRequired,
+  onUpdate: PropTypes.func.isRequired,
+};
diff --git a/frontend/src/components/lookups/template-tab/TemplateTab.css b/frontend/src/components/lookups/template-tab/TemplateTab.css
new file mode 100644
index 0000000000..ce6c396158
--- /dev/null
+++ b/frontend/src/components/lookups/template-tab/TemplateTab.css
@@ -0,0 +1,8 @@
+.template-tab {
+  padding: 24px;
+  max-width: 800px;
+  height: 100%;
+  max-height: calc(100vh - 380px);
+  overflow-y: auto;
+  overflow-x: hidden;
+}
diff --git a/frontend/src/components/lookups/template-tab/TemplateTab.jsx b/frontend/src/components/lookups/template-tab/TemplateTab.jsx
new file mode 100644
index 0000000000..af2b8aa4c1
--- /dev/null
+++ b/frontend/src/components/lookups/template-tab/TemplateTab.jsx
@@ -0,0 +1,391 @@
+import { useState, useEffect } from "react";
+import PropTypes from "prop-types";
+import {
+  Button,
+  Card,
+  Form,
+  Input,
+  Select,
+  Space,
+  Typography,
+  Tag,
+  Divider,
+  Modal,
+  Alert,
+} from "antd";
+import {
+  SaveOutlined,
+  PlayCircleOutlined,
+  CheckOutlined,
+} from "@ant-design/icons";
+
+import { useAxiosPrivate } from "../../../hooks/useAxiosPrivate";
+import { useAlertStore } from "../../../store/alert-store";
+import { useSessionStore } from "../../../store/session-store";
+import "./TemplateTab.css";
+
+const { Title, Text, Paragraph } = Typography;
+const { TextArea } = Input;
+
+export function TemplateTab({ project, onUpdate }) {
+  const [template, setTemplate] = useState(null);
+  const [saving, setSaving] = useState(false);
+  const [validating, setValidating] = useState(false);
+  const [testModalOpen, setTestModalOpen] = useState(false);
+  const [variables, setVariables] = useState([]);
+  const [llmAdapters, setLlmAdapters] = useState([]);
+  const [loadingLLMs, setLoadingLLMs] = useState(false);
+  const [form] = Form.useForm();
+
+  const axiosPrivate = useAxiosPrivate();
+  const { setAlertDetails } = useAlertStore();
+  const { sessionDetails } = useSessionStore();
+
+  useEffect(() => {
+    fetchLLMAdapters();
+  }, [sessionDetails?.orgId]);
+
+  useEffect(() => {
+    if (project.template) {
+      fetchTemplate();
+    }
+  }, [project.template]);
+
+  const fetchLLMAdapters = async () => {
+    if (!sessionDetails?.orgId) return;
+
+    setLoadingLLMs(true);
+    try {
+      const response = await axiosPrivate.get(
+        `/api/v1/unstract/${sessionDetails.orgId}/adapter/?adapter_type=LLM`
+      );
+      setLlmAdapters(response.data || []);
+    } catch (error) {
+      console.error("Failed to fetch LLM adapters:", error);
+      setAlertDetails({
+        type: "warning",
+        content:
+          "Failed to load configured LLMs. Please configure LLMs in Platform Settings.",
+      });
+    } finally {
+      setLoadingLLMs(false);
+    }
+  };
+
+  const fetchTemplate = async () => {
+    try {
+      const response = await axiosPrivate.get(
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-templates/${project.template.id}/`
+      );
+      setTemplate(response.data);
+      form.setFieldsValue({
+        name: response.data.name,
+        template_text: response.data.template_text,
+        llm_adapter_id: response.data.llm_config?.adapter_id,
+      });
+      extractVariables(response.data.template_text);
+    } catch (error) {
+      setAlertDetails({
+        type: "error",
+        content: "Failed to fetch template",
+      });
+    }
+  };
+
+  const extractVariables = (text) => {
+    const regex = /\{\{([^}]*)\}\}/g;
+    const found = [];
+    let match;
+    while ((match = regex.exec(text)) !== null) {
+      if (match[1] && match[1] !== "reference_data") {
+        found.push(match[1]);
+      }
+    }
+    setVariables([...new Set(found)]);
+  };
+
+  const handleSave = async () => {
+    setSaving(true);
+    try {
+      const values = await form.validateFields();
+      const payload = {
+        name: values.name,
+        template_text: values.template_text,
+        llm_config: {
+          adapter_id: values.llm_adapter_id,
+        },
+        is_active: true,
+        project: project.id,
+      };
+
+      const headers = {
+        "X-CSRFToken": sessionDetails?.csrfToken,
+      };
+
+      if (template) {
+        // Update existing
+        await axiosPrivate.patch(
+          `/api/v1/unstract/${sessionDetails?.orgId}/lookup-templates/${template.id}/`,
+          payload,
+          { headers }
+        );
+      } else {
+        // Create new
+        await axiosPrivate.post(
+          `/api/v1/unstract/${sessionDetails?.orgId}/lookup-templates/`,
+          payload,
+          { headers }
+        );
+        // Template is automatically linked to project via the OneToOneField
+      }
+
+      setAlertDetails({
+        type: "success",
+        content: "Template saved successfully",
+      });
+      onUpdate();
+      fetchTemplate();
+    } catch (error) {
+      setAlertDetails({
+        type: "error",
+        content: error.response?.data?.detail || "Failed to save template",
+      });
+    } finally {
+      setSaving(false);
+    }
+  };
+
+  const handleValidate = async () => {
+    setValidating(true);
+    try {
+      const templateText = form.getFieldValue("template_text");
+      const response = await axiosPrivate.post(
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-templates/validate/`,
+        {
+          template_text: templateText,
+          sample_data: {},
+          sample_reference: "Sample reference data",
+        }
+      );
+
+      if (response.data.valid) {
+        setAlertDetails({
+          type: "success",
+          content: "Template is valid",
+        });
+        setVariables(response.data.variables_found || []);
+      } else {
+        setAlertDetails({
+          type: "error",
+          content: response.data.error || "Template validation failed",
+        });
+      }
+    } catch (error) {
+      setAlertDetails({
+        type: "error",
+        content: "Failed to validate template",
+      });
+    } finally {
+      setValidating(false);
+    }
+  };
+
+  const handleTest = async (testData) => {
+    try {
+      const response = await axiosPrivate.post(
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/${project.id}/execute/`,
+        {
+          input_data: testData,
+          use_cache: false,
+          timeout_seconds: 30,
+        }
+      );
+
+      Modal.success({
+        title: "Test Execution Successful",
+        content: (
+          <div>
+            <Paragraph>Enrichment completed successfully!</Paragraph>
+            <pre style={{ background: "#f5f5f5", padding: 8, borderRadius: 4 }}>
+              {JSON.stringify(response.data.lookup_enrichment, null, 2)}
+            </pre>
+          </div>
+        ),
+        width: 600,
+      });
+    } catch (error) {
+      Modal.error({
+        title: "Test Execution Failed",
+        content: error.response?.data?.error || "Failed to execute test",
+      });
+    }
+  };
+
+  return (
+    <div className="template-tab">
+      <Title level={4}>Prompt Template</Title>
+      <Text type="secondary">
+        Configure the prompt template for LLM enrichment
+      </Text>
+
+      <Divider />
+
+      <Form form={form} layout="vertical">
+        <Form.Item
+          name="name"
+          label="Template Name"
+          rules={[{ required: true, message: "Please enter template name" }]}
+        >
+          <Input placeholder="e.g., Vendor Canonicalization Template" />
+        </Form.Item>
+
+        <Form.Item
+          name="template_text"
+          label="Template Text"
+          rules={[
+            { required: true, message: "Please enter template text" },
+            {
+              validator: (_, value) => {
+                if (!value || value.includes("{{reference_data}}")) {
+                  return Promise.resolve();
+                }
+                return Promise.reject(
+                  new Error(
+                    "Template must contain {{reference_data}} placeholder"
+                  )
+                );
+              },
+            },
+          ]}
+        >
+          <TextArea
+            rows={10}
+            placeholder={`Extract vendor information from the input:
+
+Vendor Name: {{vendor_name}}
+
+Reference Data:
+{{reference_data}}
+
+Please canonicalize the vendor name and provide the following:
+- Canonical vendor name
+- Vendor category
+- Confidence score (0-1)
+
+Return as JSON.`}
+            onChange={(e) => extractVariables(e.target.value)}
+          />
+        </Form.Item>
+
+        {variables.length > 0 && (
+          <Alert
+            message="Detected Variables"
+            description={
+              <Space wrap>
+                {variables.map((variable) => (
+                  <Tag key={variable} color="blue">
+                    {`{{${variable}}}`}
+                  </Tag>
+                ))}
+              </Space>
+            }
+            type="info"
+            showIcon
+            style={{ marginBottom: 16 }}
+          />
+        )}
+
+        <Card title="LLM Configuration" size="small">
+          <Form.Item
+            name="llm_adapter_id"
+            label="Configured LLM"
+            rules={[{ required: true, message: "Please select an LLM" }]}
+            extra="Select from your configured LLMs in Platform Settings"
+          >
+            <Select
+              placeholder="Select configured LLM"
+              loading={loadingLLMs}
+              disabled={loadingLLMs || llmAdapters.length === 0}
+              notFoundContent={
+                llmAdapters.length === 0
+                  ? "No LLMs configured. Please configure LLMs in Platform Settings."
+                  : "Loading..."
+              }
+              options={llmAdapters.map((adapter) => ({
+                value: adapter.id,
+                label: `${adapter.adapter_name} (${adapter.adapter_type})`,
+              }))}
+            />
+          </Form.Item>
+        </Card>
+
+        <Space style={{ marginTop: 24 }}>
+          <Button
+            type="primary"
+            icon={<SaveOutlined />}
+            onClick={handleSave}
+            loading={saving}
+          >
+            Save Template
+          </Button>
+          <Button
+            icon={<CheckOutlined />}
+            onClick={handleValidate}
+            loading={validating}
+          >
+            Validate
+          </Button>
+          <Button
+            icon={<PlayCircleOutlined />}
+            onClick={() => setTestModalOpen(true)}
+          >
+            Test
+          </Button>
+        </Space>
+      </Form>
+
+      <Modal
+        title="Test Template"
+        open={testModalOpen}
+        onCancel={() => setTestModalOpen(false)}
+        onOk={() => {
+          const testData = {};
+          variables.forEach((v) => {
+            const value = document.getElementById(`test-${v}`)?.value;
+            if (value) testData[v] = value;
+          });
+          handleTest(testData);
+          setTestModalOpen(false);
+        }}
+        width={600}
+      >
+        <Alert
+          message="Enter test values for variables"
+          description="These values will be used to test the template execution"
+          type="info"
+          showIcon
+          style={{ marginBottom: 16 }}
+        />
+        <Space direction="vertical" style={{ width: "100%" }}>
+          {variables.map((variable) => (
+            <div key={variable}>
+              <label>{variable}:</label>
+              <Input
+                id={`test-${variable}`}
+                placeholder={`Enter test value for ${variable}`}
+              />
+            </div>
+          ))}
+        </Space>
+      </Modal>
+    </div>
+  );
+}
+
+TemplateTab.propTypes = {
+  project: PropTypes.shape({
+    id: PropTypes.string.isRequired,
+    template: PropTypes.object,
+  }).isRequired,
+  onUpdate: PropTypes.func.isRequired,
+};
diff --git a/frontend/src/components/navigations/side-nav-bar/SideNavBar.jsx b/frontend/src/components/navigations/side-nav-bar/SideNavBar.jsx
index ab3e892de8..8d6a262e23 100644
--- a/frontend/src/components/navigations/side-nav-bar/SideNavBar.jsx
+++ b/frontend/src/components/navigations/side-nav-bar/SideNavBar.jsx
@@ -25,6 +25,7 @@ import VectorDbIcon from "../../../assets/vector-db.svg";
 import TextExtractorIcon from "../../../assets/text-extractor.svg";
 import TerminalIcon from "../../../assets/terminal.svg";
 import ConnectorsIcon from "../../../assets/connectors.svg";
+import LookupsIcon from "../../../assets/lookups.svg";
 
 import "./SideNavBar.css";
 import "../../settings/settings/Settings.css";
@@ -191,6 +192,14 @@ const SideNavBar = ({ collapsed }) => {
           path: `/${orgName}/workflows`,
           active: window.location.pathname.startsWith(`/${orgName}/workflows`),
         },
+        {
+          id: 1.3,
+          title: "Look-Ups",
+          description: "Enrich extracted data with reference lookups",
+          image: LookupsIcon,
+          path: `/${orgName}/lookups`,
+          active: window.location.pathname.startsWith(`/${orgName}/lookups`),
+        },
       ],
     },
     {
diff --git a/frontend/src/layouts/menu-layout/MenuLayout.css b/frontend/src/layouts/menu-layout/MenuLayout.css
index 8dab5529ae..d9bc540285 100644
--- a/frontend/src/layouts/menu-layout/MenuLayout.css
+++ b/frontend/src/layouts/menu-layout/MenuLayout.css
@@ -5,7 +5,7 @@
   align-items: center;
   /* column-gap: 12px; */
   height: min-content;
-  background-color: #F5F7F9;
+  background-color: #f5f7f9;
   padding-block: 8px;
   padding-inline: 12px;
 }
@@ -18,12 +18,13 @@
 
 .appBody {
   background-color: var(--page-bg-2);
-  overflow: hidden;
-  height: 100%;
+  overflow: auto;
+  height: calc(100vh - 60px);
 }
 
 .appBody2 {
   height: 100%;
+  overflow-y: auto;
 }
 .btn_style {
   margin: 0 5px;
@@ -47,7 +48,7 @@
   border-radius: 6px;
   margin: 0 5px;
   border-inline-start-width: 1px;
-  position:  static!important;
+  position: static !important;
 }
 .radio_btn:hover {
   border-inline-start-width: 1px;
diff --git a/frontend/src/pages/LookUpsPage.jsx b/frontend/src/pages/LookUpsPage.jsx
new file mode 100644
index 0000000000..f5ff6b507e
--- /dev/null
+++ b/frontend/src/pages/LookUpsPage.jsx
@@ -0,0 +1,23 @@
+import { useEffect } from "react";
+import { Outlet } from "react-router-dom";
+
+import { PageTitle } from "../components/widgets/page-title/PageTitle.jsx";
+import { MenuLayout } from "../layouts/menu-layout/MenuLayout.jsx";
+import { useSessionStore } from "../store/session-store.js";
+
+export function LookUpsPage() {
+  const { updateSessionDetails } = useSessionStore();
+
+  useEffect(() => {
+    updateSessionDetails({ activeMenuId: "lookups" });
+  }, [updateSessionDetails]);
+
+  return (
+    <>
+      <PageTitle title="Look-Ups" />
+      <MenuLayout>
+        <Outlet />
+      </MenuLayout>
+    </>
+  );
+}
diff --git a/frontend/src/routes/useLookUpsRoutes.js b/frontend/src/routes/useLookUpsRoutes.js
new file mode 100644
index 0000000000..b770aab2fd
--- /dev/null
+++ b/frontend/src/routes/useLookUpsRoutes.js
@@ -0,0 +1,13 @@
+import { Route } from "react-router-dom";
+import { LookUpsPage } from "../pages/LookUpsPage";
+import { LookUpProjectList } from "../components/lookups/project-list/LookUpProjectList";
+import { LookUpProjectDetail } from "../components/lookups/project-detail/LookUpProjectDetail";
+
+export const useLookUpsRoutes = () => {
+  return (
+    <Route path="lookups" element={<LookUpsPage />}>
+      <Route path="" element={<LookUpProjectList />} />
+      <Route path=":projectId" element={<LookUpProjectDetail />} />
+    </Route>
+  );
+};
diff --git a/frontend/src/routes/useMainAppRoutes.js b/frontend/src/routes/useMainAppRoutes.js
index d318a79622..c65d5ab9ec 100644
--- a/frontend/src/routes/useMainAppRoutes.js
+++ b/frontend/src/routes/useMainAppRoutes.js
@@ -1,28 +1,31 @@
 import { Route } from "react-router-dom";
 
-import { OnBoardPage } from "../pages/OnBoardPage.jsx";
-import { FullPageLayout } from "../layouts/fullpage-payout/FullPageLayout.jsx";
-import { ToolsSettingsPage } from "../pages/ToolsSettingsPage.jsx";
-import { SettingsPage } from "../pages/SettingsPage.jsx";
-import { PlatformSettings } from "../components/settings/platform/PlatformSettings.jsx";
 import { RequireAdmin } from "../components/helpers/auth/RequireAdmin.js";
-import { UsersPage } from "../pages/UsersPage.jsx";
-import { InviteEditUserPage } from "../pages/InviteEditUserPage.jsx";
+import { CustomToolsHelper } from "../components/helpers/custom-tools/CustomToolsHelper.js";
+import { ProjectHelper } from "../components/helpers/project/ProjectHelper.js";
 import { DefaultTriad } from "../components/settings/default-triad/DefaultTriad.jsx";
+import { PlatformSettings } from "../components/settings/platform/PlatformSettings.jsx";
+import { deploymentTypes } from "../helpers/GetStaticData.js";
+import { FullPageLayout } from "../layouts/fullpage-payout/FullPageLayout.jsx";
 import { PageLayout } from "../layouts/page-layout/PageLayout.jsx";
-import { ProfilePage } from "../pages/ProfilePage.jsx";
-import { DeploymentsPage } from "../pages/DeploymentsPage.jsx";
-import { WorkflowsPage } from "../pages/WorkflowsPage.jsx";
-import { ProjectHelper } from "../components/helpers/project/ProjectHelper.js";
 import { AgencyPage } from "../pages/AgencyPage.jsx";
+import ConnectorsPage from "../pages/ConnectorsPage.jsx";
 import { CustomTools } from "../pages/CustomTools.jsx";
-import { CustomToolsHelper } from "../components/helpers/custom-tools/CustomToolsHelper.js";
-import { ToolIdePage } from "../pages/ToolIdePage.jsx";
-import { OutputAnalyzerPage } from "../pages/OutputAnalyzerPage.jsx";
+import { DeploymentsPage } from "../pages/DeploymentsPage.jsx";
+import { InviteEditUserPage } from "../pages/InviteEditUserPage.jsx";
 import { LogsPage } from "../pages/LogsPage.jsx";
-import { deploymentTypes } from "../helpers/GetStaticData.js";
-import ConnectorsPage from "../pages/ConnectorsPage.jsx";
+import { LookUpsPage } from "../pages/LookUpsPage.jsx";
+import { LookUpProjectList } from "../components/lookups/project-list/LookUpProjectList.jsx";
+import { LookUpProjectDetail } from "../components/lookups/project-detail/LookUpProjectDetail.jsx";
+import { OnBoardPage } from "../pages/OnBoardPage.jsx";
+import { OutputAnalyzerPage } from "../pages/OutputAnalyzerPage.jsx";
+import { ProfilePage } from "../pages/ProfilePage.jsx";
+import { SettingsPage } from "../pages/SettingsPage.jsx";
+import { ToolIdePage } from "../pages/ToolIdePage.jsx";
+import { ToolsSettingsPage } from "../pages/ToolsSettingsPage.jsx";
 import { UnstractAdministrationPage } from "../pages/UnstractAdministrationPage.jsx";
+import { UsersPage } from "../pages/UsersPage.jsx";
+import { WorkflowsPage } from "../pages/WorkflowsPage.jsx";
 
 let RequirePlatformAdmin;
 let PlatformAdminPage;
@@ -143,6 +146,10 @@ function useMainAppRoutes() {
           <Route path="" element={<AgencyPage />} />
         </Route>
         <Route path="tools" element={<CustomTools />} />
+        <Route path="lookups" element={<LookUpsPage />}>
+          <Route path="" element={<LookUpProjectList />} />
+          <Route path=":projectId" element={<LookUpProjectDetail />} />
+        </Route>
         <Route path="" element={<CustomToolsHelper />}>
           <Route path="tools/:id" element={<ToolIdePage />} />
           <Route
diff --git a/lookup/services/__init__.py b/lookup/services/__init__.py
new file mode 100644
index 0000000000..e69de29bb2
diff --git a/lookup/tests/test_services/__init__.py b/lookup/tests/test_services/__init__.py
new file mode 100644
index 0000000000..e69de29bb2

From 6881cb8f18553af48498ad58b90004ac0c99fbcd Mon Sep 17 00:00:00 2001
From: gayathrivijayakumar <gayathri@zipstack.com>
Date: Tue, 6 Jan 2026 13:34:56 +0530
Subject: [PATCH 02/22] Lookups secondcut

---
 .../services/lookup_integration_service.py    | 284 ++++++++++++++++++
 .../lookup/services/lookup_orchestrator.py    |   1 +
 backend/lookup/services/mock_clients.py       |  20 ++
 .../output_manager_helper.py                  |  82 +++++
 .../serializers.py                            |   3 +
 .../custom-tools/prompt-card/PromptCard.css   |  49 ++-
 .../settings-modal/SettingsModal.jsx          |  10 +
 .../components/lookups/debug-tab/DebugTab.jsx |   2 +-
 .../ExecutionHistoryTab.jsx                   |   4 +-
 .../linked-projects-tab/LinkedProjectsTab.jsx |  11 +-
 .../ProfileFormModal.jsx                      |   6 +-
 .../ProfileManagementTab.jsx                  |   6 +-
 .../project-detail/LookUpProjectDetail.jsx    |  11 +-
 .../project-list/LookUpProjectList.jsx        |  12 +-
 .../reference-data-tab/ReferenceDataTab.jsx   |   8 +-
 .../lookups/template-tab/TemplateTab.jsx      |  10 +-
 frontend/src/hooks/usePromptOutput.js         |  26 +-
 17 files changed, 502 insertions(+), 43 deletions(-)
 create mode 100644 backend/lookup/services/lookup_integration_service.py

diff --git a/backend/lookup/services/lookup_integration_service.py b/backend/lookup/services/lookup_integration_service.py
new file mode 100644
index 0000000000..0f4151ef84
--- /dev/null
+++ b/backend/lookup/services/lookup_integration_service.py
@@ -0,0 +1,284 @@
+"""Service for automatic Lookup integration with Prompt Studio.
+
+This module provides seamless enrichment of extraction results when Lookup
+projects are linked to a Prompt Studio project. It executes automatically
+after PS extraction completes.
+"""
+
+import logging
+import uuid
+from concurrent.futures import ThreadPoolExecutor
+from concurrent.futures import TimeoutError as FuturesTimeoutError
+from typing import Any
+
+from django.conf import settings
+
+logger = logging.getLogger(__name__)
+
+# Configuration defaults
+LOOKUP_AUTO_ENRICH_ENABLED = getattr(settings, "LOOKUP_AUTO_ENRICH_ENABLED", True)
+LOOKUP_ENRICHMENT_TIMEOUT = getattr(settings, "LOOKUP_ENRICHMENT_TIMEOUT", 30)
+
+
+class LookupIntegrationService:
+    """Service for automatic Lookup integration with Prompt Studio.
+
+    Provides seamless enrichment of extraction results when Lookup
+    projects are linked to a Prompt Studio project.
+    """
+
+    @staticmethod
+    def enrich_if_linked(
+        prompt_studio_project_id: str,
+        extracted_data: dict[str, Any],
+        run_id: str | None = None,
+        timeout: float | None = None,
+    ) -> dict[str, Any]:
+        """Execute Lookup enrichment if PS project has linked Lookups.
+
+        Features:
+        - Zero overhead if no links exist
+        - Timeout protection to not block extraction
+        - Graceful degradation on errors
+        - Full audit logging
+
+        Args:
+            prompt_studio_project_id: UUID of Prompt Studio project
+            extracted_data: Dict of extracted field values
+            run_id: Optional execution run ID for tracking
+            timeout: Max seconds to wait (default from settings)
+
+        Returns:
+            Dict with 'lookup_enrichment' and '_lookup_metadata' keys,
+            or empty dict if no links or enrichment disabled.
+        """
+        # Check if auto-enrichment is enabled
+        if not LOOKUP_AUTO_ENRICH_ENABLED:
+            logger.debug("Lookup auto-enrichment is disabled")
+            return {}
+
+        if not extracted_data:
+            logger.debug("No extracted data provided for enrichment")
+            return {}
+
+        timeout = timeout or LOOKUP_ENRICHMENT_TIMEOUT
+
+        try:
+            return LookupIntegrationService._execute_enrichment(
+                prompt_studio_project_id=prompt_studio_project_id,
+                extracted_data=extracted_data,
+                run_id=run_id,
+                timeout=timeout,
+            )
+        except FuturesTimeoutError:
+            logger.warning(
+                f"Lookup enrichment timed out for PS project "
+                f"{prompt_studio_project_id} after {timeout}s"
+            )
+            return {
+                "lookup_enrichment": {},
+                "_lookup_metadata": {
+                    "status": "timeout",
+                    "message": f"Enrichment timed out after {timeout}s",
+                    "lookups_executed": 0,
+                    "lookups_successful": 0,
+                },
+            }
+        except Exception as e:
+            logger.error(
+                f"Lookup enrichment failed for PS project "
+                f"{prompt_studio_project_id}: {e}",
+                exc_info=True,
+            )
+            return {
+                "lookup_enrichment": {},
+                "_lookup_metadata": {
+                    "status": "error",
+                    "message": str(e),
+                    "lookups_executed": 0,
+                    "lookups_successful": 0,
+                },
+            }
+
+    @staticmethod
+    def _execute_enrichment(
+        prompt_studio_project_id: str,
+        extracted_data: dict[str, Any],
+        run_id: str | None,
+        timeout: float,
+    ) -> dict[str, Any]:
+        """Internal method to execute enrichment with timeout."""
+        from lookup.models import PromptStudioLookupLink
+
+        # Quick existence check - minimal overhead if no links
+        links = (
+            PromptStudioLookupLink.objects.filter(
+                prompt_studio_project_id=prompt_studio_project_id
+            )
+            .select_related("lookup_project")
+            .order_by("execution_order")
+        )
+
+        if not links.exists():
+            logger.debug(
+                f"No Lookup links found for PS project {prompt_studio_project_id}"
+            )
+            return {}
+
+        # Get enabled lookup projects (those with ready status)
+        lookup_projects = [link.lookup_project for link in links if link.is_enabled]
+
+        if not lookup_projects:
+            logger.debug(
+                f"No enabled Lookup projects for PS project {prompt_studio_project_id}"
+            )
+            return {}
+
+        logger.info(
+            f"Executing {len(lookup_projects)} Lookup(s) for PS project "
+            f"{prompt_studio_project_id}"
+        )
+
+        # Execute with timeout protection
+        with ThreadPoolExecutor(max_workers=1) as executor:
+            future = executor.submit(
+                LookupIntegrationService._run_orchestrator,
+                lookup_projects=lookup_projects,
+                input_data=extracted_data,
+                execution_id=run_id or str(uuid.uuid4()),
+            )
+            result = future.result(timeout=timeout)
+
+        return result
+
+    @staticmethod
+    def _run_orchestrator(
+        lookup_projects: list,
+        input_data: dict[str, Any],
+        execution_id: str,
+    ) -> dict[str, Any]:
+        """Execute the lookup orchestrator for all linked projects."""
+        from lookup.integrations.file_storage_client import FileStorageClient
+        from lookup.integrations.unstract_llm_client import UnstractLLMClient
+        from lookup.models import LookupProfileManager
+        from lookup.services.enrichment_merger import EnrichmentMerger
+        from lookup.services.llm_cache import LLMResponseCache
+        from lookup.services.lookup_executor import LookUpExecutor
+        from lookup.services.lookup_orchestrator import LookUpOrchestrator
+        from lookup.services.reference_data_loader import ReferenceDataLoader
+        from lookup.services.variable_resolver import VariableResolver
+
+        try:
+            # Get profile manager for LLM client
+            # Use the first lookup project's default profile
+            first_project = lookup_projects[0]
+            profile_manager = LookupProfileManager.objects.filter(
+                lookup_project=first_project, is_default=True
+            ).first()
+
+            if not profile_manager:
+                logger.warning(
+                    f"No default profile for Lookup project {first_project.id}"
+                )
+                return {
+                    "lookup_enrichment": {},
+                    "_lookup_metadata": {
+                        "status": "error",
+                        "message": "No LLM profile configured for Lookup project",
+                        "lookups_executed": 0,
+                        "lookups_successful": 0,
+                    },
+                }
+
+            # Get LLM adapter instance from profile
+            llm_adapter_instance = profile_manager.llm
+            if not llm_adapter_instance:
+                logger.warning("No LLM adapter configured in profile")
+                return {
+                    "lookup_enrichment": {},
+                    "_lookup_metadata": {
+                        "status": "error",
+                        "message": "No LLM adapter configured",
+                        "lookups_executed": 0,
+                        "lookups_successful": 0,
+                    },
+                }
+
+            # Create LLM client using the existing UnstractLLMClient
+            llm_client = UnstractLLMClient(llm_adapter_instance)
+
+            # Initialize services
+            cache = LLMResponseCache()
+            merger = EnrichmentMerger()
+
+            # Create file storage client for reference data loading
+            storage_client = FileStorageClient()
+            ref_loader = ReferenceDataLoader(storage_client)
+
+            # Create executor with wrapper for LLM client interface
+            executor = LookUpExecutor(
+                variable_resolver=VariableResolver,
+                cache_manager=cache,
+                reference_loader=ref_loader,
+                llm_client=LLMClientWrapper(llm_client),
+            )
+
+            # Create orchestrator
+            orchestrator = LookUpOrchestrator(executor=executor, merger=merger)
+
+            # Execute lookups
+            result = orchestrator.execute_lookups(
+                input_data=input_data,
+                lookup_projects=lookup_projects,
+            )
+
+            return {
+                "lookup_enrichment": result.get("lookup_enrichment", {}),
+                "_lookup_metadata": result.get("_lookup_metadata", {}),
+            }
+
+        except Exception as e:
+            logger.error(f"Error in lookup orchestrator: {e}", exc_info=True)
+            return {
+                "lookup_enrichment": {},
+                "_lookup_metadata": {
+                    "status": "error",
+                    "message": str(e),
+                    "lookups_executed": 0,
+                    "lookups_successful": 0,
+                },
+            }
+
+
+class LLMClientWrapper:
+    """Wrapper to adapt UnstractLLMClient to LookUpExecutor interface.
+
+    The LookUpExecutor expects an LLM client with a `generate(prompt, config)`
+    method that returns a string.
+    """
+
+    def __init__(self, unstract_client: Any) -> None:
+        """Initialize wrapper.
+
+        Args:
+            unstract_client: UnstractLLMClient instance
+        """
+        self.client = unstract_client
+
+    def generate(self, prompt: str, config: dict[str, Any] | None = None) -> str:
+        """Execute LLM generation.
+
+        Args:
+            prompt: The prompt to send to LLM
+            config: Optional LLM configuration
+
+        Returns:
+            LLM response text
+        """
+        try:
+            # Use the generate method from UnstractLLMClient
+            response = self.client.generate(prompt=prompt, config=config or {})
+            return response
+        except Exception as e:
+            logger.error(f"LLM generation failed: {e}")
+            raise
diff --git a/backend/lookup/services/lookup_orchestrator.py b/backend/lookup/services/lookup_orchestrator.py
index 9ee00942d6..e24a1eb095 100644
--- a/backend/lookup/services/lookup_orchestrator.py
+++ b/backend/lookup/services/lookup_orchestrator.py
@@ -219,6 +219,7 @@ def execute_lookups(
             f"{conflicts_resolved} conflicts resolved, "
             f"total time {total_execution_time_ms}ms"
         )
+        logger.info(f"Merged enrichment data: {merged_data}")
 
         return {
             "lookup_enrichment": merged_data,
diff --git a/backend/lookup/services/mock_clients.py b/backend/lookup/services/mock_clients.py
index ee0838d153..9d505f84ef 100644
--- a/backend/lookup/services/mock_clients.py
+++ b/backend/lookup/services/mock_clients.py
@@ -144,6 +144,26 @@ def get_text_content(self, path: str) -> str | None:
             return content.decode("utf-8")
         return None
 
+    def get(self, path: str) -> str:
+        """Retrieve file content from storage.
+
+        This method implements the StorageClient protocol expected
+        by ReferenceDataLoader.
+
+        Args:
+            path: Storage path
+
+        Returns:
+            Text content of the file
+
+        Raises:
+            FileNotFoundError: If file not found in storage
+        """
+        content = self.get_text_content(path)
+        if content is None:
+            raise FileNotFoundError(f"File not found: {path}")
+        return content
+
     def save_text_content(self, path: str, text: str) -> bool:
         """Save text content to storage.
 
diff --git a/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py b/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
index 405b91e00f..e1bac4e219 100644
--- a/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
+++ b/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
@@ -25,6 +25,51 @@
 logger = logging.getLogger(__name__)
 
 
+def _try_lookup_enrichment(
+    tool_id: str,
+    extracted_data: dict[str, Any],
+    run_id: str | None = None,
+) -> dict[str, Any]:
+    """Attempt Lookup enrichment if available.
+
+    This function safely attempts to enrich extracted data using linked
+    Lookup projects. Returns empty dict if Lookup app is not available.
+
+    Args:
+        tool_id: Prompt Studio project (CustomTool) UUID
+        extracted_data: Dict of extracted field values from prompts
+        run_id: Optional execution run ID for tracking
+
+    Returns:
+        Dict with 'lookup_enrichment' and '_lookup_metadata' keys,
+        or empty dict if Lookup is not available or no links exist.
+    """
+    try:
+        from lookup.services.lookup_integration_service import (
+            LookupIntegrationService,
+        )
+
+        return LookupIntegrationService.enrich_if_linked(
+            prompt_studio_project_id=tool_id,
+            extracted_data=extracted_data,
+            run_id=run_id,
+        )
+    except ImportError:
+        # Lookup app not installed
+        logger.debug("Lookup app not available, skipping enrichment")
+        return {}
+    except Exception as e:
+        # Don't let Lookup errors break PS execution
+        logger.warning(f"Lookup enrichment failed (non-fatal): {e}")
+        return {
+            "lookup_enrichment": {},
+            "_lookup_metadata": {
+                "status": "error",
+                "message": str(e),
+            },
+        }
+
+
 class OutputManagerHelper:
     @staticmethod
     def handle_prompt_output_update(
@@ -193,6 +238,43 @@ def update_or_create_prompt_output(
             serializer = PromptStudioOutputSerializer(prompt_output)
             serialized_data.append(serializer.data)
 
+        # Post-processing: Lookup enrichment integration
+        # Build extracted data dict from all prompt outputs for enrichment
+        extracted_data_for_lookup: dict[str, Any] = {}
+        for prompt in prompts:
+            if prompt.prompt_type == PSOMKeys.NOTES:
+                continue
+            output_value = outputs.get(prompt.prompt_key)
+            if output_value is not None:
+                extracted_data_for_lookup[prompt.prompt_key] = output_value
+
+        # Execute Lookup enrichment if linked projects exist
+        if extracted_data_for_lookup:
+            tool_id_str = str(tool.tool_id)
+            logger.info(
+                f"Calling Lookup enrichment for tool {tool_id_str} "
+                f"with data: {extracted_data_for_lookup}"
+            )
+            lookup_result = _try_lookup_enrichment(
+                tool_id=tool_id_str,
+                extracted_data=extracted_data_for_lookup,
+                run_id=run_id,
+            )
+            logger.info(f"Lookup enrichment result: {lookup_result}")
+
+            # Add enrichment data to each serialized result
+            if lookup_result:
+                lookup_enrichment = lookup_result.get("lookup_enrichment", {})
+                lookup_metadata = lookup_result.get("_lookup_metadata", {})
+                logger.info(
+                    f"Adding lookup_enrichment={lookup_enrichment} "
+                    f"to {len(serialized_data)} items"
+                )
+
+                for item in serialized_data:
+                    item["lookup_enrichment"] = lookup_enrichment
+                    item["_lookup_metadata"] = lookup_metadata
+
         return serialized_data
 
     @staticmethod
diff --git a/backend/prompt_studio/prompt_studio_output_manager_v2/serializers.py b/backend/prompt_studio/prompt_studio_output_manager_v2/serializers.py
index 275e4a0956..c53313712f 100644
--- a/backend/prompt_studio/prompt_studio_output_manager_v2/serializers.py
+++ b/backend/prompt_studio/prompt_studio_output_manager_v2/serializers.py
@@ -18,6 +18,9 @@ class Meta:
 
     def to_representation(self, instance):
         data = super().to_representation(instance)
+        # Include prompt_key for frontend to match lookup enrichment
+        if instance.prompt_id:
+            data["prompt_key"] = instance.prompt_id.prompt_key
         try:
             token_usage = UsageHelper.get_aggregated_token_count(instance.run_id)
         except Exception as e:
diff --git a/frontend/src/components/custom-tools/prompt-card/PromptCard.css b/frontend/src/components/custom-tools/prompt-card/PromptCard.css
index 3a331819f5..fc458e6188 100644
--- a/frontend/src/components/custom-tools/prompt-card/PromptCard.css
+++ b/frontend/src/components/custom-tools/prompt-card/PromptCard.css
@@ -320,7 +320,7 @@
 }
 
 .json-value.clickable {
-  color: #0097D8;
+  color: #0097d8;
   cursor: pointer;
 }
 
@@ -329,9 +329,52 @@
 }
 
 .json-value.selected {
-  color: #5A8300;
+  color: #5a8300;
 }
 
-.prompt-output-result{
+.prompt-output-result {
   font-size: 12px;
 }
+
+/* Lookup Enrichment Styles */
+.lookup-enrichment-container {
+  margin-top: 8px;
+  border-top: 1px dashed #d9d9d9;
+  padding-top: 8px;
+}
+
+.lookup-enrichment-container .ant-collapse {
+  background-color: #f0f7ff;
+  border: 1px solid #91caff;
+}
+
+.lookup-enrichment-container .ant-collapse-header {
+  padding: 6px 12px !important;
+}
+
+.lookup-enrichment-container .ant-collapse-content-box {
+  padding: 8px !important;
+  background-color: #ffffff;
+}
+
+.lookup-enrichment-table .ant-table-thead > tr > th {
+  padding: 4px 8px;
+  font-size: 11px;
+  background-color: #fafafa;
+}
+
+.lookup-enrichment-table .ant-table-tbody > tr > td {
+  padding: 4px 8px;
+  font-size: 12px;
+}
+
+.lookup-info-icon {
+  color: #1890ff;
+  cursor: pointer;
+  font-size: 12px;
+}
+
+.lookup-enrichment-error {
+  margin-top: 8px;
+  padding: 4px 0;
+}
diff --git a/frontend/src/components/custom-tools/settings-modal/SettingsModal.jsx b/frontend/src/components/custom-tools/settings-modal/SettingsModal.jsx
index a3f41300f6..6fbe8aadd0 100644
--- a/frontend/src/components/custom-tools/settings-modal/SettingsModal.jsx
+++ b/frontend/src/components/custom-tools/settings-modal/SettingsModal.jsx
@@ -6,6 +6,7 @@ import {
   DiffOutlined,
   FileTextOutlined,
   MessageOutlined,
+  SearchOutlined,
 } from "@ant-design/icons";
 
 import SpaceWrapper from "../../widgets/space-wrapper/SpaceWrapper";
@@ -20,6 +21,7 @@ let SummarizeManager = null;
 const EvaluationManager = null;
 let ChallengeManager = null;
 let HighlightManager = null;
+let LookupManager = null;
 try {
   SummarizeManager =
     require("../../../plugins/summarize-manager/SummarizeManager").SummarizeManager;
@@ -27,6 +29,8 @@ try {
     require("../../../plugins/challenge-manager/ChallengeManager").ChallengeManager;
   HighlightManager =
     require("../../../plugins/highlight-manager/HighlightManager").HighlightManager;
+  LookupManager =
+    require("../../../plugins/lookup-manager/LookupManager").LookupManager;
 } catch {
   // Component will remain null if it is not present.
 }
@@ -108,6 +112,12 @@ function SettingsModal({ open, setOpen, handleUpdateTool }) {
         />
       );
     }
+    if (LookupManager) {
+      items.push(getMenuItem("Lookups", 9, <SearchOutlined />));
+      listOfComponents[9] = (
+        <LookupManager handleUpdateTool={handleUpdateTool} />
+      );
+    }
     setMenuItems(items);
     setComponents(listOfComponents);
   }, []);
diff --git a/frontend/src/components/lookups/debug-tab/DebugTab.jsx b/frontend/src/components/lookups/debug-tab/DebugTab.jsx
index 2427851f77..ba22da3cbe 100644
--- a/frontend/src/components/lookups/debug-tab/DebugTab.jsx
+++ b/frontend/src/components/lookups/debug-tab/DebugTab.jsx
@@ -44,7 +44,7 @@ export function DebugTab({ project }) {
       }
 
       const response = await axiosPrivate.post(
-        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/${project.id}/execute/`,
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-projects/${project.id}/execute/`,
         {
           input_data: parsedInput,
           use_cache: false,
diff --git a/frontend/src/components/lookups/execution-history-tab/ExecutionHistoryTab.jsx b/frontend/src/components/lookups/execution-history-tab/ExecutionHistoryTab.jsx
index d873da7da1..0acbf0902f 100644
--- a/frontend/src/components/lookups/execution-history-tab/ExecutionHistoryTab.jsx
+++ b/frontend/src/components/lookups/execution-history-tab/ExecutionHistoryTab.jsx
@@ -48,7 +48,7 @@ export function ExecutionHistoryTab({ project }) {
     setLoading(true);
     try {
       const response = await axiosPrivate.get(
-        `/api/v1/unstract/${sessionDetails?.orgId}/execution-audits/`,
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup/execution-audits/`,
         {
           params: { lookup_project_id: project.id },
         }
@@ -67,7 +67,7 @@ export function ExecutionHistoryTab({ project }) {
   const fetchStatistics = async () => {
     try {
       const response = await axiosPrivate.get(
-        `/api/v1/unstract/${sessionDetails?.orgId}/execution-audits/statistics/`,
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup/execution-audits/statistics/`,
         {
           params: { lookup_project_id: project.id },
         }
diff --git a/frontend/src/components/lookups/linked-projects-tab/LinkedProjectsTab.jsx b/frontend/src/components/lookups/linked-projects-tab/LinkedProjectsTab.jsx
index 91a549d09d..99015d9a33 100644
--- a/frontend/src/components/lookups/linked-projects-tab/LinkedProjectsTab.jsx
+++ b/frontend/src/components/lookups/linked-projects-tab/LinkedProjectsTab.jsx
@@ -48,10 +48,11 @@ export function LinkedProjectsTab({ project }) {
         `/api/v1/unstract/${sessionDetails?.orgId}/prompt-studio/`
       );
       const projects = response.data.results || response.data || [];
-      // Build a map of PS project ID -> tool name
+      // Build a map of PS project tool_id -> tool name
+      // The prompt_studio_project_id in links is the tool_id (UUID)
       const projectsMap = {};
       projects.forEach((proj) => {
-        projectsMap[proj.id] = proj.tool_name || "Unnamed Project";
+        projectsMap[proj.tool_id] = proj.tool_name || "Unnamed Project";
       });
       setPsProjectsMap(projectsMap);
     } catch (error) {
@@ -63,7 +64,7 @@ export function LinkedProjectsTab({ project }) {
     setLoading(true);
     try {
       const response = await axiosPrivate.get(
-        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-links/`,
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-links/`,
         {
           params: { lookup_project_id: project.id },
         }
@@ -163,7 +164,7 @@ export function LinkedProjectsTab({ project }) {
       }
 
       await axiosPrivate.post(
-        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-links/`,
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-links/`,
         {
           prompt_studio_project_id: selectedProject,
           lookup_project: project.id,
@@ -205,7 +206,7 @@ export function LinkedProjectsTab({ project }) {
       onOk: async () => {
         try {
           await axiosPrivate.delete(
-            `/api/v1/unstract/${sessionDetails?.orgId}/lookup-links/${linkId}/`,
+            `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-links/${linkId}/`,
             {
               headers: {
                 "X-CSRFToken": sessionDetails?.csrfToken,
diff --git a/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx b/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx
index 4275512186..4459480972 100644
--- a/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx
+++ b/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx
@@ -101,7 +101,7 @@ function ProfileFormModal({ projectId, profileId, onClose }) {
     setLoading(true);
     const requestOptions = {
       method: "GET",
-      url: `/api/v1/unstract/${sessionDetails?.orgId}/lookup-profiles/${profileId}/`,
+      url: `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-profiles/${profileId}/`,
       headers: {
         "X-CSRFToken": sessionDetails?.csrfToken,
       },
@@ -164,8 +164,8 @@ function ProfileFormModal({ projectId, profileId, onClose }) {
         const requestOptions = {
           method: isEdit ? "PATCH" : "POST",
           url: isEdit
-            ? `/api/v1/unstract/${sessionDetails?.orgId}/lookup-profiles/${profileId}/`
-            : `/api/v1/unstract/${sessionDetails?.orgId}/lookup-profiles/`,
+            ? `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-profiles/${profileId}/`
+            : `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-profiles/`,
           headers: {
             "X-CSRFToken": sessionDetails?.csrfToken,
             "Content-Type": "application/json",
diff --git a/frontend/src/components/lookups/profile-management-tab/ProfileManagementTab.jsx b/frontend/src/components/lookups/profile-management-tab/ProfileManagementTab.jsx
index 90cd8c6849..d43d222302 100644
--- a/frontend/src/components/lookups/profile-management-tab/ProfileManagementTab.jsx
+++ b/frontend/src/components/lookups/profile-management-tab/ProfileManagementTab.jsx
@@ -74,7 +74,7 @@ function ProfileManagementTab({ projectId }) {
     setLoading(true);
     const requestOptions = {
       method: "GET",
-      url: `/api/v1/unstract/${sessionDetails?.orgId}/lookup-profiles/?lookup_project=${projectId}`,
+      url: `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-profiles/?lookup_project=${projectId}`,
       headers: {
         "X-CSRFToken": sessionDetails?.csrfToken,
       },
@@ -108,7 +108,7 @@ function ProfileManagementTab({ projectId }) {
   const handleSetDefault = (profileId) => {
     const requestOptions = {
       method: "POST",
-      url: `/api/v1/unstract/${sessionDetails?.orgId}/lookup-profiles/${profileId}/set-default/`,
+      url: `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-profiles/${profileId}/set-default/`,
       headers: {
         "X-CSRFToken": sessionDetails?.csrfToken,
         "Content-Type": "application/json",
@@ -145,7 +145,7 @@ function ProfileManagementTab({ projectId }) {
   const handleDelete = (profileId) => {
     const requestOptions = {
       method: "DELETE",
-      url: `/api/v1/unstract/${sessionDetails?.orgId}/lookup-profiles/${profileId}/`,
+      url: `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-profiles/${profileId}/`,
       headers: {
         "X-CSRFToken": sessionDetails?.csrfToken,
       },
diff --git a/frontend/src/components/lookups/project-detail/LookUpProjectDetail.jsx b/frontend/src/components/lookups/project-detail/LookUpProjectDetail.jsx
index f1a4b7e85e..c347991d0b 100644
--- a/frontend/src/components/lookups/project-detail/LookUpProjectDetail.jsx
+++ b/frontend/src/components/lookups/project-detail/LookUpProjectDetail.jsx
@@ -31,7 +31,7 @@ import { ExecutionHistoryTab } from "../execution-history-tab/ExecutionHistoryTa
 import { DebugTab } from "../debug-tab/DebugTab";
 import "./LookUpProjectDetail.css";
 
-const { Title, Text } = Typography;
+const { Title } = Typography;
 const { TextArea } = Input;
 
 const REFERENCE_DATA_TYPES = [
@@ -66,7 +66,7 @@ export function LookUpProjectDetail() {
     setLoading(true);
     try {
       const response = await axiosPrivate.get(
-        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/${projectId}/`
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-projects/${projectId}/`
       );
       setProject(response.data);
     } catch (error) {
@@ -103,7 +103,7 @@ export function LookUpProjectDetail() {
           ?.split("=")[1];
 
       await axiosPrivate.patch(
-        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/${projectId}/`,
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-projects/${projectId}/`,
         values,
         {
           headers: {
@@ -142,7 +142,7 @@ export function LookUpProjectDetail() {
           ?.split("=")[1];
 
       await axiosPrivate.delete(
-        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/${projectId}/`,
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-projects/${projectId}/`,
         {
           headers: {
             "X-CSRFToken": csrfToken,
@@ -222,9 +222,6 @@ export function LookUpProjectDetail() {
         <div className="project-info">
           <div>
             <Title level={3}>{project.name}</Title>
-            {project.description && (
-              <Text type="secondary">{project.description}</Text>
-            )}
           </div>
           <Space>
             <Tag color={project.is_active ? "green" : "orange"}>
diff --git a/frontend/src/components/lookups/project-list/LookUpProjectList.jsx b/frontend/src/components/lookups/project-list/LookUpProjectList.jsx
index 1e935ed0e1..0e99f37b0d 100644
--- a/frontend/src/components/lookups/project-list/LookUpProjectList.jsx
+++ b/frontend/src/components/lookups/project-list/LookUpProjectList.jsx
@@ -48,7 +48,7 @@ export function LookUpProjectList() {
     setLoading(true);
     try {
       const response = await axiosPrivate.get(
-        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/`
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-projects/`
       );
       setProjects(response.data.results || response.data || []);
     } catch (error) {
@@ -64,7 +64,7 @@ export function LookUpProjectList() {
   const handleCreateProject = async (values) => {
     try {
       const response = await axiosPrivate.post(
-        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/`,
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-projects/`,
         values,
         {
           headers: {
@@ -98,7 +98,7 @@ export function LookUpProjectList() {
           ?.split("=")[1];
 
       await axiosPrivate.delete(
-        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/${projectId}/`,
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-projects/${projectId}/`,
         {
           headers: {
             "X-CSRFToken": csrfToken,
@@ -140,12 +140,6 @@ export function LookUpProjectList() {
         </Button>
       ),
     },
-    {
-      title: "Description",
-      dataIndex: "description",
-      key: "description",
-      ellipsis: true,
-    },
     {
       title: "Type",
       dataIndex: "reference_data_type",
diff --git a/frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.jsx b/frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.jsx
index a9ce5bb96c..af82f57fad 100644
--- a/frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.jsx
+++ b/frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.jsx
@@ -49,7 +49,7 @@ export function ReferenceDataTab({ project, onUpdate }) {
     setLoading(true);
     try {
       const response = await axiosPrivate.get(
-        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/${project.id}/data_sources/`
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-projects/${project.id}/data_sources/`
       );
       setDataSources(response.data || []);
     } catch (error) {
@@ -71,7 +71,7 @@ export function ReferenceDataTab({ project, onUpdate }) {
 
     try {
       await axiosPrivate.post(
-        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/${project.id}/upload_reference_data/`,
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-projects/${project.id}/upload_reference_data/`,
         formData,
         {
           headers: {
@@ -109,7 +109,7 @@ export function ReferenceDataTab({ project, onUpdate }) {
       onOk: async () => {
         try {
           await axiosPrivate.delete(
-            `/api/v1/unstract/${sessionDetails?.orgId}/data-sources/${dataSourceId}/`,
+            `/api/v1/unstract/${sessionDetails?.orgId}/lookup/data-sources/${dataSourceId}/`,
             {
               headers: {
                 "X-CSRFToken": sessionDetails?.csrfToken,
@@ -143,7 +143,7 @@ export function ReferenceDataTab({ project, onUpdate }) {
         setIndexing(true);
         try {
           const response = await axiosPrivate.post(
-            `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/${project.id}/index_all/`,
+            `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-projects/${project.id}/index_all/`,
             {},
             {
               headers: {
diff --git a/frontend/src/components/lookups/template-tab/TemplateTab.jsx b/frontend/src/components/lookups/template-tab/TemplateTab.jsx
index af2b8aa4c1..c5a36321e3 100644
--- a/frontend/src/components/lookups/template-tab/TemplateTab.jsx
+++ b/frontend/src/components/lookups/template-tab/TemplateTab.jsx
@@ -75,7 +75,7 @@ export function TemplateTab({ project, onUpdate }) {
   const fetchTemplate = async () => {
     try {
       const response = await axiosPrivate.get(
-        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-templates/${project.template.id}/`
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-templates/${project.template.id}/`
       );
       setTemplate(response.data);
       form.setFieldsValue({
@@ -125,14 +125,14 @@ export function TemplateTab({ project, onUpdate }) {
       if (template) {
         // Update existing
         await axiosPrivate.patch(
-          `/api/v1/unstract/${sessionDetails?.orgId}/lookup-templates/${template.id}/`,
+          `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-templates/${template.id}/`,
           payload,
           { headers }
         );
       } else {
         // Create new
         await axiosPrivate.post(
-          `/api/v1/unstract/${sessionDetails?.orgId}/lookup-templates/`,
+          `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-templates/`,
           payload,
           { headers }
         );
@@ -160,7 +160,7 @@ export function TemplateTab({ project, onUpdate }) {
     try {
       const templateText = form.getFieldValue("template_text");
       const response = await axiosPrivate.post(
-        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-templates/validate/`,
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-templates/validate/`,
         {
           template_text: templateText,
           sample_data: {},
@@ -193,7 +193,7 @@ export function TemplateTab({ project, onUpdate }) {
   const handleTest = async (testData) => {
     try {
       const response = await axiosPrivate.post(
-        `/api/v1/unstract/${sessionDetails?.orgId}/lookup-projects/${project.id}/execute/`,
+        `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-projects/${project.id}/execute/`,
         {
           input_data: testData,
           use_cache: false,
diff --git a/frontend/src/hooks/usePromptOutput.js b/frontend/src/hooks/usePromptOutput.js
index eafe41521e..ec09be105a 100644
--- a/frontend/src/hooks/usePromptOutput.js
+++ b/frontend/src/hooks/usePromptOutput.js
@@ -109,6 +109,26 @@ const usePromptOutput = () => {
         isSinglePass,
         true
       );
+      // Apply lookup enrichment in-place if available
+      // The lookup_enrichment object is keyed by field name (e.g., {"vendor_name": "Amazon Web Services"})
+      let enrichedOutput = item?.output;
+      const lookupEnrichment = item?.lookup_enrichment;
+      const promptKey = item?.prompt_key;
+
+      if (
+        lookupEnrichment &&
+        Object.keys(lookupEnrichment).length > 0 &&
+        promptKey &&
+        Object.prototype.hasOwnProperty.call(lookupEnrichment, promptKey)
+      ) {
+        // Match prompt_key to enrichment key (works for both individual and single-pass modes)
+        // Each item has its own output value, and we match by the prompt's field name
+        const enrichmentValue = lookupEnrichment[promptKey];
+        if (enrichmentValue && typeof enrichedOutput === "string") {
+          enrichedOutput = enrichmentValue;
+        }
+      }
+
       outputs[key] = {
         runId: item?.run_id,
         promptOutputId: item?.prompt_output_id,
@@ -116,12 +136,16 @@ const usePromptOutput = () => {
         context: item?.context,
         challengeData: item?.challenge_data,
         tokenUsage: item?.token_usage,
-        output: item?.output,
+        output: enrichedOutput,
+        originalOutput: item?.output,
         timer,
         coverage: item?.coverage,
         highlightData: item?.highlight_data,
         confidenceData: item?.confidence_data,
         wordConfidenceData: item?.word_confidence_data,
+        // Lookup enrichment data
+        lookupEnrichment: item?.lookup_enrichment,
+        lookupMetadata: item?._lookup_metadata,
       };
 
       if (item?.is_single_pass_extract && isTokenUsageForSinglePassAdded)

From 7558149104a7aea99880e94efa8ad4393f6a3f0d Mon Sep 17 00:00:00 2001
From: gayathrivijayakumar <gayathri@zipstack.com>
Date: Tue, 6 Jan 2026 16:27:56 +0530
Subject: [PATCH 03/22] Working

---
 backend/lookup/services/lookup_executor.py    | 273 +++++++++++++++++-
 .../services/lookup_integration_service.py    |   6 +-
 .../lookup/services/lookup_orchestrator.py    |  89 +++++-
 backend/lookup/views.py                       |  31 +-
 .../combined-output/CombinedOutput.jsx        |   4 +-
 5 files changed, 378 insertions(+), 25 deletions(-)

diff --git a/backend/lookup/services/lookup_executor.py b/backend/lookup/services/lookup_executor.py
index ebb70a9303..05fe91b86f 100644
--- a/backend/lookup/services/lookup_executor.py
+++ b/backend/lookup/services/lookup_executor.py
@@ -8,6 +8,7 @@
 import json
 import logging
 import time
+import uuid
 from typing import Any, Protocol
 
 from lookup.exceptions import (
@@ -16,6 +17,7 @@
     TemplateNotFoundError,
 )
 from lookup.models import LookupProject
+from lookup.services.audit_logger import AuditLogger
 
 logger = logging.getLogger(__name__)
 
@@ -57,7 +59,11 @@ def __init__(
         self.llm_client = llm_client
 
     def execute(
-        self, lookup_project: LookupProject, input_data: dict[str, Any]
+        self,
+        lookup_project: LookupProject,
+        input_data: dict[str, Any],
+        execution_id: str | None = None,
+        prompt_studio_project_id: str | None = None,
     ) -> dict[str, Any]:
         """Execute single Look-Up.
 
@@ -67,6 +73,8 @@ def execute(
         Args:
             lookup_project: The Look-Up project to execute
             input_data: Input data containing variables to resolve
+            execution_id: Optional UUID to group related executions for audit
+            prompt_studio_project_id: Optional PS project ID for audit tracking
 
         Returns:
             Dictionary containing:
@@ -88,6 +96,16 @@ def execute(
         """
         start_time = time.time()
 
+        # Initialize audit tracking variables
+        exec_id = execution_id or str(uuid.uuid4())
+        resolved_prompt = None
+        llm_response = None
+        llm_time_ms = None
+        reference_data_version = 1
+        llm_provider = "unknown"
+        llm_model = "unknown"
+        _cached = False  # noqa F841
+
         try:
             # Step 1: Load reference data
             try:
@@ -95,16 +113,55 @@ def execute(
                     lookup_project.id
                 )
                 reference_data = reference_data_dict["content"]
+                reference_data_version = reference_data_dict.get("version", 1)
             except ExtractionNotCompleteError as e:
-                return self._failed_result(
+                result = self._failed_result(
                     lookup_project,
                     f"Reference data extraction not complete: {str(e)}",
                     start_time,
                 )
+                self._log_audit(
+                    exec_id,
+                    lookup_project,
+                    prompt_studio_project_id,
+                    input_data,
+                    reference_data_version,
+                    llm_provider,
+                    llm_model,
+                    resolved_prompt,
+                    llm_response,
+                    None,
+                    "failed",
+                    None,
+                    result["execution_time_ms"],
+                    None,
+                    False,
+                    result["error"],
+                )
+                return result
             except Exception as e:
-                return self._failed_result(
+                result = self._failed_result(
                     lookup_project, f"Failed to load reference data: {str(e)}", start_time
                 )
+                self._log_audit(
+                    exec_id,
+                    lookup_project,
+                    prompt_studio_project_id,
+                    input_data,
+                    reference_data_version,
+                    llm_provider,
+                    llm_model,
+                    resolved_prompt,
+                    llm_response,
+                    None,
+                    "failed",
+                    None,
+                    result["execution_time_ms"],
+                    None,
+                    False,
+                    result["error"],
+                )
+                return result
 
             # Step 2: Load prompt template
             try:
@@ -112,10 +169,34 @@ def execute(
                 if not template:
                     raise TemplateNotFoundError("No template configured")
                 template_text = template.template_text
+
+                # Extract LLM info from template config if available
+                if template.llm_config:
+                    llm_provider = template.llm_config.get("provider", "unknown")
+                    llm_model = template.llm_config.get("model", "unknown")
             except (AttributeError, TemplateNotFoundError) as e:
-                return self._failed_result(
+                result = self._failed_result(
                     lookup_project, f"Missing prompt template: {str(e)}", start_time
                 )
+                self._log_audit(
+                    exec_id,
+                    lookup_project,
+                    prompt_studio_project_id,
+                    input_data,
+                    reference_data_version,
+                    llm_provider,
+                    llm_model,
+                    resolved_prompt,
+                    llm_response,
+                    None,
+                    "failed",
+                    None,
+                    result["execution_time_ms"],
+                    None,
+                    False,
+                    result["error"],
+                )
+                return result
 
             # Step 3: Resolve variables
             logger.info(f"Input data received: {input_data}")
@@ -137,13 +218,32 @@ def execute(
                     enrichment_data, confidence = self._parse_llm_response(
                         cached_response
                     )
-                    return self._success_result(
+                    result = self._success_result(
                         lookup_project,
                         enrichment_data,
                         confidence,
                         cached=True,
                         execution_time_ms=0,  # No execution time for cached response
                     )
+                    self._log_audit(
+                        exec_id,
+                        lookup_project,
+                        prompt_studio_project_id,
+                        input_data,
+                        reference_data_version,
+                        llm_provider,
+                        llm_model,
+                        resolved_prompt,
+                        cached_response,
+                        enrichment_data,
+                        "success",
+                        confidence,
+                        0,
+                        None,
+                        True,
+                        None,
+                    )
+                    return result
 
             # Step 5: Call LLM (cache miss or caching disabled)
             try:
@@ -158,37 +258,188 @@ def execute(
                     self.cache.set(cache_key, llm_response)
 
             except TimeoutError as e:
-                return self._failed_result(
+                result = self._failed_result(
                     lookup_project, f"LLM request timed out: {str(e)}", start_time
                 )
+                self._log_audit(
+                    exec_id,
+                    lookup_project,
+                    prompt_studio_project_id,
+                    input_data,
+                    reference_data_version,
+                    llm_provider,
+                    llm_model,
+                    resolved_prompt,
+                    None,
+                    None,
+                    "failed",
+                    None,
+                    result["execution_time_ms"],
+                    llm_time_ms,
+                    False,
+                    result["error"],
+                )
+                return result
             except Exception as e:
-                return self._failed_result(
+                result = self._failed_result(
                     lookup_project, f"LLM request failed: {str(e)}", start_time
                 )
+                self._log_audit(
+                    exec_id,
+                    lookup_project,
+                    prompt_studio_project_id,
+                    input_data,
+                    reference_data_version,
+                    llm_provider,
+                    llm_model,
+                    resolved_prompt,
+                    None,
+                    None,
+                    "failed",
+                    None,
+                    result["execution_time_ms"],
+                    llm_time_ms,
+                    False,
+                    result["error"],
+                )
+                return result
 
             # Step 6: Parse response
             try:
                 enrichment_data, confidence = self._parse_llm_response(llm_response)
             except ParseError as e:
-                return self._failed_result(
+                result = self._failed_result(
                     lookup_project, f"Failed to parse LLM response: {str(e)}", start_time
                 )
+                self._log_audit(
+                    exec_id,
+                    lookup_project,
+                    prompt_studio_project_id,
+                    input_data,
+                    reference_data_version,
+                    llm_provider,
+                    llm_model,
+                    resolved_prompt,
+                    llm_response,
+                    None,
+                    "failed",
+                    None,
+                    result["execution_time_ms"],
+                    llm_time_ms,
+                    False,
+                    result["error"],
+                )
+                return result
 
-            # Step 7: Return result
-            return self._success_result(
+            # Step 7: Return result and log success
+            result = self._success_result(
                 lookup_project,
                 enrichment_data,
                 confidence,
                 cached=False,
                 execution_time_ms=llm_time_ms,
             )
+            self._log_audit(
+                exec_id,
+                lookup_project,
+                prompt_studio_project_id,
+                input_data,
+                reference_data_version,
+                llm_provider,
+                llm_model,
+                resolved_prompt,
+                llm_response,
+                enrichment_data,
+                "success",
+                confidence,
+                llm_time_ms,
+                llm_time_ms,
+                False,
+                None,
+            )
+            return result
 
         except Exception as e:
             # Catch-all for unexpected errors
             logger.exception(f"Unexpected error executing Look-Up {lookup_project.id}")
-            return self._failed_result(
+            result = self._failed_result(
                 lookup_project, f"Unexpected error: {str(e)}", start_time
             )
+            self._log_audit(
+                exec_id,
+                lookup_project,
+                prompt_studio_project_id,
+                input_data,
+                reference_data_version,
+                llm_provider,
+                llm_model,
+                resolved_prompt,
+                llm_response,
+                None,
+                "failed",
+                None,
+                result["execution_time_ms"],
+                llm_time_ms,
+                False,
+                result["error"],
+            )
+            return result
+
+    def _log_audit(
+        self,
+        execution_id: str,
+        lookup_project: LookupProject,
+        prompt_studio_project_id: str | None,
+        input_data: dict[str, Any],
+        reference_data_version: int,
+        llm_provider: str,
+        llm_model: str,
+        llm_prompt: str | None,
+        llm_response: str | None,
+        enriched_output: dict[str, Any] | None,
+        status: str,
+        confidence_score: float | None,
+        execution_time_ms: int | None,
+        llm_call_time_ms: int | None,
+        llm_response_cached: bool,
+        error_message: str | None,
+    ) -> None:
+        """Log execution to audit table.
+
+        This method wraps AuditLogger to capture all execution details
+        for the Execution History tab.
+        """
+        try:
+            audit_logger = AuditLogger()
+            audit_logger.log_execution(
+                execution_id=execution_id,
+                lookup_project_id=lookup_project.id,
+                prompt_studio_project_id=(
+                    uuid.UUID(prompt_studio_project_id)
+                    if prompt_studio_project_id
+                    else None
+                ),
+                input_data=input_data,
+                reference_data_version=reference_data_version,
+                llm_provider=llm_provider,
+                llm_model=llm_model,
+                llm_prompt=llm_prompt or "",
+                llm_response=llm_response,
+                enriched_output=enriched_output,
+                status=status,
+                confidence_score=confidence_score,
+                execution_time_ms=execution_time_ms,
+                llm_call_time_ms=llm_call_time_ms,
+                llm_response_cached=llm_response_cached,
+                error_message=error_message,
+            )
+            logger.debug(
+                f"Audit logged for Look-Up {lookup_project.name} "
+                f"(execution_id={execution_id}, status={status})"
+            )
+        except Exception as e:
+            # Don't fail the execution if audit logging fails
+            logger.warning(f"Failed to log audit for Look-Up execution: {e}")
 
     def _parse_llm_response(self, response_text: str) -> tuple[dict, float | None]:
         """Parse LLM response to extract enrichment data.
diff --git a/backend/lookup/services/lookup_integration_service.py b/backend/lookup/services/lookup_integration_service.py
index 0f4151ef84..21c8c966b0 100644
--- a/backend/lookup/services/lookup_integration_service.py
+++ b/backend/lookup/services/lookup_integration_service.py
@@ -146,6 +146,7 @@ def _execute_enrichment(
                 lookup_projects=lookup_projects,
                 input_data=extracted_data,
                 execution_id=run_id or str(uuid.uuid4()),
+                prompt_studio_project_id=prompt_studio_project_id,
             )
             result = future.result(timeout=timeout)
 
@@ -156,6 +157,7 @@ def _run_orchestrator(
         lookup_projects: list,
         input_data: dict[str, Any],
         execution_id: str,
+        prompt_studio_project_id: str,
     ) -> dict[str, Any]:
         """Execute the lookup orchestrator for all linked projects."""
         from lookup.integrations.file_storage_client import FileStorageClient
@@ -226,10 +228,12 @@ def _run_orchestrator(
             # Create orchestrator
             orchestrator = LookUpOrchestrator(executor=executor, merger=merger)
 
-            # Execute lookups
+            # Execute lookups with audit context
             result = orchestrator.execute_lookups(
                 input_data=input_data,
                 lookup_projects=lookup_projects,
+                execution_id=execution_id,
+                prompt_studio_project_id=prompt_studio_project_id,
             )
 
             return {
diff --git a/backend/lookup/services/lookup_orchestrator.py b/backend/lookup/services/lookup_orchestrator.py
index e24a1eb095..75b8a87ee3 100644
--- a/backend/lookup/services/lookup_orchestrator.py
+++ b/backend/lookup/services/lookup_orchestrator.py
@@ -57,7 +57,11 @@ def __init__(
         )
 
     def execute_lookups(
-        self, input_data: dict[str, Any], lookup_projects: list[LookupProject]
+        self,
+        input_data: dict[str, Any],
+        lookup_projects: list[LookupProject],
+        execution_id: str | None = None,
+        prompt_studio_project_id: str | None = None,
     ) -> dict[str, Any]:
         """Execute all Look-Ups in parallel and merge results.
 
@@ -68,6 +72,8 @@ def execute_lookups(
         Args:
             input_data: Input data to enrich
             lookup_projects: List of Look-Up projects to execute
+            execution_id: Optional UUID to group related executions for audit
+            prompt_studio_project_id: Optional PS project ID for audit tracking
 
         Returns:
             Dictionary containing:
@@ -91,7 +97,7 @@ def execute_lookups(
             >>> print(result["_lookup_metadata"]["lookups_successful"])
             2
         """
-        execution_id = str(uuid.uuid4())
+        execution_id = execution_id or str(uuid.uuid4())
         start_time = time.time()
         executed_at = datetime.now(UTC).isoformat()
 
@@ -108,12 +114,21 @@ def execute_lookups(
         failed_lookups = []
         timeout_count = 0
 
+        # Build project order mapping for sorting results later
+        project_order = {
+            str(project.id): idx for idx, project in enumerate(lookup_projects)
+        }
+
         # Execute Look-Ups in parallel
         with ThreadPoolExecutor(max_workers=self.max_concurrent) as thread_executor:
             # Submit all tasks
             futures = {
                 thread_executor.submit(
-                    self._execute_single, execution_id, input_data, lookup_project
+                    self._execute_single,
+                    execution_id,
+                    input_data,
+                    lookup_project,
+                    prompt_studio_project_id,
                 ): lookup_project
                 for lookup_project in lookup_projects
             }
@@ -194,8 +209,13 @@ def execute_lookups(
                             }
                         )
 
-        # Merge successful enrichments
+        # Sort successful enrichments by original execution order before merging
+        # This ensures that when there's no confidence score, the lookup with
+        # lower execution_order (higher priority) wins in conflict resolution
         if successful_enrichments:
+            successful_enrichments.sort(
+                key=lambda x: project_order.get(x.get("project_id"), 999)
+            )
             merge_result = self.merger.merge(successful_enrichments)
             merged_data = merge_result["data"]
             conflicts_resolved = merge_result["conflicts_resolved"]
@@ -236,7 +256,11 @@ def execute_lookups(
         }
 
     def _execute_single(
-        self, execution_id: str, input_data: dict[str, Any], lookup_project: LookupProject
+        self,
+        execution_id: str,
+        input_data: dict[str, Any],
+        lookup_project: LookupProject,
+        prompt_studio_project_id: str | None = None,
     ) -> dict[str, Any]:
         """Execute a single Look-Up project.
 
@@ -247,6 +271,7 @@ def _execute_single(
             execution_id: ID of the orchestration execution
             input_data: Input data for enrichment
             lookup_project: Look-Up project to execute
+            prompt_studio_project_id: Optional PS project ID for audit tracking
 
         Returns:
             Enrichment result dictionary from the executor
@@ -256,12 +281,26 @@ def _execute_single(
                 f"Executing Look-Up {lookup_project.name} for execution {execution_id}"
             )
 
-            # Execute the Look-Up
-            result = self.executor.execute(lookup_project, input_data)
+            # Execute the Look-Up with audit context
+            result = self.executor.execute(
+                lookup_project=lookup_project,
+                input_data=input_data,
+                execution_id=execution_id,
+                prompt_studio_project_id=prompt_studio_project_id,
+            )
 
             # Add execution context
             result["execution_id"] = execution_id
 
+            # Filter enrichment data to only include fields that actually changed
+            # This prevents a lookup from overwriting fields it didn't canonicalize
+            if result.get("status") == "success" and result.get("data"):
+                result["data"] = self._filter_changed_fields(input_data, result["data"])
+                logger.debug(
+                    f"Filtered enrichment for {lookup_project.name}: "
+                    f"{list(result['data'].keys())}"
+                )
+
             return result
 
         except Exception as e:
@@ -277,6 +316,42 @@ def _execute_single(
                 "execution_id": execution_id,
             }
 
+    def _filter_changed_fields(
+        self,
+        input_data: dict[str, Any],
+        enrichment_data: dict[str, Any],
+    ) -> dict[str, Any]:
+        """Filter enrichment data to only include fields that changed.
+
+        When an LLM returns the entire input with modifications, this method
+        identifies which fields actually changed and returns only those.
+        This prevents one lookup from overwriting fields that another lookup
+        is responsible for canonicalizing.
+
+        Args:
+            input_data: Original input data before enrichment
+            enrichment_data: Data returned by the lookup
+
+        Returns:
+            Dictionary containing only fields that differ from input_data,
+            plus any new fields not present in input_data
+        """
+        changed_fields = {}
+
+        for field_name, enriched_value in enrichment_data.items():
+            # Include field if:
+            # 1. It's a new field not in input_data, OR
+            # 2. The value is different from the input value
+            if field_name not in input_data:
+                # New field added by the lookup
+                changed_fields[field_name] = enriched_value
+            elif input_data[field_name] != enriched_value:
+                # Field value was changed by the lookup
+                changed_fields[field_name] = enriched_value
+            # else: field unchanged, don't include it
+
+        return changed_fields
+
     def _empty_result(
         self, execution_id: str, executed_at: str, start_time: float
     ) -> dict[str, Any]:
diff --git a/backend/lookup/views.py b/backend/lookup/views.py
index de6311f4f2..8165684ba1 100644
--- a/backend/lookup/views.py
+++ b/backend/lookup/views.py
@@ -570,7 +570,7 @@ def enrich_ps_output(self, request):
                     }
                 )
 
-            # Get Look-Up projects
+            # Get Look-Up projects (already ordered by execution_order from query)
             lookup_projects = [link.lookup_project for link in links]
 
             # Initialize services with real clients
@@ -582,8 +582,15 @@ def enrich_ps_output(self, request):
             ref_loader = ReferenceDataLoader(storage_client)
             merger = EnrichmentMerger()
 
+            # Build project order mapping for sorting results later
+            # This ensures enrichments are merged in execution_order priority
+            project_order = {
+                str(project.id): idx for idx, project in enumerate(lookup_projects)
+            }
+
             # Execute each Look-Up with its own LLM profile
-            all_enrichment = {}
+            # Collect results with project IDs for proper ordering
+            enrichment_results = []
             all_metadata = {"lookups_executed": 0, "lookup_details": []}
 
             for project in lookup_projects:
@@ -621,9 +628,14 @@ def enrich_ps_output(self, request):
                         input_data=extracted_data, lookup_projects=[project]
                     )
 
-                    # Merge results
+                    # Collect results with project ID for ordering
                     if result.get("lookup_enrichment"):
-                        all_enrichment.update(result["lookup_enrichment"])
+                        enrichment_results.append(
+                            {
+                                "project_id": str(project.id),
+                                "enrichment": result["lookup_enrichment"],
+                            }
+                        )
 
                     all_metadata["lookups_executed"] += 1
                     all_metadata["lookup_details"].append(
@@ -648,6 +660,17 @@ def enrich_ps_output(self, request):
                         }
                     )
 
+            # Sort enrichment results by execution order (first lookup has priority)
+            enrichment_results.sort(
+                key=lambda x: project_order.get(x.get("project_id"), 999)
+            )
+
+            # Merge enrichments in REVERSE order so first lookup wins
+            # (later updates overwrite, so process highest priority last)
+            all_enrichment = {}
+            for result in reversed(enrichment_results):
+                all_enrichment.update(result["enrichment"])
+
             # Merge enrichment into extracted data
             enriched_data = {**extracted_data, **all_enrichment}
 
diff --git a/frontend/src/components/custom-tools/combined-output/CombinedOutput.jsx b/frontend/src/components/custom-tools/combined-output/CombinedOutput.jsx
index e42f61715a..abf0b12584 100644
--- a/frontend/src/components/custom-tools/combined-output/CombinedOutput.jsx
+++ b/frontend/src/components/custom-tools/combined-output/CombinedOutput.jsx
@@ -116,7 +116,7 @@ function CombinedOutput({ docId, setFilledFields, selectedPrompts }) {
 
     const checkLinkedLookups = async () => {
       try {
-        const url = `/api/v1/unstract/${sessionDetails?.orgId}/lookup-links/?prompt_studio_project_id=${toolId}`;
+        const url = `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-links/?prompt_studio_project_id=${toolId}`;
         const res = await axiosPrivate.get(url);
         const links = res?.data?.results || res?.data || [];
         setHasLinkedLookups(links.length > 0);
@@ -143,7 +143,7 @@ function CombinedOutput({ docId, setFilledFields, selectedPrompts }) {
     setIsEnriching(true);
     try {
       const toolId = details?.tool_id || id;
-      const url = `/api/v1/unstract/${sessionDetails?.orgId}/lookup-debug/enrich_ps_output/`;
+      const url = `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-debug/enrich_ps_output/`;
 
       // Get fresh CSRF token from cookie
       const csrfToken =

From a55f35149cc0150f8980057742ff8d1c3660845c Mon Sep 17 00:00:00 2001
From: gayathrivijayakumar <gayathri@zipstack.com>
Date: Thu, 8 Jan 2026 14:03:04 +0530
Subject: [PATCH 04/22] Save point

---
 .../0002_remove_reference_data_type.py        | 22 +++++
 backend/lookup/models/lookup_data_source.py   |  7 +-
 backend/lookup/models/lookup_project.py       | 14 ----
 backend/lookup/serializers.py                 |  1 -
 .../tests/test_api/test_execution_api.py      |  3 -
 .../lookup/tests/test_api/test_linking_api.py |  2 -
 .../test_api/test_profile_manager_api.py      |  2 -
 .../lookup/tests/test_api/test_project_api.py |  4 -
 .../CreateProjectModal.jsx                    | 24 +-----
 .../ExecutionHistoryTab.jsx                   |  4 +-
 .../project-detail/LookUpProjectDetail.jsx    | 30 -------
 .../project-list/LookUpProjectList.jsx        |  8 --
 .../reference-data-tab/ReferenceDataTab.jsx   | 80 ++++++++++++++++---
 13 files changed, 99 insertions(+), 102 deletions(-)
 create mode 100644 backend/lookup/migrations/0002_remove_reference_data_type.py

diff --git a/backend/lookup/migrations/0002_remove_reference_data_type.py b/backend/lookup/migrations/0002_remove_reference_data_type.py
new file mode 100644
index 0000000000..44823bda04
--- /dev/null
+++ b/backend/lookup/migrations/0002_remove_reference_data_type.py
@@ -0,0 +1,22 @@
+# Generated manually - Remove reference_data_type field from LookupProject
+
+from django.db import migrations
+
+
+class Migration(migrations.Migration):
+    """Remove reference_data_type field from LookupProject model.
+
+    This field is no longer needed as the type categorization
+    has been removed from the Lookup projects feature.
+    """
+
+    dependencies = [
+        ("lookup", "0001_initial"),
+    ]
+
+    operations = [
+        migrations.RemoveField(
+            model_name="lookupproject",
+            name="reference_data_type",
+        ),
+    ]
diff --git a/backend/lookup/models/lookup_data_source.py b/backend/lookup/models/lookup_data_source.py
index 49c1ea0011..9417543b61 100644
--- a/backend/lookup/models/lookup_data_source.py
+++ b/backend/lookup/models/lookup_data_source.py
@@ -173,8 +173,11 @@ def auto_increment_version_and_update_latest(sender, instance, **kwargs):
     1. Auto-increments version_number if not set
     2. Marks all previous versions as not latest
     """
-    # If this is a new instance (not updating existing)
-    if not instance.pk:
+    # Check if this is a new instance by querying the database
+    # (instance.pk is always truthy for UUIDField with default=uuid.uuid4)
+    is_new = not LookupDataSource.objects.filter(pk=instance.pk).exists()
+
+    if is_new:
         # Get the highest version number for this project
         max_version = LookupDataSource.objects.filter(project=instance.project).aggregate(
             max_version=models.Max("version_number")
diff --git a/backend/lookup/models/lookup_project.py b/backend/lookup/models/lookup_project.py
index 14b2d4d671..7a9014184b 100644
--- a/backend/lookup/models/lookup_project.py
+++ b/backend/lookup/models/lookup_project.py
@@ -24,15 +24,6 @@ class LookupProject(DefaultOrganizationMixin, BaseModel):
         ("static_data", "Static Data"),
     ]
 
-    REFERENCE_DATA_TYPE_CHOICES = [
-        ("vendor_catalog", "Vendor Catalog"),
-        ("product_catalog", "Product Catalog"),
-        ("customer_database", "Customer Database"),
-        ("pricing_data", "Pricing Data"),
-        ("compliance_rules", "Compliance Rules"),
-        ("custom", "Custom"),
-    ]
-
     LLM_PROVIDER_CHOICES = [
         ("openai", "OpenAI"),
         ("anthropic", "Anthropic"),
@@ -51,11 +42,6 @@ class LookupProject(DefaultOrganizationMixin, BaseModel):
         default="static_data",
         help_text="Type of Look-Up (only static_data for POC)",
     )
-    reference_data_type = models.CharField(
-        max_length=50,
-        choices=REFERENCE_DATA_TYPE_CHOICES,
-        help_text="Category of reference data being stored",
-    )
 
     # Template and status
     template = models.ForeignKey(
diff --git a/backend/lookup/serializers.py b/backend/lookup/serializers.py
index be0aff118f..7aa8d09f25 100644
--- a/backend/lookup/serializers.py
+++ b/backend/lookup/serializers.py
@@ -122,7 +122,6 @@ class Meta:
             "id",
             "name",
             "description",
-            "reference_data_type",
             "template",
             "template_id",
             "is_active",
diff --git a/backend/lookup/tests/test_api/test_execution_api.py b/backend/lookup/tests/test_api/test_execution_api.py
index 042c35f057..a64bd37e61 100644
--- a/backend/lookup/tests/test_api/test_execution_api.py
+++ b/backend/lookup/tests/test_api/test_execution_api.py
@@ -47,14 +47,12 @@ def setUp(self):
         self.lookup1 = LookupProject.objects.create(
             name="Vendor Lookup",
             description="Vendor enrichment",
-            reference_data_type="vendor_catalog",
             template=self.template,
             created_by=self.user
         )
         self.lookup2 = LookupProject.objects.create(
             name="Product Lookup",
             description="Product enrichment",
-            reference_data_type="product_catalog",
             template=self.template,
             created_by=self.user
         )
@@ -183,7 +181,6 @@ def setUp(self):
         self.lookup = LookupProject.objects.create(
             name="Test Lookup",
             description="Test",
-            reference_data_type="vendor_catalog",
             template=self.template,
             created_by=self.user
         )
diff --git a/backend/lookup/tests/test_api/test_linking_api.py b/backend/lookup/tests/test_api/test_linking_api.py
index 69442b8985..92aec4937d 100644
--- a/backend/lookup/tests/test_api/test_linking_api.py
+++ b/backend/lookup/tests/test_api/test_linking_api.py
@@ -43,14 +43,12 @@ def setUp(self):
         self.lookup1 = LookupProject.objects.create(
             name="Lookup 1",
             description="First lookup",
-            reference_data_type="vendor_catalog",
             template=self.template,
             created_by=self.user
         )
         self.lookup2 = LookupProject.objects.create(
             name="Lookup 2",
             description="Second lookup",
-            reference_data_type="product_catalog",
             template=self.template,
             created_by=self.user
         )
diff --git a/backend/lookup/tests/test_api/test_profile_manager_api.py b/backend/lookup/tests/test_api/test_profile_manager_api.py
index 4884bb53f7..850c5157be 100644
--- a/backend/lookup/tests/test_api/test_profile_manager_api.py
+++ b/backend/lookup/tests/test_api/test_profile_manager_api.py
@@ -33,7 +33,6 @@ def setUp(self):
         self.project = LookupProject.objects.create(
             name="Test Lookup Project",
             description="Test Description",
-            reference_data_type="vendor_catalog",
             created_by=self.user
         )
 
@@ -170,7 +169,6 @@ def test_filter_by_project(self, mock_get_by_id, mock_get_adapter):
         project2 = LookupProject.objects.create(
             name="Project 2",
             description="Description 2",
-            reference_data_type="product_catalog",
             created_by=self.user
         )
 
diff --git a/backend/lookup/tests/test_api/test_project_api.py b/backend/lookup/tests/test_api/test_project_api.py
index f384d23f92..0213a9a83e 100644
--- a/backend/lookup/tests/test_api/test_project_api.py
+++ b/backend/lookup/tests/test_api/test_project_api.py
@@ -41,7 +41,6 @@ def setUp(self):
         self.project = LookupProject.objects.create(
             name="Test Project",
             description="Test Description",
-            reference_data_type="vendor_catalog",
             template=self.template,
             created_by=self.user
         )
@@ -61,7 +60,6 @@ def test_create_project(self):
         data = {
             'name': 'New Project',
             'description': 'New Description',
-            'reference_data_type': 'product_catalog',
             'template_id': str(self.template.id),
             'is_active': True
         }
@@ -87,7 +85,6 @@ def test_update_project(self):
         data = {
             'name': 'Updated Project',
             'description': 'Updated Description',
-            'reference_data_type': self.project.reference_data_type,
             'is_active': False
         }
 
@@ -152,7 +149,6 @@ def test_filter_projects_by_active_status(self):
         LookupProject.objects.create(
             name="Inactive Project",
             description="Inactive",
-            reference_data_type="vendor_catalog",
             is_active=False,
             created_by=self.user
         )
diff --git a/frontend/src/components/lookups/create-project-modal/CreateProjectModal.jsx b/frontend/src/components/lookups/create-project-modal/CreateProjectModal.jsx
index 1fb765b035..4edd19c484 100644
--- a/frontend/src/components/lookups/create-project-modal/CreateProjectModal.jsx
+++ b/frontend/src/components/lookups/create-project-modal/CreateProjectModal.jsx
@@ -1,17 +1,8 @@
-import { Form, Input, Modal, Select } from "antd";
+import { Form, Input, Modal } from "antd";
 import PropTypes from "prop-types";
 
 const { TextArea } = Input;
 
-const REFERENCE_DATA_TYPES = [
-  { value: "vendor_catalog", label: "Vendor Catalog" },
-  { value: "product_catalog", label: "Product Catalog" },
-  { value: "customer_database", label: "Customer Database" },
-  { value: "pricing_data", label: "Pricing Data" },
-  { value: "compliance_rules", label: "Compliance Rules" },
-  { value: "custom", label: "Custom" },
-];
-
 export function CreateProjectModal({ open, onCancel, onCreate }) {
   const [form] = Form.useForm();
 
@@ -67,19 +58,6 @@ export function CreateProjectModal({ open, onCancel, onCreate }) {
             placeholder="Describe the purpose of this Look-Up project..."
           />
         </Form.Item>
-
-        <Form.Item
-          name="reference_data_type"
-          label="Reference Data Type"
-          rules={[
-            { required: true, message: "Please select a reference data type" },
-          ]}
-        >
-          <Select
-            placeholder="Select reference data type"
-            options={REFERENCE_DATA_TYPES}
-          />
-        </Form.Item>
       </Form>
     </Modal>
   );
diff --git a/frontend/src/components/lookups/execution-history-tab/ExecutionHistoryTab.jsx b/frontend/src/components/lookups/execution-history-tab/ExecutionHistoryTab.jsx
index 0acbf0902f..23a3bd1617 100644
--- a/frontend/src/components/lookups/execution-history-tab/ExecutionHistoryTab.jsx
+++ b/frontend/src/components/lookups/execution-history-tab/ExecutionHistoryTab.jsx
@@ -53,7 +53,9 @@ export function ExecutionHistoryTab({ project }) {
           params: { lookup_project_id: project.id },
         }
       );
-      setExecutions(response.data.results || []);
+      // Handle both paginated (results array) and non-paginated (direct array) responses
+      const data = response.data.results || response.data || [];
+      setExecutions(Array.isArray(data) ? data : []);
     } catch (error) {
       setAlertDetails({
         type: "error",
diff --git a/frontend/src/components/lookups/project-detail/LookUpProjectDetail.jsx b/frontend/src/components/lookups/project-detail/LookUpProjectDetail.jsx
index c347991d0b..2d68472fc0 100644
--- a/frontend/src/components/lookups/project-detail/LookUpProjectDetail.jsx
+++ b/frontend/src/components/lookups/project-detail/LookUpProjectDetail.jsx
@@ -11,7 +11,6 @@ import {
   Modal,
   Form,
   Input,
-  Select,
   Popconfirm,
 } from "antd";
 import {
@@ -34,15 +33,6 @@ import "./LookUpProjectDetail.css";
 const { Title } = Typography;
 const { TextArea } = Input;
 
-const REFERENCE_DATA_TYPES = [
-  { value: "vendor_catalog", label: "Vendor Catalog" },
-  { value: "product_catalog", label: "Product Catalog" },
-  { value: "customer_database", label: "Customer Database" },
-  { value: "pricing_data", label: "Pricing Data" },
-  { value: "compliance_rules", label: "Compliance Rules" },
-  { value: "custom", label: "Custom" },
-];
-
 export function LookUpProjectDetail() {
   const [project, setProject] = useState(null);
   const [loading, setLoading] = useState(true);
@@ -84,7 +74,6 @@ export function LookUpProjectDetail() {
     form.setFieldsValue({
       name: project.name,
       description: project.description || "",
-      reference_data_type: project.reference_data_type,
     });
     setEditModalOpen(true);
   };
@@ -227,9 +216,6 @@ export function LookUpProjectDetail() {
             <Tag color={project.is_active ? "green" : "orange"}>
               {project.is_active ? "Active" : "Inactive"}
             </Tag>
-            <Tag color="blue">
-              {project.reference_data_type?.replace(/_/g, " ").toUpperCase()}
-            </Tag>
             <Button icon={<EditOutlined />} onClick={handleOpenEditModal}>
               Edit
             </Button>
@@ -295,22 +281,6 @@ export function LookUpProjectDetail() {
               placeholder="Describe the purpose of this Look-Up project..."
             />
           </Form.Item>
-
-          <Form.Item
-            name="reference_data_type"
-            label="Reference Data Type"
-            rules={[
-              {
-                required: true,
-                message: "Please select a reference data type",
-              },
-            ]}
-          >
-            <Select
-              placeholder="Select reference data type"
-              options={REFERENCE_DATA_TYPES}
-            />
-          </Form.Item>
         </Form>
       </Modal>
     </div>
diff --git a/frontend/src/components/lookups/project-list/LookUpProjectList.jsx b/frontend/src/components/lookups/project-list/LookUpProjectList.jsx
index 0e99f37b0d..63d0f43e20 100644
--- a/frontend/src/components/lookups/project-list/LookUpProjectList.jsx
+++ b/frontend/src/components/lookups/project-list/LookUpProjectList.jsx
@@ -140,14 +140,6 @@ export function LookUpProjectList() {
         </Button>
       ),
     },
-    {
-      title: "Type",
-      dataIndex: "reference_data_type",
-      key: "reference_data_type",
-      render: (type) => (
-        <Tag color="blue">{type?.replace(/_/g, " ").toUpperCase()}</Tag>
-      ),
-    },
     {
       title: "Data Sources",
       dataIndex: "data_source_count",
diff --git a/frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.jsx b/frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.jsx
index af82f57fad..5d7970bac7 100644
--- a/frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.jsx
+++ b/frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.jsx
@@ -3,7 +3,6 @@ import PropTypes from "prop-types";
 import {
   Table,
   Button,
-  Upload,
   Space,
   Tag,
   Typography,
@@ -20,6 +19,7 @@ import {
   CloseCircleOutlined,
   LoadingOutlined,
   DatabaseOutlined,
+  InboxOutlined,
 } from "@ant-design/icons";
 
 import { useAxiosPrivate } from "../../../hooks/useAxiosPrivate";
@@ -28,7 +28,6 @@ import { useSessionStore } from "../../../store/session-store";
 import "./ReferenceDataTab.css";
 
 const { Title, Text } = Typography;
-const { Dragger } = Upload;
 
 export function ReferenceDataTab({ project, onUpdate }) {
   const [dataSources, setDataSources] = useState([]);
@@ -36,6 +35,7 @@ export function ReferenceDataTab({ project, onUpdate }) {
   const [uploadModalOpen, setUploadModalOpen] = useState(false);
   const [uploading, setUploading] = useState(false);
   const [indexing, setIndexing] = useState(false);
+  const [isDragging, setIsDragging] = useState(false);
 
   const axiosPrivate = useAxiosPrivate();
   const { setAlertDetails } = useAlertStore();
@@ -63,6 +63,8 @@ export function ReferenceDataTab({ project, onUpdate }) {
   };
 
   const handleUpload = async (file) => {
+    if (!file) return;
+
     setUploading(true);
     const formData = new FormData();
     formData.append("file", file);
@@ -96,8 +98,42 @@ export function ReferenceDataTab({ project, onUpdate }) {
     } finally {
       setUploading(false);
     }
+  };
+
+  const handleFileInputChange = (event) => {
+    const file = event.target.files?.[0];
+    if (file) {
+      handleUpload(file);
+    }
+    // Reset input so same file can be selected again
+    event.target.value = "";
+  };
+
+  const handleDragOver = (event) => {
+    event.preventDefault();
+    event.stopPropagation();
+    if (!uploading) {
+      setIsDragging(true);
+    }
+  };
 
-    return false; // Prevent default upload
+  const handleDragLeave = (event) => {
+    event.preventDefault();
+    event.stopPropagation();
+    setIsDragging(false);
+  };
+
+  const handleDrop = (event) => {
+    event.preventDefault();
+    event.stopPropagation();
+    setIsDragging(false);
+
+    if (uploading) return;
+
+    const file = event.dataTransfer?.files?.[0];
+    if (file) {
+      handleUpload(file);
+    }
   };
 
   const handleDelete = async (dataSourceId) => {
@@ -280,7 +316,11 @@ export function ReferenceDataTab({ project, onUpdate }) {
           <Button
             type="primary"
             icon={<UploadOutlined />}
-            onClick={() => setUploadModalOpen(true)}
+            onClick={() => {
+              setUploading(false);
+              setIsDragging(false);
+              setUploadModalOpen(true);
+            }}
           >
             Upload Data
           </Button>
@@ -301,19 +341,35 @@ export function ReferenceDataTab({ project, onUpdate }) {
       <Modal
         title="Upload Reference Data"
         open={uploadModalOpen}
-        onCancel={() => setUploadModalOpen(false)}
+        onCancel={() => {
+          setUploadModalOpen(false);
+          setUploading(false);
+          setIsDragging(false);
+        }}
         footer={null}
         width={600}
+        destroyOnClose
       >
-        <Dragger
-          name="file"
-          multiple={false}
-          beforeUpload={handleUpload}
-          disabled={uploading}
+        <input
+          type="file"
+          id="reference-data-file-input"
+          onChange={handleFileInputChange}
           accept=".csv,.json,.txt,.pdf,.xlsx,.xls,.docx,.doc"
+          style={{ display: "none" }}
+          disabled={uploading}
+        />
+        <label
+          htmlFor="reference-data-file-input"
+          className={`upload-dragger ${isDragging ? "dragging" : ""} ${
+            uploading ? "disabled" : ""
+          }`}
+          onDragOver={handleDragOver}
+          onDragLeave={handleDragLeave}
+          onDrop={handleDrop}
+          style={{ display: "block" }}
         >
           <p className="ant-upload-drag-icon">
-            <UploadOutlined />
+            <InboxOutlined />
           </p>
           <p className="ant-upload-text">
             Click or drag file to this area to upload
@@ -322,7 +378,7 @@ export function ReferenceDataTab({ project, onUpdate }) {
             Support for CSV, JSON, TXT, PDF, Excel, and Word documents. Files
             will be processed for text extraction automatically.
           </p>
-        </Dragger>
+        </label>
         {uploading && (
           <div style={{ marginTop: 16 }}>
             <Progress percent={50} status="active" />

From bd4f07c199d18d0fd96a08ce7bb0928b60634565 Mon Sep 17 00:00:00 2001
From: gayathrivijayakumar <gayathri@zipstack.com>
Date: Thu, 8 Jan 2026 21:33:08 +0530
Subject: [PATCH 05/22] API returning lookedup data

---
 .../migrations/0003_add_file_execution_id.py  |  28 ++
 .../0004_fix_file_paths_for_minio.py          |  70 ++++
 .../lookup/models/lookup_execution_audit.py   |   6 +
 backend/lookup/services/audit_logger.py       |   3 +
 .../lookup/services/workflow_integration.py   | 349 ++++++++++++++++++
 backend/lookup/views.py                       |  33 +-
 .../output_manager_helper.py                  |  16 +-
 .../workflow_v2/file_execution_tasks.py       |  70 ++++
 .../reference-data-tab/ReferenceDataTab.css   |  45 +++
 9 files changed, 609 insertions(+), 11 deletions(-)
 create mode 100644 backend/lookup/migrations/0003_add_file_execution_id.py
 create mode 100644 backend/lookup/migrations/0004_fix_file_paths_for_minio.py
 create mode 100644 backend/lookup/services/workflow_integration.py

diff --git a/backend/lookup/migrations/0003_add_file_execution_id.py b/backend/lookup/migrations/0003_add_file_execution_id.py
new file mode 100644
index 0000000000..363b109fbd
--- /dev/null
+++ b/backend/lookup/migrations/0003_add_file_execution_id.py
@@ -0,0 +1,28 @@
+# Generated manually for adding file_execution_id to LookupExecutionAudit
+
+from django.db import migrations, models
+
+
+class Migration(migrations.Migration):
+    dependencies = [
+        ("lookup", "0002_remove_reference_data_type"),
+    ]
+
+    operations = [
+        migrations.AddField(
+            model_name="lookupexecutionaudit",
+            name="file_execution_id",
+            field=models.UUIDField(
+                blank=True,
+                help_text="Workflow file execution ID for tracking in API/ETL pipelines",
+                null=True,
+            ),
+        ),
+        migrations.AddIndex(
+            model_name="lookupexecutionaudit",
+            index=models.Index(
+                fields=["file_execution_id"],
+                name="lookup_exec_file_ex_idx",
+            ),
+        ),
+    ]
diff --git a/backend/lookup/migrations/0004_fix_file_paths_for_minio.py b/backend/lookup/migrations/0004_fix_file_paths_for_minio.py
new file mode 100644
index 0000000000..db1c4ee0ca
--- /dev/null
+++ b/backend/lookup/migrations/0004_fix_file_paths_for_minio.py
@@ -0,0 +1,70 @@
+"""Migration to fix file paths for MinIO storage.
+
+This migration converts local filesystem paths to MinIO-compatible paths
+for existing LookupDataSource records.
+
+Old format: /app/prompt-studio-data/{org_id}/{project_id}/{filename}
+New format: unstract/prompt-studio-data/{org_id}/{project_id}/{filename}
+"""
+
+from django.db import migrations
+
+
+def fix_file_paths(apps, schema_editor):
+    """Convert local paths to MinIO paths."""
+    LookupDataSource = apps.get_model("lookup", "LookupDataSource")
+
+    # Define path mappings
+    old_prefix = "/app/prompt-studio-data/"
+    new_prefix = "unstract/prompt-studio-data/"
+
+    # Update file_path
+    updated_count = 0
+    for data_source in LookupDataSource.objects.filter(file_path__startswith=old_prefix):
+        data_source.file_path = data_source.file_path.replace(old_prefix, new_prefix, 1)
+
+        # Also fix extracted_content_path if it exists
+        if (
+            data_source.extracted_content_path
+            and data_source.extracted_content_path.startswith(old_prefix)
+        ):
+            data_source.extracted_content_path = (
+                data_source.extracted_content_path.replace(old_prefix, new_prefix, 1)
+            )
+
+        data_source.save(update_fields=["file_path", "extracted_content_path"])
+        updated_count += 1
+
+    if updated_count > 0:
+        print(f"  Updated {updated_count} LookupDataSource records with corrected paths")
+
+
+def reverse_file_paths(apps, schema_editor):
+    """Revert MinIO paths back to local paths."""
+    LookupDataSource = apps.get_model("lookup", "LookupDataSource")
+
+    old_prefix = "unstract/prompt-studio-data/"
+    new_prefix = "/app/prompt-studio-data/"
+
+    for data_source in LookupDataSource.objects.filter(file_path__startswith=old_prefix):
+        data_source.file_path = data_source.file_path.replace(old_prefix, new_prefix, 1)
+
+        if (
+            data_source.extracted_content_path
+            and data_source.extracted_content_path.startswith(old_prefix)
+        ):
+            data_source.extracted_content_path = (
+                data_source.extracted_content_path.replace(old_prefix, new_prefix, 1)
+            )
+
+        data_source.save(update_fields=["file_path", "extracted_content_path"])
+
+
+class Migration(migrations.Migration):
+    dependencies = [
+        ("lookup", "0003_add_file_execution_id"),
+    ]
+
+    operations = [
+        migrations.RunPython(fix_file_paths, reverse_file_paths),
+    ]
diff --git a/backend/lookup/models/lookup_execution_audit.py b/backend/lookup/models/lookup_execution_audit.py
index 6bda095155..585766dcd3 100644
--- a/backend/lookup/models/lookup_execution_audit.py
+++ b/backend/lookup/models/lookup_execution_audit.py
@@ -34,6 +34,11 @@ class LookupExecutionAudit(models.Model):
     execution_id = models.UUIDField(
         help_text="Groups all Look-Ups in a single execution batch"
     )
+    file_execution_id = models.UUIDField(
+        null=True,
+        blank=True,
+        help_text="Workflow file execution ID for tracking in API/ETL pipelines",
+    )
 
     # Input/Output
     input_data = models.JSONField(help_text="Input data from Prompt Studio extraction")
@@ -92,6 +97,7 @@ class Meta:
         indexes = [
             models.Index(fields=["lookup_project"]),
             models.Index(fields=["execution_id"]),
+            models.Index(fields=["file_execution_id"]),
             models.Index(fields=["executed_at"]),
             models.Index(fields=["status"]),
         ]
diff --git a/backend/lookup/services/audit_logger.py b/backend/lookup/services/audit_logger.py
index 3259e4c1d6..d8abbe9e76 100644
--- a/backend/lookup/services/audit_logger.py
+++ b/backend/lookup/services/audit_logger.py
@@ -40,6 +40,7 @@ def log_execution(
         llm_call_time_ms: int | None = None,
         llm_response_cached: bool = False,
         error_message: str | None = None,
+        file_execution_id: UUID | None = None,
     ) -> LookupExecutionAudit | None:
         """Log execution to database.
 
@@ -63,6 +64,7 @@ def log_execution(
             llm_call_time_ms: Time spent calling LLM in milliseconds
             llm_response_cached: Whether response was from cache
             error_message: Error message if execution failed
+            file_execution_id: Optional workflow file execution ID for tracking
 
         Returns:
             Created LookupExecutionAudit instance or None if logging fails
@@ -93,6 +95,7 @@ def log_execution(
                 lookup_project=lookup_project,
                 prompt_studio_project_id=prompt_studio_project_id,
                 execution_id=execution_id,
+                file_execution_id=file_execution_id,
                 input_data=input_data,
                 reference_data_version=reference_data_version,
                 enriched_output=enriched_output,
diff --git a/backend/lookup/services/workflow_integration.py b/backend/lookup/services/workflow_integration.py
new file mode 100644
index 0000000000..6830f9a726
--- /dev/null
+++ b/backend/lookup/services/workflow_integration.py
@@ -0,0 +1,349 @@
+"""Service for integrating Look-up enrichment with workflow execution.
+
+This module provides Look-up enrichment for API/ETL/Workflow execution paths,
+which are separate from the Prompt Studio UI path. It hooks into the
+FileExecutionTasks pipeline to enrich extraction results before they are
+sent to the destination.
+"""
+
+import logging
+import uuid
+from typing import Any
+
+from django.core.exceptions import ObjectDoesNotExist
+
+logger = logging.getLogger(__name__)
+
+
+class LookupWorkflowIntegration:
+    """Service for integrating Look-up enrichment with workflow execution.
+
+    This service bridges the gap between workflow execution (API/ETL) and
+    the Look-up enrichment system. In Prompt Studio UI, enrichment is handled
+    by OutputManagerHelper._try_lookup_enrichment(). For workflows, this
+    service provides equivalent functionality.
+
+    The integration works by:
+    1. Getting the Prompt Studio project ID from the workflow's tool instance
+    2. Checking if any Look-up projects are linked to that PS project
+    3. Executing the Look-up enrichment if links exist
+    4. Merging the enrichment data with the extraction results
+    """
+
+    @staticmethod
+    def get_prompt_studio_project_id(tool_instance_id: str) -> str | None:
+        """Get the Prompt Studio project ID from a tool instance.
+
+        The tool instance's tool_id is the PromptStudioRegistry's
+        prompt_registry_id. The registry has a custom_tool FK to CustomTool,
+        which is the actual Prompt Studio project.
+
+        Args:
+            tool_instance_id: UUID of the ToolInstance
+
+        Returns:
+            Prompt Studio project (CustomTool) UUID as string, or None if not found
+        """
+        from prompt_studio.prompt_studio_registry_v2.models import PromptStudioRegistry
+        from tool_instance_v2.models import ToolInstance
+
+        try:
+            tool_instance = ToolInstance.objects.get(id=tool_instance_id)
+            tool_id = tool_instance.tool_id
+
+            # Check if this is a Prompt Studio exported tool
+            try:
+                registry = PromptStudioRegistry.objects.get(prompt_registry_id=tool_id)
+                if registry.custom_tool:
+                    return str(registry.custom_tool.tool_id)
+            except (ObjectDoesNotExist, ValueError):
+                # Not a Prompt Studio tool, or invalid UUID
+                logger.debug(f"Tool {tool_id} is not a Prompt Studio exported tool")
+                return None
+
+        except ObjectDoesNotExist:
+            logger.warning(f"ToolInstance {tool_instance_id} not found")
+            return None
+        except Exception as e:
+            logger.error(f"Error getting PS project ID: {e}")
+            return None
+
+        return None
+
+    @staticmethod
+    def get_prompt_studio_project_id_from_workflow(workflow_id: str) -> str | None:
+        """Get the Prompt Studio project ID from a workflow's tool instances.
+
+        Searches through the workflow's tool instances to find one that is
+        a Prompt Studio exported tool.
+
+        Args:
+            workflow_id: UUID of the Workflow
+
+        Returns:
+            Prompt Studio project (CustomTool) UUID as string, or None if not found
+        """
+        from prompt_studio.prompt_studio_registry_v2.models import PromptStudioRegistry
+        from tool_instance_v2.constants import ToolInstanceKey
+        from tool_instance_v2.tool_instance_helper import ToolInstanceHelper
+
+        try:
+            tool_instances = ToolInstanceHelper.get_tool_instances_by_workflow(
+                workflow_id, ToolInstanceKey.STEP
+            )
+
+            for tool_instance in tool_instances:
+                tool_id = tool_instance.tool_id
+
+                # Check if this is a Prompt Studio exported tool
+                try:
+                    registry = PromptStudioRegistry.objects.get(
+                        prompt_registry_id=tool_id
+                    )
+                    if registry.custom_tool:
+                        logger.debug(
+                            f"Found PS project {registry.custom_tool.tool_id} "
+                            f"for workflow {workflow_id}"
+                        )
+                        return str(registry.custom_tool.tool_id)
+                except (ObjectDoesNotExist, ValueError):
+                    # Not a Prompt Studio tool, continue to next
+                    continue
+
+            logger.debug(f"No Prompt Studio tool found in workflow {workflow_id}")
+            return None
+
+        except Exception as e:
+            logger.error(f"Error getting PS project ID from workflow {workflow_id}: {e}")
+            return None
+
+    @staticmethod
+    def has_lookup_links(prompt_studio_project_id: str) -> bool:
+        """Check if a Prompt Studio project has any Look-up links.
+
+        Args:
+            prompt_studio_project_id: UUID of the Prompt Studio project
+
+        Returns:
+            True if Look-up links exist, False otherwise
+        """
+        from lookup.models import PromptStudioLookupLink
+
+        try:
+            return PromptStudioLookupLink.objects.filter(
+                prompt_studio_project_id=prompt_studio_project_id
+            ).exists()
+        except Exception as e:
+            logger.error(f"Error checking Look-up links: {e}")
+            return False
+
+    @staticmethod
+    def enrich_workflow_output(
+        workflow_id: str,
+        extracted_data: dict[str, Any],
+        file_execution_id: str | None = None,
+        execution_id: str | None = None,
+    ) -> dict[str, Any]:
+        """Execute Look-up enrichment for workflow execution output.
+
+        This method is the main entry point for workflow-based Look-up
+        enrichment. It:
+        1. Finds the Prompt Studio project from the workflow
+        2. Checks for Look-up links
+        3. Executes enrichment via LookupIntegrationService
+        4. Returns the enrichment result
+
+        Args:
+            workflow_id: UUID of the workflow
+            extracted_data: Dict of extracted field values from the tool
+            file_execution_id: Optional file execution ID for tracking
+            execution_id: Optional workflow execution ID for tracking
+
+        Returns:
+            Dict with 'lookup_enrichment' and '_lookup_metadata' keys,
+            or empty dict if no enrichment was performed.
+        """
+        from lookup.services.lookup_integration_service import LookupIntegrationService
+
+        if not extracted_data:
+            logger.debug("No extracted data provided for workflow enrichment")
+            return {}
+
+        # Get the Prompt Studio project ID from the workflow
+        ps_project_id = (
+            LookupWorkflowIntegration.get_prompt_studio_project_id_from_workflow(
+                workflow_id
+            )
+        )
+
+        if not ps_project_id:
+            logger.debug(f"No Prompt Studio project found for workflow {workflow_id}")
+            return {}
+
+        # Check if there are any Look-up links
+        if not LookupWorkflowIntegration.has_lookup_links(ps_project_id):
+            logger.debug(f"No Look-up links for PS project {ps_project_id}")
+            return {}
+
+        # Generate a run ID for tracking
+        run_id = file_execution_id or execution_id or str(uuid.uuid4())
+
+        logger.info(
+            f"Executing Look-up enrichment for workflow {workflow_id}, "
+            f"PS project {ps_project_id}, run_id {run_id}"
+        )
+
+        # Delegate to the existing LookupIntegrationService
+        return LookupIntegrationService.enrich_if_linked(
+            prompt_studio_project_id=ps_project_id,
+            extracted_data=extracted_data,
+            run_id=run_id,
+        )
+
+    @staticmethod
+    def merge_enrichment_with_output(
+        original_output: dict[str, Any] | str | None,
+        enrichment_result: dict[str, Any],
+    ) -> dict[str, Any] | str | None:
+        """Merge Look-up enrichment data with the original tool output.
+
+        The enrichment values REPLACE the corresponding fields in the original
+        output. For example, if original has {"vendor_name": "Amzn Inc"} and
+        enrichment has {"vendor_name": "AWS"}, the result will have
+        {"vendor_name": "AWS"}.
+
+        Args:
+            original_output: Original tool output (dict, string, or None)
+            enrichment_result: Result from enrich_workflow_output()
+
+        Returns:
+            Merged output with enrichment values replacing original fields
+        """
+        if not enrichment_result:
+            return original_output
+
+        lookup_enrichment = enrichment_result.get("lookup_enrichment", {})
+        lookup_metadata = enrichment_result.get("_lookup_metadata", {})
+
+        if not lookup_enrichment:
+            return original_output
+
+        # If original output is a string, try to parse it as JSON
+        if isinstance(original_output, str):
+            import json
+
+            try:
+                output_dict = json.loads(original_output)
+            except json.JSONDecodeError:
+                # Can't merge with non-JSON string, add enrichment as separate key
+                return {
+                    "extracted_data": original_output,
+                    "lookup_enrichment": lookup_enrichment,
+                    "_lookup_metadata": lookup_metadata,
+                }
+        elif isinstance(original_output, dict):
+            output_dict = original_output.copy()
+        elif original_output is None:
+            output_dict = {}
+        else:
+            # Unknown type, wrap it
+            output_dict = {"extracted_data": original_output}
+
+        # REPLACE original field values with enriched values
+        # This overwrites the original extracted values with the canonicalized ones
+        #
+        # Tool output structure is typically:
+        # {"workflow_id": "...", "elapsed_time": ..., "output": {"vendor_name": "..."}}
+        # We need to replace values INSIDE the "output" dict if it exists
+        if "output" in output_dict and isinstance(output_dict["output"], dict):
+            # Tool wrapped output - replace inside the "output" key
+            for field_name, enriched_value in lookup_enrichment.items():
+                if enriched_value is not None and field_name in output_dict["output"]:
+                    logger.info(
+                        f"Replacing output[{field_name}]: "
+                        f"'{output_dict['output'].get(field_name)}' -> '{enriched_value}'"
+                    )
+                    output_dict["output"][field_name] = enriched_value
+        else:
+            # Flat structure - replace at root level
+            for field_name, enriched_value in lookup_enrichment.items():
+                if enriched_value is not None:
+                    logger.info(
+                        f"Replacing {field_name}: "
+                        f"'{output_dict.get(field_name)}' -> '{enriched_value}'"
+                    )
+                    output_dict[field_name] = enriched_value
+
+        # Add metadata for tracking (but not the separate lookup_enrichment key)
+        output_dict["_lookup_metadata"] = lookup_metadata
+
+        return output_dict
+
+    @staticmethod
+    def process_workflow_enrichment(
+        workflow_id: str,
+        original_output: dict[str, Any] | str | None,
+        file_execution_id: str | None = None,
+        execution_id: str | None = None,
+    ) -> tuple[dict[str, Any] | str | None, bool]:
+        """Complete Look-up enrichment process for workflow output.
+
+        This is a convenience method that combines enrich_workflow_output()
+        and merge_enrichment_with_output() into a single call.
+
+        Args:
+            workflow_id: UUID of the workflow
+            original_output: Original tool output
+            file_execution_id: Optional file execution ID
+            execution_id: Optional workflow execution ID
+
+        Returns:
+            Tuple of (enriched_output, was_enriched)
+        """
+        # Extract data for enrichment - handle different output formats
+        if isinstance(original_output, dict):
+            extracted_data = original_output
+        elif isinstance(original_output, str):
+            import json
+
+            try:
+                extracted_data = json.loads(original_output)
+            except json.JSONDecodeError:
+                logger.debug("Cannot enrich non-JSON string output")
+                return original_output, False
+        else:
+            logger.debug(f"Cannot enrich output of type {type(original_output)}")
+            return original_output, False
+
+        # Tool output structure is typically:
+        # {"workflow_id": "...", "elapsed_time": ..., "output": {"vendor_name": "..."}}
+        # We need to extract the "output" dict for enrichment if it exists
+        if "output" in extracted_data and isinstance(extracted_data["output"], dict):
+            data_for_enrichment = extracted_data["output"]
+            logger.debug(
+                f"Extracted 'output' key for enrichment: {list(data_for_enrichment.keys())}"
+            )
+        else:
+            data_for_enrichment = extracted_data
+            logger.debug(
+                f"Using flat structure for enrichment: {list(data_for_enrichment.keys())}"
+            )
+
+        # Perform enrichment using the actual extraction data
+        enrichment_result = LookupWorkflowIntegration.enrich_workflow_output(
+            workflow_id=workflow_id,
+            extracted_data=data_for_enrichment,
+            file_execution_id=file_execution_id,
+            execution_id=execution_id,
+        )
+
+        if not enrichment_result or not enrichment_result.get("lookup_enrichment"):
+            return original_output, False
+
+        # Merge results
+        enriched_output = LookupWorkflowIntegration.merge_enrichment_with_output(
+            original_output=original_output,
+            enrichment_result=enrichment_result,
+        )
+
+        return enriched_output, True
diff --git a/backend/lookup/views.py b/backend/lookup/views.py
index 8165684ba1..6d63cee7fe 100644
--- a/backend/lookup/views.py
+++ b/backend/lookup/views.py
@@ -171,7 +171,6 @@ def upload_reference_data(self, request, pk=None):
         extract_text = upload_serializer.validated_data["extract_text"]
 
         try:
-            from django.conf import settings
             from utils.file_storage.constants import FileStorageKeys
 
             from unstract.sdk1.file_storage.constants import StorageType
@@ -194,23 +193,39 @@ def upload_reference_data(self, request, pk=None):
             # Upload file to storage following Prompt Studio's path structure
             # Pattern: {base_path}/{org_id}/{project_id}/{filename}
             # Keep Lookup file storage independent of PS project linkage
+            from utils.file_storage.constants import FileStorageConstants
             from utils.user_context import UserContext
 
+            from unstract.core.utilities import UnstractUtils
+
             org_id = UserContext.get_organization_identifier()
-            base_path = settings.PROMPT_STUDIO_FILE_PATH
+            # Use REMOTE path for MinIO storage, not local filesystem path
+            base_path = UnstractUtils.get_env(
+                env_key=FileStorageConstants.REMOTE_PROMPT_STUDIO_FILE_PATH
+            )
 
             # Store files under Lookup project ID, not PS tool ID
-            # This ensures files remain accessible regardless of PS linkage changes
+            # This ensures files remains accessible regardless of PS linkage changes
             file_path = f"{base_path}/{org_id}/{project.id}/{file.name}"
 
+            # Debug logging
+            logger.info(
+                f"Upload debug: org_id={org_id}, base_path={base_path}, "
+                f"file_path={file_path}, file.name={file.name}, file.size={file.size}"
+            )
+
             # Create parent directories if they don't exist
             fs_instance.mkdir(f"{base_path}/{org_id}/{project.id}", create_parents=True)
             fs_instance.mkdir(
                 f"{base_path}/{org_id}/{project.id}/extract", create_parents=True
             )
 
-            # Upload the file
-            fs_instance.write(path=file_path, mode="wb", data=file.read())
+            # Upload the file - reset file position and handle bytes/file object
+            # Following Prompt Studio's pattern for reliable file upload
+            file.seek(0)  # Reset file position in case it was read during validation
+            file_data = file.read()
+            logger.info(f"File data read: {len(file_data)} bytes")
+            fs_instance.write(path=file_path, mode="wb", data=file_data)
 
             logger.info(f"Uploaded file to storage: {file_path}")
 
@@ -228,10 +243,12 @@ def upload_reference_data(self, request, pk=None):
             serializer = LookupDataSourceSerializer(data_source)
             return Response(serializer.data, status=status.HTTP_201_CREATED)
 
-        except Exception:
-            logger.exception(f"Error uploading reference data for project {project.id}")
+        except Exception as e:
+            logger.exception(
+                f"Error uploading reference data for project {project.id}: {e}"
+            )
             return Response(
-                {"error": "Failed to upload reference data"},
+                {"error": f"Failed to upload file: {str(e)}"},
                 status=status.HTTP_500_INTERNAL_SERVER_ERROR,
             )
 
diff --git a/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py b/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
index e1bac4e219..4f02b20726 100644
--- a/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
+++ b/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
@@ -262,17 +262,27 @@ def update_or_create_prompt_output(
             )
             logger.info(f"Lookup enrichment result: {lookup_result}")
 
-            # Add enrichment data to each serialized result
+            # Replace output values with enriched values where applicable
             if lookup_result:
                 lookup_enrichment = lookup_result.get("lookup_enrichment", {})
                 lookup_metadata = lookup_result.get("_lookup_metadata", {})
                 logger.info(
-                    f"Adding lookup_enrichment={lookup_enrichment} "
+                    f"Applying lookup_enrichment={lookup_enrichment} "
                     f"to {len(serialized_data)} items"
                 )
 
                 for item in serialized_data:
-                    item["lookup_enrichment"] = lookup_enrichment
+                    prompt_key = item.get("prompt_key")
+                    # If this prompt's field was enriched, replace the output value
+                    if prompt_key and prompt_key in lookup_enrichment:
+                        enriched_value = lookup_enrichment[prompt_key]
+                        if enriched_value is not None:
+                            logger.info(
+                                f"Replacing {prompt_key} output: "
+                                f"'{item.get('output')}' -> '{enriched_value}'"
+                            )
+                            item["output"] = enriched_value
+                    # Add metadata for tracking
                     item["_lookup_metadata"] = lookup_metadata
 
         return serialized_data
diff --git a/backend/workflow_manager/workflow_v2/file_execution_tasks.py b/backend/workflow_manager/workflow_v2/file_execution_tasks.py
index a9b3ab8717..be80604717 100644
--- a/backend/workflow_manager/workflow_v2/file_execution_tasks.py
+++ b/backend/workflow_manager/workflow_v2/file_execution_tasks.py
@@ -1033,6 +1033,14 @@ def _process_final_output(
                 error=processing_error,
             )
 
+            # Execute Look-up enrichment if configured and no processing error
+            if output_result and not processing_error:
+                output_result = cls._try_lookup_enrichment(
+                    workflow=workflow,
+                    output_result=output_result,
+                    file_execution_id=file_execution_id,
+                )
+
             if destination.is_api:
                 execution_metadata = destination.get_metadata(file_history)
             if cls._should_create_file_history(
@@ -1058,6 +1066,68 @@ def _process_final_output(
             output=output_result, metadata=execution_metadata, error=None
         )
 
+    @classmethod
+    def _try_lookup_enrichment(
+        cls,
+        workflow: Workflow,
+        output_result: str | None,
+        file_execution_id: str,
+    ) -> str | None:
+        """Attempt Look-up enrichment for the extraction output.
+
+        This method integrates with the Look-up system to enrich extracted
+        data with reference data matching. It gracefully degrades if
+        Look-up is not configured or fails.
+
+        Args:
+            workflow: The workflow being executed
+            output_result: The extraction result from the tool
+            file_execution_id: File execution ID for tracking
+
+        Returns:
+            Enriched output result if Look-up was successful,
+            original output_result otherwise.
+        """
+        if not output_result:
+            return output_result
+
+        try:
+            from lookup.services.workflow_integration import LookupWorkflowIntegration
+
+            enriched_output, was_enriched = (
+                LookupWorkflowIntegration.process_workflow_enrichment(
+                    workflow_id=str(workflow.id),
+                    original_output=output_result,
+                    file_execution_id=file_execution_id,
+                )
+            )
+
+            if was_enriched:
+                logger.info(
+                    f"Look-up enrichment applied for workflow {workflow.id}, "
+                    f"file execution {file_execution_id}"
+                )
+                # Convert back to string if needed for storage
+                if isinstance(enriched_output, dict):
+                    import json
+
+                    return json.dumps(enriched_output)
+                return enriched_output
+
+            return output_result
+
+        except ImportError:
+            # Look-up module not available - gracefully skip
+            logger.debug("Look-up module not available, skipping enrichment")
+            return output_result
+        except Exception as e:
+            # Log error but don't fail the workflow
+            logger.warning(
+                f"Look-up enrichment failed for workflow {workflow.id}, "
+                f"file execution {file_execution_id}: {e}"
+            )
+            return output_result
+
     @classmethod
     def _should_create_file_history(
         cls,
diff --git a/frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.css b/frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.css
index 1780ea6a0b..e42d257dd8 100644
--- a/frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.css
+++ b/frontend/src/components/lookups/reference-data-tab/ReferenceDataTab.css
@@ -15,3 +15,48 @@
   flex-wrap: wrap;
   gap: 12px;
 }
+
+/* Custom upload dragger styles */
+.upload-dragger {
+  padding: 48px 16px;
+  text-align: center;
+  background: #fafafa;
+  border: 1px dashed #d9d9d9;
+  border-radius: 8px;
+  cursor: pointer;
+  transition: all 0.3s ease;
+}
+
+.upload-dragger:hover {
+  border-color: #1890ff;
+}
+
+.upload-dragger.dragging {
+  border-color: #1890ff;
+  background: #e6f7ff;
+}
+
+.upload-dragger.disabled {
+  cursor: not-allowed;
+  opacity: 0.6;
+}
+
+.upload-dragger .ant-upload-drag-icon {
+  margin-bottom: 16px;
+}
+
+.upload-dragger .ant-upload-drag-icon .anticon {
+  font-size: 48px;
+  color: #1890ff;
+}
+
+.upload-dragger .ant-upload-text {
+  margin: 0 0 4px;
+  color: rgba(0, 0, 0, 0.85);
+  font-size: 16px;
+}
+
+.upload-dragger .ant-upload-hint {
+  color: rgba(0, 0, 0, 0.45);
+  font-size: 14px;
+}

From d502f76c2e33432440b4ec014b6db1a129ca7c65 Mon Sep 17 00:00:00 2001
From: gayathrivijayakumar <gayathri@zipstack.com>
Date: Mon, 12 Jan 2026 20:19:19 +0530
Subject: [PATCH 06/22] Log integration

---
 backend/lookup/services/execution_context.py  | 104 ++++
 backend/lookup/services/log_emitter.py        | 379 ++++++++++++
 .../services/lookup_integration_service.py    |  64 +-
 .../lookup/services/lookup_orchestrator.py    |  56 ++
 .../lookup/services/workflow_integration.py   | 556 +++++++++---------
 backend/lookup/views.py                       |  57 ++
 .../output_manager_helper.py                  |  33 +-
 .../workflow_v2/file_execution_tasks.py       |  26 +-
 .../combined-output/CombinedOutput.jsx        |  96 +--
 .../custom-tools/combined-output/JsonView.jsx |  79 +--
 .../combined-output/JsonViewBody.jsx          |  38 --
 .../custom-tools/display-logs/DisplayLogs.css |  57 ++
 .../custom-tools/display-logs/DisplayLogs.jsx |  67 ++-
 .../LookupReplacementIndicator.css            |  74 +++
 .../LookupReplacementIndicator.jsx            |  74 +++
 .../custom-tools/prompt-card/PromptOutput.jsx |  12 +
 .../components/logging/log-modal/LogModal.css |  32 +-
 .../components/logging/log-modal/LogModal.jsx |  33 +-
 frontend/src/hooks/usePromptOutput.js         |   2 +
 .../src/unstract/workflow_execution/enums.py  |   2 +
 20 files changed, 1339 insertions(+), 502 deletions(-)
 create mode 100644 backend/lookup/services/execution_context.py
 create mode 100644 backend/lookup/services/log_emitter.py
 create mode 100644 frontend/src/components/custom-tools/display-logs/DisplayLogs.css
 create mode 100644 frontend/src/components/custom-tools/prompt-card/LookupReplacementIndicator.css
 create mode 100644 frontend/src/components/custom-tools/prompt-card/LookupReplacementIndicator.jsx

diff --git a/backend/lookup/services/execution_context.py b/backend/lookup/services/execution_context.py
new file mode 100644
index 0000000000..e5bcf8da1a
--- /dev/null
+++ b/backend/lookup/services/execution_context.py
@@ -0,0 +1,104 @@
+"""Execution context for Look-up operations.
+
+This module provides a dataclass for managing execution context
+across different execution environments (Prompt Studio vs Workflow).
+"""
+
+from dataclasses import dataclass, field
+from uuid import UUID
+
+
+@dataclass
+class LookupExecutionContext:
+    """Context for Look-up execution supporting both PS and Workflow contexts.
+
+    This dataclass encapsulates all context information needed for Look-up
+    execution, including logging configuration for both real-time WebSocket
+    logs (Prompt Studio) and file-centric logs (ETL/Workflow/API).
+
+    Attributes:
+        organization_id: The tenant organization ID for multi-tenancy
+        prompt_studio_project_id: The Prompt Studio project UUID
+        workflow_execution_id: Workflow execution UUID (for ETL/Workflow/API)
+        file_execution_id: File execution UUID (for file-centric logging)
+        session_id: WebSocket session ID (for real-time Prompt Studio logs)
+        doc_name: Current document name being processed
+        publish_logs: Whether to publish logs (default True)
+        execution_id: Unique execution ID for grouping related Look-ups
+
+    Example:
+        # Prompt Studio context (real-time WebSocket logs)
+        >>> ps_context = LookupExecutionContext(
+        ...     organization_id="org-123",
+        ...     prompt_studio_project_id=UUID("..."),
+        ...     session_id="ws-session-abc",
+        ...     doc_name="invoice.pdf",
+        ... )
+        >>> ps_context.is_prompt_studio_context
+        True
+
+        # Workflow context (file-centric logs)
+        >>> wf_context = LookupExecutionContext(
+        ...     organization_id="org-123",
+        ...     prompt_studio_project_id=UUID("..."),
+        ...     workflow_execution_id=UUID("..."),
+        ...     file_execution_id=UUID("..."),
+        ...     doc_name="invoice.pdf",
+        ... )
+        >>> wf_context.is_workflow_context
+        True
+    """
+
+    # Required fields
+    organization_id: str
+    prompt_studio_project_id: UUID
+
+    # Optional - for file-centric logging (ETL/Workflow/API)
+    workflow_execution_id: UUID | None = None
+    file_execution_id: UUID | None = None
+
+    # Optional - for real-time logging (Prompt Studio)
+    session_id: str | None = None
+    doc_name: str | None = None
+
+    # Logging control
+    publish_logs: bool = True
+
+    # Execution tracking
+    execution_id: str | None = field(default=None)
+
+    @property
+    def is_workflow_context(self) -> bool:
+        """Check if executing within a workflow context (ETL/Workflow/API).
+
+        Returns:
+            True if file_execution_id is set, indicating workflow execution.
+        """
+        return self.file_execution_id is not None
+
+    @property
+    def is_prompt_studio_context(self) -> bool:
+        """Check if executing within Prompt Studio IDE (real-time logs).
+
+        Returns:
+            True if session_id is set and NOT in workflow context.
+        """
+        return self.session_id is not None and not self.is_workflow_context
+
+    @property
+    def should_emit_websocket_logs(self) -> bool:
+        """Check if WebSocket logs should be emitted.
+
+        Returns:
+            True if in Prompt Studio context and logging is enabled.
+        """
+        return self.publish_logs and self.is_prompt_studio_context
+
+    @property
+    def should_persist_execution_logs(self) -> bool:
+        """Check if execution logs should be persisted to database.
+
+        Returns:
+            True if in workflow context and logging is enabled.
+        """
+        return self.publish_logs and self.is_workflow_context
diff --git a/backend/lookup/services/log_emitter.py b/backend/lookup/services/log_emitter.py
new file mode 100644
index 0000000000..2fc9fd4551
--- /dev/null
+++ b/backend/lookup/services/log_emitter.py
@@ -0,0 +1,379 @@
+"""Look-up Log Emitter for WebSocket and file-centric logging.
+
+This module provides functionality to emit Look-up execution logs
+via WebSocket for real-time display in Prompt Studio and to persist
+logs for file-centric logging in ETL/Workflow/API executions.
+"""
+
+import logging
+import time
+from typing import Any
+from uuid import UUID
+
+from unstract.core.pubsub_helper import LogPublisher
+from unstract.workflow_execution.enums import LogLevel, LogStage
+
+logger = logging.getLogger(__name__)
+
+
+class LookupLogEmitter:
+    """Emits Lookup enrichment logs via WebSocket and persists to execution logs.
+
+    This class provides methods to emit logs at different stages of Look-up
+    execution, with support for both real-time WebSocket logs (Prompt Studio)
+    and file-centric execution logs (ETL/Workflow/API).
+
+    The logs use a purple color scheme (#722ed1) in the frontend for
+    visual distinction from other log stages.
+
+    Example:
+        >>> emitter = LookupLogEmitter(
+        ...     session_id="ws-session-123",
+        ...     execution_id="exec-456",
+        ...     organization_id="org-789",
+        ... )
+        >>> emitter.emit_enrichment_start("Vendor Lookup", ["vendor_name"])
+        >>> emitter.emit_enrichment_success("Vendor Lookup", 3, False, 150)
+    """
+
+    LOG_STAGE = LogStage.LOOKUP.value
+    LOG_TYPE = "LOOKUP_ENRICHMENT"
+
+    def __init__(
+        self,
+        session_id: str | None = None,
+        execution_id: str | None = None,
+        file_execution_id: str | UUID | None = None,
+        organization_id: str | None = None,
+        doc_name: str | None = None,
+    ):
+        """Initialize the log emitter.
+
+        Args:
+            session_id: WebSocket session ID for real-time logs
+            execution_id: Workflow execution ID for file-centric logs
+            file_execution_id: File execution ID for file-centric logs
+            organization_id: Organization ID for multi-tenancy
+            doc_name: Current document name being processed
+        """
+        self.session_id = session_id
+        self.execution_id = str(execution_id) if execution_id else None
+        self.file_execution_id = str(file_execution_id) if file_execution_id else None
+        self.organization_id = organization_id
+        self.doc_name = doc_name
+
+    def _build_component(
+        self,
+        lookup_project_name: str,
+        **extra: Any,
+    ) -> dict[str, Any]:
+        """Build the component metadata for the log entry.
+
+        Args:
+            lookup_project_name: Name of the Look-up project
+            **extra: Additional metadata to include
+
+        Returns:
+            Dictionary with component metadata
+        """
+        component = {
+            "type": self.LOG_TYPE,
+            "lookup_project": lookup_project_name,
+        }
+        if self.doc_name:
+            component["doc_name"] = self.doc_name
+        component.update(extra)
+        return component
+
+    def emit_log(
+        self,
+        level: str,
+        message: str,
+        lookup_project_name: str = "",
+        state: str = "INFO",
+        **extra: Any,
+    ) -> None:
+        """Emit a lookup log event via WebSocket and/or ExecutionLog.
+
+        For Prompt Studio (session_id set): Emits to WebSocket for real-time display
+        For Workflow/API (file_execution_id set): Persists to ExecutionLog for Nav bar
+
+        Args:
+            level: Log level (INFO, ERROR, WARN, DEBUG)
+            message: Log message
+            lookup_project_name: Name of the Look-up project
+            state: Log state (STARTED, COMPLETED, FAILED, SKIPPED)
+            **extra: Additional metadata for the component
+        """
+        log_details = LogPublisher.log_workflow(
+            stage=self.LOG_STAGE,
+            message=message,
+            level=level,
+            execution_id=self.execution_id,
+            file_execution_id=self.file_execution_id,
+            organization_id=self.organization_id,
+        )
+
+        # Add component metadata for frontend rendering
+        log_details["component"] = self._build_component(
+            lookup_project_name=lookup_project_name,
+            state=state,
+            **extra,
+        )
+
+        # Emit to WebSocket if session_id is available (Prompt Studio)
+        if self.session_id:
+            LogPublisher.publish(self.session_id, log_details)
+            logger.debug(f"Emitted lookup log to WebSocket: {message}")
+
+        # Persist to ExecutionLog if in workflow context (Nav bar logs)
+        if self.file_execution_id and self.execution_id:
+            self._persist_to_execution_log(log_details, level, message)
+
+    def _persist_to_execution_log(
+        self,
+        log_details: dict[str, Any],
+        level: str,
+        message: str,
+    ) -> None:
+        """Persist log entry to ExecutionLog via Redis queue for Nav bar display.
+
+        Uses the same Redis queue mechanism as other workflow logs to ensure
+        proper ordering of logs when displayed in the Nav bar.
+
+        Args:
+            log_details: The log details dictionary
+            level: Log level
+            message: Log message
+        """
+        try:
+            import redis
+            from django.conf import settings
+
+            from unstract.core.log_utils import store_execution_log
+
+            # Build log data matching the expected format for the queue
+            log_data = {
+                "timestamp": time.time(),  # Unix timestamp for queue processing
+                "type": "LOG",
+                "level": level,
+                "stage": self.LOG_STAGE,
+                "log": message,
+                "execution_id": self.execution_id,
+                "file_execution_id": self.file_execution_id,
+                "organization_id": self.organization_id,
+                **log_details,
+            }
+
+            # Use the same Redis queue as other workflow logs
+            redis_client = redis.Redis(
+                host=settings.REDIS_HOST,
+                port=int(settings.REDIS_PORT),
+                username=settings.REDIS_USER,
+                password=settings.REDIS_PASSWORD,
+            )
+
+            from utils.constants import ExecutionLogConstants
+
+            store_execution_log(
+                data=log_data,
+                redis_client=redis_client,
+                log_queue_name=ExecutionLogConstants.LOG_QUEUE_NAME,
+                is_enabled=ExecutionLogConstants.IS_ENABLED,
+            )
+            logger.debug(f"Queued lookup log for ExecutionLog: {message}")
+
+        except Exception as e:
+            logger.warning(f"Failed to queue lookup log for ExecutionLog: {e}")
+
+    def emit_enrichment_start(
+        self,
+        lookup_project_name: str,
+        input_fields: list[str] | None = None,
+    ) -> None:
+        """Emit log when Look-up enrichment starts.
+
+        Args:
+            lookup_project_name: Name of the Look-up project
+            input_fields: List of input field names being used
+        """
+        input_fields = input_fields or []
+        fields_str = ", ".join(input_fields[:3])
+        if len(input_fields) > 3:
+            fields_str += f" (+{len(input_fields) - 3} more)"
+
+        message = f"Starting enrichment with Look-Up '{lookup_project_name}'"
+        if fields_str:
+            message += f" for: {fields_str}"
+
+        self.emit_log(
+            level=LogLevel.INFO.value,
+            state="STARTED",
+            message=message,
+            lookup_project_name=lookup_project_name,
+            input_fields=input_fields,
+        )
+
+    def emit_enrichment_success(
+        self,
+        lookup_project_name: str,
+        enriched_count: int,
+        cached: bool,
+        execution_time_ms: int,
+        confidence: float | None = None,
+    ) -> None:
+        """Emit log when Look-up enrichment succeeds.
+
+        Args:
+            lookup_project_name: Name of the Look-up project
+            enriched_count: Number of fields enriched
+            cached: Whether the response was from cache
+            execution_time_ms: Execution time in milliseconds
+            confidence: Optional confidence score (0.0-1.0)
+        """
+        cache_msg = " (cached)" if cached else ""
+        message = (
+            f"Look-Up '{lookup_project_name}' enriched {enriched_count} "
+            f"field(s){cache_msg} in {execution_time_ms}ms"
+        )
+
+        if confidence is not None:
+            message += f" (confidence: {confidence:.0%})"
+
+        self.emit_log(
+            level=LogLevel.INFO.value,
+            state="COMPLETED",
+            message=message,
+            lookup_project_name=lookup_project_name,
+            cached=cached,
+            execution_time_ms=execution_time_ms,
+            enriched_count=enriched_count,
+            confidence=confidence,
+        )
+
+    def emit_enrichment_failure(
+        self,
+        lookup_project_name: str,
+        error_message: str,
+    ) -> None:
+        """Emit log when Look-up enrichment fails.
+
+        Args:
+            lookup_project_name: Name of the Look-up project
+            error_message: Error message describing the failure
+        """
+        message = f"Look-Up '{lookup_project_name}' failed: {error_message}"
+
+        self.emit_log(
+            level=LogLevel.ERROR.value,
+            state="FAILED",
+            message=message,
+            lookup_project_name=lookup_project_name,
+            error_message=error_message,
+        )
+
+    def emit_enrichment_partial(
+        self,
+        lookup_project_name: str,
+        enriched_count: int,
+        execution_time_ms: int,
+        warning_message: str,
+        confidence: float | None = None,
+    ) -> None:
+        """Emit log when Look-up enrichment partially succeeds.
+
+        Args:
+            lookup_project_name: Name of the Look-up project
+            enriched_count: Number of fields enriched
+            execution_time_ms: Execution time in milliseconds
+            warning_message: Warning message about partial success
+            confidence: Optional confidence score (0.0-1.0)
+        """
+        message = (
+            f"Look-Up '{lookup_project_name}' partial success: "
+            f"enriched {enriched_count} field(s) in {execution_time_ms}ms - "
+            f"{warning_message}"
+        )
+
+        self.emit_log(
+            level=LogLevel.WARN.value,
+            state="PARTIAL",
+            message=message,
+            lookup_project_name=lookup_project_name,
+            enriched_count=enriched_count,
+            execution_time_ms=execution_time_ms,
+            warning_message=warning_message,
+            confidence=confidence,
+        )
+
+    def emit_no_linked_lookups(self) -> None:
+        """Emit debug log when no Look-Ups are linked."""
+        self.emit_log(
+            level=LogLevel.INFO.value,
+            state="SKIPPED",
+            message="No linked Look-Up projects found",
+            lookup_project_name="",
+        )
+
+    def emit_orchestration_start(
+        self,
+        lookup_count: int,
+        lookup_names: list[str],
+    ) -> None:
+        """Emit log when Look-up orchestration starts.
+
+        Args:
+            lookup_count: Number of Look-ups to execute
+            lookup_names: Names of the Look-up projects
+        """
+        names_str = ", ".join(lookup_names[:3])
+        if len(lookup_names) > 3:
+            names_str += f" (+{len(lookup_names) - 3} more)"
+
+        message = f"Starting Look-Up enrichment: {lookup_count} project(s) [{names_str}]"
+
+        self.emit_log(
+            level=LogLevel.INFO.value,
+            state="STARTED",
+            message=message,
+            lookup_project_name="",
+            lookup_count=lookup_count,
+            lookup_names=lookup_names,
+        )
+
+    def emit_orchestration_complete(
+        self,
+        total_lookups: int,
+        successful: int,
+        failed: int,
+        total_time_ms: int,
+        total_enriched_fields: int,
+    ) -> None:
+        """Emit log when Look-up orchestration completes.
+
+        Args:
+            total_lookups: Total number of Look-ups executed
+            successful: Number of successful Look-ups
+            failed: Number of failed Look-ups
+            total_time_ms: Total execution time in milliseconds
+            total_enriched_fields: Total number of fields enriched
+        """
+        status = "completed" if failed == 0 else "completed with errors"
+        message = (
+            f"Look-Up enrichment {status}: {successful}/{total_lookups} succeeded, "
+            f"{total_enriched_fields} field(s) enriched in {total_time_ms}ms"
+        )
+
+        level = LogLevel.INFO.value if failed == 0 else LogLevel.WARN.value
+
+        self.emit_log(
+            level=level,
+            state="COMPLETED" if failed == 0 else "PARTIAL",
+            message=message,
+            lookup_project_name="",
+            total_lookups=total_lookups,
+            successful=successful,
+            failed=failed,
+            total_time_ms=total_time_ms,
+            total_enriched_fields=total_enriched_fields,
+        )
diff --git a/backend/lookup/services/lookup_integration_service.py b/backend/lookup/services/lookup_integration_service.py
index 21c8c966b0..b6974386b2 100644
--- a/backend/lookup/services/lookup_integration_service.py
+++ b/backend/lookup/services/lookup_integration_service.py
@@ -33,6 +33,11 @@ def enrich_if_linked(
         extracted_data: dict[str, Any],
         run_id: str | None = None,
         timeout: float | None = None,
+        session_id: str | None = None,
+        doc_name: str | None = None,
+        file_execution_id: str | None = None,
+        workflow_execution_id: str | None = None,
+        organization_id: str | None = None,
     ) -> dict[str, Any]:
         """Execute Lookup enrichment if PS project has linked Lookups.
 
@@ -41,12 +46,19 @@ def enrich_if_linked(
         - Timeout protection to not block extraction
         - Graceful degradation on errors
         - Full audit logging
+        - WebSocket log emission for Prompt Studio UI
+        - ExecutionLog persistence for Nav bar display (workflow context)
 
         Args:
             prompt_studio_project_id: UUID of Prompt Studio project
             extracted_data: Dict of extracted field values
             run_id: Optional execution run ID for tracking
             timeout: Max seconds to wait (default from settings)
+            session_id: WebSocket session ID for real-time log emission
+            doc_name: Document name being processed
+            file_execution_id: File execution ID for Nav bar logs
+            workflow_execution_id: Workflow execution ID for Nav bar logs
+            organization_id: Organization ID for multi-tenancy
 
         Returns:
             Dict with 'lookup_enrichment' and '_lookup_metadata' keys,
@@ -69,6 +81,11 @@ def enrich_if_linked(
                 extracted_data=extracted_data,
                 run_id=run_id,
                 timeout=timeout,
+                session_id=session_id,
+                doc_name=doc_name,
+                file_execution_id=file_execution_id,
+                workflow_execution_id=workflow_execution_id,
+                organization_id=organization_id,
             )
         except FuturesTimeoutError:
             logger.warning(
@@ -106,9 +123,25 @@ def _execute_enrichment(
         extracted_data: dict[str, Any],
         run_id: str | None,
         timeout: float,
+        session_id: str | None = None,
+        doc_name: str | None = None,
+        file_execution_id: str | None = None,
+        workflow_execution_id: str | None = None,
+        organization_id: str | None = None,
     ) -> dict[str, Any]:
         """Internal method to execute enrichment with timeout."""
         from lookup.models import PromptStudioLookupLink
+        from lookup.services.log_emitter import LookupLogEmitter
+
+        # Initialize log emitter for WebSocket and/or ExecutionLog
+        # When file_execution_id is set (workflow context), logs persist to Nav bar
+        log_emitter = LookupLogEmitter(
+            session_id=session_id,
+            execution_id=workflow_execution_id or run_id,
+            file_execution_id=file_execution_id,
+            organization_id=organization_id,
+            doc_name=doc_name,
+        )
 
         # Quick existence check - minimal overhead if no links
         links = (
@@ -123,6 +156,7 @@ def _execute_enrichment(
             logger.debug(
                 f"No Lookup links found for PS project {prompt_studio_project_id}"
             )
+            log_emitter.emit_no_linked_lookups()
             return {}
 
         # Get enabled lookup projects (those with ready status)
@@ -139,7 +173,17 @@ def _execute_enrichment(
             f"{prompt_studio_project_id}"
         )
 
+        # Emit orchestration start log
+        lookup_names = [lp.name for lp in lookup_projects]
+        log_emitter.emit_orchestration_start(
+            lookup_count=len(lookup_projects),
+            lookup_names=lookup_names,
+        )
+
         # Execute with timeout protection
+        import time
+
+        start_time = time.time()
         with ThreadPoolExecutor(max_workers=1) as executor:
             future = executor.submit(
                 LookupIntegrationService._run_orchestrator,
@@ -147,9 +191,22 @@ def _execute_enrichment(
                 input_data=extracted_data,
                 execution_id=run_id or str(uuid.uuid4()),
                 prompt_studio_project_id=prompt_studio_project_id,
+                log_emitter=log_emitter,
             )
             result = future.result(timeout=timeout)
 
+        # Emit orchestration complete log
+        total_time_ms = int((time.time() - start_time) * 1000)
+        metadata = result.get("_lookup_metadata", {})
+        log_emitter.emit_orchestration_complete(
+            total_lookups=len(lookup_projects),
+            successful=metadata.get("lookups_successful", 0),
+            failed=metadata.get("lookups_executed", 0)
+            - metadata.get("lookups_successful", 0),
+            total_time_ms=total_time_ms,
+            total_enriched_fields=len(result.get("lookup_enrichment", {})),
+        )
+
         return result
 
     @staticmethod
@@ -158,6 +215,7 @@ def _run_orchestrator(
         input_data: dict[str, Any],
         execution_id: str,
         prompt_studio_project_id: str,
+        log_emitter: Any = None,
     ) -> dict[str, Any]:
         """Execute the lookup orchestrator for all linked projects."""
         from lookup.integrations.file_storage_client import FileStorageClient
@@ -225,8 +283,10 @@ def _run_orchestrator(
                 llm_client=LLMClientWrapper(llm_client),
             )
 
-            # Create orchestrator
-            orchestrator = LookUpOrchestrator(executor=executor, merger=merger)
+            # Create orchestrator with log emitter for WebSocket logs
+            orchestrator = LookUpOrchestrator(
+                executor=executor, merger=merger, log_emitter=log_emitter
+            )
 
             # Execute lookups with audit context
             result = orchestrator.execute_lookups(
diff --git a/backend/lookup/services/lookup_orchestrator.py b/backend/lookup/services/lookup_orchestrator.py
index 75b8a87ee3..a0d9472cb9 100644
--- a/backend/lookup/services/lookup_orchestrator.py
+++ b/backend/lookup/services/lookup_orchestrator.py
@@ -31,6 +31,7 @@ def __init__(
         executor: LookUpExecutor,
         merger: EnrichmentMerger,
         config: dict[str, Any] = None,
+        log_emitter: Any = None,
     ):
         """Initialize the Look-Up orchestrator.
 
@@ -41,9 +42,11 @@ def __init__(
                 - max_concurrent_executions: Maximum parallel executions (default 10)
                 - queue_timeout_seconds: Overall queue timeout (default 120)
                 - execution_timeout_seconds: Per-execution timeout (default 30)
+            log_emitter: Optional LookupLogEmitter for WebSocket logging
         """
         self.executor = executor
         self.merger = merger
+        self.log_emitter = log_emitter
 
         config = config or {}
         self.max_concurrent = config.get("max_concurrent_executions", 10)
@@ -147,11 +150,15 @@ def execute_lookups(
                             logger.debug(
                                 f"Look-Up {lookup_project.name} completed successfully"
                             )
+                            # Emit success log via WebSocket
+                            self._emit_success_log(result, lookup_project)
                         else:
                             failed_lookups.append(result)
                             logger.warning(
                                 f"Look-Up {lookup_project.name} failed: {result.get('error')}"
                             )
+                            # Emit failure log via WebSocket
+                            self._emit_failure_log(result, lookup_project)
 
                     except TimeoutError:
                         # Individual execution timeout
@@ -380,3 +387,52 @@ def _empty_result(
                 "enrichments": [],
             },
         }
+
+    def _emit_success_log(
+        self, result: dict[str, Any], lookup_project: LookupProject
+    ) -> None:
+        """Emit success log via WebSocket if log_emitter is available.
+
+        Args:
+            result: Execution result dictionary
+            lookup_project: The Look-Up project that was executed
+        """
+        if not self.log_emitter:
+            return
+
+        try:
+            enriched_count = len(result.get("data", {}))
+            cached = result.get("cached", False)
+            execution_time_ms = result.get("execution_time_ms", 0)
+            confidence = result.get("confidence")
+
+            self.log_emitter.emit_enrichment_success(
+                lookup_project_name=lookup_project.name,
+                enriched_count=enriched_count,
+                cached=cached,
+                execution_time_ms=execution_time_ms,
+                confidence=confidence,
+            )
+        except Exception as e:
+            logger.warning(f"Failed to emit success log: {e}")
+
+    def _emit_failure_log(
+        self, result: dict[str, Any], lookup_project: LookupProject
+    ) -> None:
+        """Emit failure log via WebSocket if log_emitter is available.
+
+        Args:
+            result: Execution result dictionary
+            lookup_project: The Look-Up project that was executed
+        """
+        if not self.log_emitter:
+            return
+
+        try:
+            error_message = result.get("error", "Unknown error")
+            self.log_emitter.emit_enrichment_failure(
+                lookup_project_name=lookup_project.name,
+                error_message=error_message,
+            )
+        except Exception as e:
+            logger.warning(f"Failed to emit failure log: {e}")
diff --git a/backend/lookup/services/workflow_integration.py b/backend/lookup/services/workflow_integration.py
index 6830f9a726..b2bb1f68ba 100644
--- a/backend/lookup/services/workflow_integration.py
+++ b/backend/lookup/services/workflow_integration.py
@@ -1,349 +1,359 @@
-"""Service for integrating Look-up enrichment with workflow execution.
+"""Workflow Integration Service for Look-up enrichment.
 
-This module provides Look-up enrichment for API/ETL/Workflow execution paths,
-which are separate from the Prompt Studio UI path. It hooks into the
-FileExecutionTasks pipeline to enrich extraction results before they are
-sent to the destination.
+This module provides integration between Look-up enrichment and
+workflow file execution (ETL, Workflow, API deployments).
+It handles logging to both WebSocket (real-time) and ExecutionLog
+(file-centric) based on execution context.
 """
 
+import json
 import logging
 import uuid
 from typing import Any
+from uuid import UUID
 
-from django.core.exceptions import ObjectDoesNotExist
+from lookup.models import LookupExecutionAudit, PromptStudioLookupLink
 
 logger = logging.getLogger(__name__)
 
 
 class LookupWorkflowIntegration:
-    """Service for integrating Look-up enrichment with workflow execution.
-
-    This service bridges the gap between workflow execution (API/ETL) and
-    the Look-up enrichment system. In Prompt Studio UI, enrichment is handled
-    by OutputManagerHelper._try_lookup_enrichment(). For workflows, this
-    service provides equivalent functionality.
-
-    The integration works by:
-    1. Getting the Prompt Studio project ID from the workflow's tool instance
-    2. Checking if any Look-up projects are linked to that PS project
-    3. Executing the Look-up enrichment if links exist
-    4. Merging the enrichment data with the extraction results
+    """Service for integrating Look-ups with workflow file execution.
+
+    This service provides methods to execute Look-ups within workflow
+    contexts (ETL, Workflow, API) with proper logging and audit trail.
+
+    Example:
+        >>> from workflow_manager.file_execution.models import WorkflowFileExecution
+        >>> file_exec = WorkflowFileExecution.objects.get(id=file_id)
+        >>> result = LookupWorkflowIntegration.execute_lookups_for_file(
+        ...     prompt_studio_project_id=ps_project_id,
+        ...     extraction_output={"vendor": "Acme Corp"},
+        ...     workflow_file_execution=file_exec,
+        ...     organization_id="org-123",
+        ... )
     """
 
-    @staticmethod
-    def get_prompt_studio_project_id(tool_instance_id: str) -> str | None:
-        """Get the Prompt Studio project ID from a tool instance.
+    @classmethod
+    def execute_lookups_for_file(
+        cls,
+        prompt_studio_project_id: UUID,
+        extraction_output: dict[str, Any],
+        workflow_execution_id: UUID,
+        file_execution_id: UUID,
+        organization_id: str,
+        file_name: str | None = None,
+        session_id: str | None = None,
+    ) -> dict[str, Any]:
+        """Execute linked Look-ups for a file being processed in a workflow.
 
-        The tool instance's tool_id is the PromptStudioRegistry's
-        prompt_registry_id. The registry has a custom_tool FK to CustomTool,
-        which is the actual Prompt Studio project.
+        This method is called from ETL, Workflow, and API execution pipelines
+        after Prompt Studio extraction completes for a file.
 
         Args:
-            tool_instance_id: UUID of the ToolInstance
+            prompt_studio_project_id: The PS project UUID
+            extraction_output: Output from Prompt Studio extraction
+            workflow_execution_id: The workflow execution UUID
+            file_execution_id: The file execution UUID
+            organization_id: Tenant organization ID
+            file_name: Optional file name for logging
+            session_id: Optional WebSocket session for real-time logs
 
         Returns:
-            Prompt Studio project (CustomTool) UUID as string, or None if not found
+            Enriched output with Look-up data merged, or original output
+            if no Look-ups are linked or enrichment fails.
         """
-        from prompt_studio.prompt_studio_registry_v2.models import PromptStudioRegistry
-        from tool_instance_v2.models import ToolInstance
+        # Check for linked lookups first
+        if not cls.has_linked_lookups(prompt_studio_project_id):
+            logger.debug(f"No linked Look-ups for PS project {prompt_studio_project_id}")
+            return extraction_output
 
         try:
-            tool_instance = ToolInstance.objects.get(id=tool_instance_id)
-            tool_id = tool_instance.tool_id
+            # Execute lookups using the integration service
+            # LookupIntegrationService handles all logging via LookupLogEmitter
+            from lookup.services.lookup_integration_service import (
+                LookupIntegrationService,
+            )
 
-            # Check if this is a Prompt Studio exported tool
-            try:
-                registry = PromptStudioRegistry.objects.get(prompt_registry_id=tool_id)
-                if registry.custom_tool:
-                    return str(registry.custom_tool.tool_id)
-            except (ObjectDoesNotExist, ValueError):
-                # Not a Prompt Studio tool, or invalid UUID
-                logger.debug(f"Tool {tool_id} is not a Prompt Studio exported tool")
-                return None
-
-        except ObjectDoesNotExist:
-            logger.warning(f"ToolInstance {tool_instance_id} not found")
-            return None
-        except Exception as e:
-            logger.error(f"Error getting PS project ID: {e}")
-            return None
+            result = LookupIntegrationService.enrich_if_linked(
+                prompt_studio_project_id=str(prompt_studio_project_id),
+                extracted_data=extraction_output,
+                run_id=str(uuid.uuid4()),
+                session_id=session_id,
+                doc_name=file_name,
+                file_execution_id=str(file_execution_id),
+                workflow_execution_id=str(workflow_execution_id),
+                organization_id=organization_id,
+            )
+
+            # Get enrichment result
+            enrichment = result.get("lookup_enrichment", {})
+
+            # Merge enrichment into extraction output
+            if enrichment:
+                merged_output = extraction_output.copy()
+                merged_output.update(enrichment)
+                return merged_output
 
-        return None
+            return extraction_output
+
+        except Exception as e:
+            logger.error(
+                f"Look-up enrichment failed for file execution "
+                f"{file_execution_id}: {e}",
+                exc_info=True,
+            )
+            # Return original output on failure
+            return extraction_output
 
-    @staticmethod
-    def get_prompt_studio_project_id_from_workflow(workflow_id: str) -> str | None:
-        """Get the Prompt Studio project ID from a workflow's tool instances.
+    @classmethod
+    def process_workflow_enrichment(
+        cls,
+        workflow_id: str,
+        original_output: str,
+        file_execution_id: str,
+    ) -> tuple[str | dict[str, Any], bool]:
+        """Process Look-up enrichment for workflow output.
 
-        Searches through the workflow's tool instances to find one that is
-        a Prompt Studio exported tool.
+        This method is called from file_execution_tasks._try_lookup_enrichment
+        to enrich extraction output with Look-up data.
 
         Args:
-            workflow_id: UUID of the Workflow
+            workflow_id: The workflow UUID as string
+            original_output: The extraction output (JSON string or dict)
+            file_execution_id: The file execution UUID as string
 
         Returns:
-            Prompt Studio project (CustomTool) UUID as string, or None if not found
+            Tuple of (enriched_output, was_enriched):
+            - enriched_output: The enriched data (same type as input)
+            - was_enriched: True if enrichment was applied
         """
         from prompt_studio.prompt_studio_registry_v2.models import PromptStudioRegistry
-        from tool_instance_v2.constants import ToolInstanceKey
-        from tool_instance_v2.tool_instance_helper import ToolInstanceHelper
+        from tool_instance_v2.models import ToolInstance
+        from workflow_manager.file_execution.models import WorkflowFileExecution
+        from workflow_manager.workflow_v2.models.workflow import Workflow
 
         try:
-            tool_instances = ToolInstanceHelper.get_tool_instances_by_workflow(
-                workflow_id, ToolInstanceKey.STEP
+            logger.info(
+                f"[LOOKUP] process_workflow_enrichment called for workflow "
+                f"{workflow_id}, file_execution {file_execution_id}"
             )
 
-            for tool_instance in tool_instances:
-                tool_id = tool_instance.tool_id
-
-                # Check if this is a Prompt Studio exported tool
+            # Parse output if string
+            if isinstance(original_output, str):
                 try:
-                    registry = PromptStudioRegistry.objects.get(
-                        prompt_registry_id=tool_id
+                    output_data = json.loads(original_output)
+                    logger.info(
+                        f"[LOOKUP] Parsed output data keys: {list(output_data.keys())}"
                     )
-                    if registry.custom_tool:
-                        logger.debug(
-                            f"Found PS project {registry.custom_tool.tool_id} "
-                            f"for workflow {workflow_id}"
-                        )
-                        return str(registry.custom_tool.tool_id)
-                except (ObjectDoesNotExist, ValueError):
-                    # Not a Prompt Studio tool, continue to next
-                    continue
-
-            logger.debug(f"No Prompt Studio tool found in workflow {workflow_id}")
-            return None
-
-        except Exception as e:
-            logger.error(f"Error getting PS project ID from workflow {workflow_id}: {e}")
-            return None
-
-    @staticmethod
-    def has_lookup_links(prompt_studio_project_id: str) -> bool:
-        """Check if a Prompt Studio project has any Look-up links.
-
-        Args:
-            prompt_studio_project_id: UUID of the Prompt Studio project
-
-        Returns:
-            True if Look-up links exist, False otherwise
-        """
-        from lookup.models import PromptStudioLookupLink
+                except json.JSONDecodeError:
+                    logger.warning(
+                        f"[LOOKUP] Could not parse output as JSON for workflow {workflow_id}"
+                    )
+                    return original_output, False
+            else:
+                output_data = original_output
+                logger.info(
+                    f"[LOOKUP] Output data keys: {list(output_data.keys()) if isinstance(output_data, dict) else type(output_data)}"
+                )
+
+            # Get workflow and its prompt studio registry
+            workflow = Workflow.objects.get(id=workflow_id)
+            logger.info(f"[LOOKUP] Found workflow: {workflow.id}")
+
+            # Get prompt studio project ID from workflow's tool instance
+            # The tool_id in ToolInstance is the prompt_registry_id
+            tool_instance = ToolInstance.objects.filter(workflow_id=workflow_id).first()
+
+            if not tool_instance:
+                logger.info(f"[LOOKUP] No tool instance found for workflow {workflow_id}")
+                return original_output, False
 
-        try:
-            return PromptStudioLookupLink.objects.filter(
-                prompt_studio_project_id=prompt_studio_project_id
-            ).exists()
-        except Exception as e:
-            logger.error(f"Error checking Look-up links: {e}")
-            return False
+            logger.info(
+                f"[LOOKUP] Found tool instance: {tool_instance.id}, tool_id: {tool_instance.tool_id}"
+            )
 
-    @staticmethod
-    def enrich_workflow_output(
-        workflow_id: str,
-        extracted_data: dict[str, Any],
-        file_execution_id: str | None = None,
-        execution_id: str | None = None,
-    ) -> dict[str, Any]:
-        """Execute Look-up enrichment for workflow execution output.
+            # Get the PromptStudioRegistry to find the custom_tool (PS project)
+            try:
+                prompt_registry = PromptStudioRegistry.objects.get(
+                    prompt_registry_id=tool_instance.tool_id
+                )
+                logger.info(
+                    f"[LOOKUP] Found prompt registry: {prompt_registry.prompt_registry_id}"
+                )
+                if prompt_registry.custom_tool:
+                    prompt_studio_project_id = str(prompt_registry.custom_tool.tool_id)
+                    logger.info(
+                        f"[LOOKUP] Found PS project ID: {prompt_studio_project_id}"
+                    )
+                else:
+                    logger.info(
+                        f"[LOOKUP] No custom tool linked to registry {tool_instance.tool_id}"
+                    )
+                    return original_output, False
+            except PromptStudioRegistry.DoesNotExist:
+                logger.info(
+                    f"[LOOKUP] No prompt registry found for tool {tool_instance.tool_id}"
+                )
+                return original_output, False
 
-        This method is the main entry point for workflow-based Look-up
-        enrichment. It:
-        1. Finds the Prompt Studio project from the workflow
-        2. Checks for Look-up links
-        3. Executes enrichment via LookupIntegrationService
-        4. Returns the enrichment result
+            if not prompt_studio_project_id:
+                logger.info(
+                    f"[LOOKUP] No Prompt Studio project found for workflow {workflow_id}"
+                )
+                return original_output, False
 
-        Args:
-            workflow_id: UUID of the workflow
-            extracted_data: Dict of extracted field values from the tool
-            file_execution_id: Optional file execution ID for tracking
-            execution_id: Optional workflow execution ID for tracking
+            # Check for linked lookups
+            if not cls.has_linked_lookups(UUID(prompt_studio_project_id)):
+                logger.info(
+                    f"[LOOKUP] No linked Look-ups for PS project {prompt_studio_project_id}"
+                )
+                return original_output, False
 
-        Returns:
-            Dict with 'lookup_enrichment' and '_lookup_metadata' keys,
-            or empty dict if no enrichment was performed.
-        """
-        from lookup.services.lookup_integration_service import LookupIntegrationService
+            logger.info(
+                f"[LOOKUP] Found linked lookups for PS project {prompt_studio_project_id}"
+            )
 
-        if not extracted_data:
-            logger.debug("No extracted data provided for workflow enrichment")
-            return {}
+            # Get file execution for context
+            file_execution = WorkflowFileExecution.objects.get(id=file_execution_id)
+            workflow_execution_id = file_execution.workflow_execution_id
+            organization_id = str(workflow.organization_id)
 
-        # Get the Prompt Studio project ID from the workflow
-        ps_project_id = (
-            LookupWorkflowIntegration.get_prompt_studio_project_id_from_workflow(
-                workflow_id
+            # Execute lookups with file execution context for Nav bar logging
+            # LookupIntegrationService handles all logging via LookupLogEmitter
+            from lookup.services.lookup_integration_service import (
+                LookupIntegrationService,
             )
-        )
 
-        if not ps_project_id:
-            logger.debug(f"No Prompt Studio project found for workflow {workflow_id}")
-            return {}
-
-        # Check if there are any Look-up links
-        if not LookupWorkflowIntegration.has_lookup_links(ps_project_id):
-            logger.debug(f"No Look-up links for PS project {ps_project_id}")
-            return {}
+            result = LookupIntegrationService.enrich_if_linked(
+                prompt_studio_project_id=prompt_studio_project_id,
+                extracted_data=output_data,
+                run_id=str(uuid.uuid4()),
+                file_execution_id=file_execution_id,
+                workflow_execution_id=str(workflow_execution_id),
+                organization_id=organization_id,
+                doc_name=file_execution.file_name,
+            )
 
-        # Generate a run ID for tracking
-        run_id = file_execution_id or execution_id or str(uuid.uuid4())
+            # Get result metadata
+            _metadata = result.get("_lookup_metadata", {})  # noqa F841
+            enrichment = result.get("lookup_enrichment", {})
 
-        logger.info(
-            f"Executing Look-up enrichment for workflow {workflow_id}, "
-            f"PS project {ps_project_id}, run_id {run_id}"
-        )
+            # Merge enrichment into output
+            if enrichment:
+                merged_output = output_data.copy()
+                merged_output.update(enrichment)
+                return merged_output, True
 
-        # Delegate to the existing LookupIntegrationService
-        return LookupIntegrationService.enrich_if_linked(
-            prompt_studio_project_id=ps_project_id,
-            extracted_data=extracted_data,
-            run_id=run_id,
-        )
+            return original_output, False
 
-    @staticmethod
-    def merge_enrichment_with_output(
-        original_output: dict[str, Any] | str | None,
-        enrichment_result: dict[str, Any],
-    ) -> dict[str, Any] | str | None:
-        """Merge Look-up enrichment data with the original tool output.
+        except Exception as e:
+            logger.error(
+                f"Look-up enrichment failed for workflow {workflow_id}, "
+                f"file execution {file_execution_id}: {e}",
+                exc_info=True,
+            )
+            return original_output, False
 
-        The enrichment values REPLACE the corresponding fields in the original
-        output. For example, if original has {"vendor_name": "Amzn Inc"} and
-        enrichment has {"vendor_name": "AWS"}, the result will have
-        {"vendor_name": "AWS"}.
+    @classmethod
+    def has_linked_lookups(cls, prompt_studio_project_id: UUID) -> bool:
+        """Check if PS project has linked Look-ups.
 
         Args:
-            original_output: Original tool output (dict, string, or None)
-            enrichment_result: Result from enrich_workflow_output()
+            prompt_studio_project_id: The PS project UUID
 
         Returns:
-            Merged output with enrichment values replacing original fields
+            True if at least one Look-up is linked
         """
-        if not enrichment_result:
-            return original_output
+        return PromptStudioLookupLink.objects.filter(
+            prompt_studio_project_id=prompt_studio_project_id
+        ).exists()
 
-        lookup_enrichment = enrichment_result.get("lookup_enrichment", {})
-        lookup_metadata = enrichment_result.get("_lookup_metadata", {})
+    @classmethod
+    def _get_enabled_lookup_projects(cls, prompt_studio_project_id: UUID) -> list:
+        """Get enabled lookup projects for a PS project.
 
-        if not lookup_enrichment:
-            return original_output
+        Args:
+            prompt_studio_project_id: The PS project UUID
 
-        # If original output is a string, try to parse it as JSON
-        if isinstance(original_output, str):
-            import json
+        Returns:
+            List of enabled LookupProject instances
+        """
+        links = (
+            PromptStudioLookupLink.objects.filter(
+                prompt_studio_project_id=prompt_studio_project_id
+            )
+            .select_related("lookup_project")
+            .order_by("execution_order")
+        )
 
-            try:
-                output_dict = json.loads(original_output)
-            except json.JSONDecodeError:
-                # Can't merge with non-JSON string, add enrichment as separate key
-                return {
-                    "extracted_data": original_output,
-                    "lookup_enrichment": lookup_enrichment,
-                    "_lookup_metadata": lookup_metadata,
-                }
-        elif isinstance(original_output, dict):
-            output_dict = original_output.copy()
-        elif original_output is None:
-            output_dict = {}
-        else:
-            # Unknown type, wrap it
-            output_dict = {"extracted_data": original_output}
-
-        # REPLACE original field values with enriched values
-        # This overwrites the original extracted values with the canonicalized ones
-        #
-        # Tool output structure is typically:
-        # {"workflow_id": "...", "elapsed_time": ..., "output": {"vendor_name": "..."}}
-        # We need to replace values INSIDE the "output" dict if it exists
-        if "output" in output_dict and isinstance(output_dict["output"], dict):
-            # Tool wrapped output - replace inside the "output" key
-            for field_name, enriched_value in lookup_enrichment.items():
-                if enriched_value is not None and field_name in output_dict["output"]:
-                    logger.info(
-                        f"Replacing output[{field_name}]: "
-                        f"'{output_dict['output'].get(field_name)}' -> '{enriched_value}'"
-                    )
-                    output_dict["output"][field_name] = enriched_value
-        else:
-            # Flat structure - replace at root level
-            for field_name, enriched_value in lookup_enrichment.items():
-                if enriched_value is not None:
-                    logger.info(
-                        f"Replacing {field_name}: "
-                        f"'{output_dict.get(field_name)}' -> '{enriched_value}'"
-                    )
-                    output_dict[field_name] = enriched_value
+        return [link.lookup_project for link in links if link.is_enabled]
 
-        # Add metadata for tracking (but not the separate lookup_enrichment key)
-        output_dict["_lookup_metadata"] = lookup_metadata
+    @classmethod
+    def get_lookup_logs_for_file(
+        cls,
+        file_execution_id: UUID,
+    ) -> list[dict]:
+        """Get all Look-up related logs for a file execution.
 
-        return output_dict
+        Args:
+            file_execution_id: The file execution UUID
 
-    @staticmethod
-    def process_workflow_enrichment(
-        workflow_id: str,
-        original_output: dict[str, Any] | str | None,
-        file_execution_id: str | None = None,
-        execution_id: str | None = None,
-    ) -> tuple[dict[str, Any] | str | None, bool]:
-        """Complete Look-up enrichment process for workflow output.
+        Returns:
+            List of log dictionaries with data and event_time
+        """
+        from workflow_manager.workflow_v2.models import ExecutionLog
 
-        This is a convenience method that combines enrich_workflow_output()
-        and merge_enrichment_with_output() into a single call.
+        return list(
+            ExecutionLog.objects.filter(
+                file_execution_id=file_execution_id,
+                data__stage="LOOKUP",
+            )
+            .values("data", "event_time")
+            .order_by("event_time")
+        )
+
+    @classmethod
+    def get_lookup_audits_for_file(
+        cls,
+        file_execution_id: UUID,
+    ) -> list[LookupExecutionAudit]:
+        """Get all Look-up audit records for a file execution.
 
         Args:
-            workflow_id: UUID of the workflow
-            original_output: Original tool output
-            file_execution_id: Optional file execution ID
-            execution_id: Optional workflow execution ID
+            file_execution_id: The file execution UUID
 
         Returns:
-            Tuple of (enriched_output, was_enriched)
+            List of LookupExecutionAudit instances
         """
-        # Extract data for enrichment - handle different output formats
-        if isinstance(original_output, dict):
-            extracted_data = original_output
-        elif isinstance(original_output, str):
-            import json
+        return list(
+            LookupExecutionAudit.objects.filter(file_execution_id=file_execution_id)
+            .select_related("lookup_project")
+            .order_by("executed_at")
+        )
 
-            try:
-                extracted_data = json.loads(original_output)
-            except json.JSONDecodeError:
-                logger.debug("Cannot enrich non-JSON string output")
-                return original_output, False
-        else:
-            logger.debug(f"Cannot enrich output of type {type(original_output)}")
-            return original_output, False
+    @classmethod
+    def get_lookup_audits_for_workflow(
+        cls,
+        workflow_execution_id: UUID,
+    ) -> list[LookupExecutionAudit]:
+        """Get all Look-up audit records for a workflow execution.
 
-        # Tool output structure is typically:
-        # {"workflow_id": "...", "elapsed_time": ..., "output": {"vendor_name": "..."}}
-        # We need to extract the "output" dict for enrichment if it exists
-        if "output" in extracted_data and isinstance(extracted_data["output"], dict):
-            data_for_enrichment = extracted_data["output"]
-            logger.debug(
-                f"Extracted 'output' key for enrichment: {list(data_for_enrichment.keys())}"
-            )
-        else:
-            data_for_enrichment = extracted_data
-            logger.debug(
-                f"Using flat structure for enrichment: {list(data_for_enrichment.keys())}"
-            )
+        Args:
+            workflow_execution_id: The workflow execution UUID
 
-        # Perform enrichment using the actual extraction data
-        enrichment_result = LookupWorkflowIntegration.enrich_workflow_output(
-            workflow_id=workflow_id,
-            extracted_data=data_for_enrichment,
-            file_execution_id=file_execution_id,
-            execution_id=execution_id,
-        )
+        Returns:
+            List of LookupExecutionAudit instances
+        """
+        # Get all file execution IDs for this workflow
+        from workflow_manager.file_execution.models import WorkflowFileExecution
 
-        if not enrichment_result or not enrichment_result.get("lookup_enrichment"):
-            return original_output, False
+        file_execution_ids = WorkflowFileExecution.objects.filter(
+            workflow_execution_id=workflow_execution_id
+        ).values_list("id", flat=True)
 
-        # Merge results
-        enriched_output = LookupWorkflowIntegration.merge_enrichment_with_output(
-            original_output=original_output,
-            enrichment_result=enrichment_result,
+        return list(
+            LookupExecutionAudit.objects.filter(file_execution_id__in=file_execution_ids)
+            .select_related("lookup_project")
+            .order_by("executed_at")
         )
-
-        return enriched_output, True
diff --git a/backend/lookup/views.py b/backend/lookup/views.py
index 6d63cee7fe..2961bad5b3 100644
--- a/backend/lookup/views.py
+++ b/backend/lookup/views.py
@@ -521,6 +521,63 @@ def statistics(self, request):
                 {"error": "Invalid UUID format"}, status=status.HTTP_400_BAD_REQUEST
             )
 
+    @action(detail=False, methods=["get"])
+    def by_file_execution(self, request):
+        """Get Look-up audits for a specific file execution.
+
+        GET /api/v1/execution-audits/by_file_execution/?file_execution_id={id}
+
+        This endpoint is used by the Nav Bar Logs page to show Look-up
+        enrichment details for a specific file processed in ETL/Workflow/API.
+        """
+        file_execution_id = request.query_params.get("file_execution_id")
+        if not file_execution_id:
+            return Response(
+                {"error": "file_execution_id is required"},
+                status=status.HTTP_400_BAD_REQUEST,
+            )
+
+        try:
+            audits = self.get_queryset().filter(file_execution_id=file_execution_id)
+            serializer = self.get_serializer(audits, many=True)
+            return Response(serializer.data)
+        except ValueError:
+            return Response(
+                {"error": "Invalid UUID format"}, status=status.HTTP_400_BAD_REQUEST
+            )
+
+    @action(detail=False, methods=["get"])
+    def by_workflow_execution(self, request):
+        """Get Look-up audits for an entire workflow execution.
+
+        GET /api/v1/execution-audits/by_workflow_execution/?workflow_execution_id={id}
+
+        This endpoint returns all Look-up audits across all files
+        processed in a workflow execution.
+        """
+        workflow_execution_id = request.query_params.get("workflow_execution_id")
+        if not workflow_execution_id:
+            return Response(
+                {"error": "workflow_execution_id is required"},
+                status=status.HTTP_400_BAD_REQUEST,
+            )
+
+        try:
+            from workflow_manager.file_execution.models import WorkflowFileExecution
+
+            # Get all file execution IDs for this workflow
+            file_execution_ids = WorkflowFileExecution.objects.filter(
+                workflow_execution_id=workflow_execution_id
+            ).values_list("id", flat=True)
+
+            audits = self.get_queryset().filter(file_execution_id__in=file_execution_ids)
+            serializer = self.get_serializer(audits, many=True)
+            return Response(serializer.data)
+        except ValueError:
+            return Response(
+                {"error": "Invalid UUID format"}, status=status.HTTP_400_BAD_REQUEST
+            )
+
 
 class LookupDebugView(viewsets.ViewSet):
     """Debug endpoints for testing Look-Up execution with Prompt Studio."""
diff --git a/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py b/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
index 4f02b20726..99019b5903 100644
--- a/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
+++ b/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
@@ -2,7 +2,9 @@
 import logging
 from typing import Any
 
+from account_v2.constants import Common
 from django.core.exceptions import ObjectDoesNotExist
+from utils.local_context import StateStore
 
 from prompt_studio.prompt_profile_manager_v2.models import ProfileManager
 from prompt_studio.prompt_studio_core_v2.exceptions import (
@@ -29,6 +31,8 @@ def _try_lookup_enrichment(
     tool_id: str,
     extracted_data: dict[str, Any],
     run_id: str | None = None,
+    session_id: str | None = None,
+    doc_name: str | None = None,
 ) -> dict[str, Any]:
     """Attempt Lookup enrichment if available.
 
@@ -39,6 +43,8 @@ def _try_lookup_enrichment(
         tool_id: Prompt Studio project (CustomTool) UUID
         extracted_data: Dict of extracted field values from prompts
         run_id: Optional execution run ID for tracking
+        session_id: Optional WebSocket session ID for real-time log emission
+        doc_name: Optional document name being processed
 
     Returns:
         Dict with 'lookup_enrichment' and '_lookup_metadata' keys,
@@ -53,6 +59,8 @@ def _try_lookup_enrichment(
             prompt_studio_project_id=tool_id,
             extracted_data=extracted_data,
             run_id=run_id,
+            session_id=session_id,
+            doc_name=doc_name,
         )
     except ImportError:
         # Lookup app not installed
@@ -241,13 +249,24 @@ def update_or_create_prompt_output(
         # Post-processing: Lookup enrichment integration
         # Build extracted data dict from all prompt outputs for enrichment
         extracted_data_for_lookup: dict[str, Any] = {}
+        logger.info(
+            f"Building extracted_data_for_lookup from {len(prompts)} prompts, "
+            f"outputs keys: {list(outputs.keys())}"
+        )
         for prompt in prompts:
             if prompt.prompt_type == PSOMKeys.NOTES:
+                logger.debug(f"Skipping NOTES prompt: {prompt.prompt_key}")
                 continue
             output_value = outputs.get(prompt.prompt_key)
+            logger.info(
+                f"Prompt {prompt.prompt_key}: output_value={output_value!r} "
+                f"(type={type(output_value).__name__})"
+            )
             if output_value is not None:
                 extracted_data_for_lookup[prompt.prompt_key] = output_value
 
+        logger.info(f"extracted_data_for_lookup: {extracted_data_for_lookup}")
+
         # Execute Lookup enrichment if linked projects exist
         if extracted_data_for_lookup:
             tool_id_str = str(tool.tool_id)
@@ -255,10 +274,15 @@ def update_or_create_prompt_output(
                 f"Calling Lookup enrichment for tool {tool_id_str} "
                 f"with data: {extracted_data_for_lookup}"
             )
+            # Get session_id for WebSocket log emission
+            session_id = StateStore.get(Common.LOG_EVENTS_ID)
+            doc_name = metadata.get("file_name") or document_manager.document_name
             lookup_result = _try_lookup_enrichment(
                 tool_id=tool_id_str,
                 extracted_data=extracted_data_for_lookup,
                 run_id=run_id,
+                session_id=session_id,
+                doc_name=doc_name,
             )
             logger.info(f"Lookup enrichment result: {lookup_result}")
 
@@ -277,10 +301,17 @@ def update_or_create_prompt_output(
                     if prompt_key and prompt_key in lookup_enrichment:
                         enriched_value = lookup_enrichment[prompt_key]
                         if enriched_value is not None:
+                            original_value = item.get("output")
                             logger.info(
                                 f"Replacing {prompt_key} output: "
-                                f"'{item.get('output')}' -> '{enriched_value}'"
+                                f"'{original_value}' -> '{enriched_value}'"
                             )
+                            # Store original value and enriched value for UI display
+                            item["lookup_replacement"] = {
+                                "original_value": original_value,
+                                "enriched_value": enriched_value,
+                                "field_name": prompt_key,
+                            }
                             item["output"] = enriched_value
                     # Add metadata for tracking
                     item["_lookup_metadata"] = lookup_metadata
diff --git a/backend/workflow_manager/workflow_v2/file_execution_tasks.py b/backend/workflow_manager/workflow_v2/file_execution_tasks.py
index be80604717..d9e7833579 100644
--- a/backend/workflow_manager/workflow_v2/file_execution_tasks.py
+++ b/backend/workflow_manager/workflow_v2/file_execution_tasks.py
@@ -1088,12 +1088,21 @@ def _try_lookup_enrichment(
             Enriched output result if Look-up was successful,
             original output_result otherwise.
         """
+        logger.info(
+            f"[LOOKUP] _try_lookup_enrichment called for workflow {workflow.id}, "
+            f"file_execution {file_execution_id}, output_result type: {type(output_result)}"
+        )
+
         if not output_result:
+            logger.info("[LOOKUP] No output_result, skipping enrichment")
             return output_result
 
         try:
             from lookup.services.workflow_integration import LookupWorkflowIntegration
 
+            logger.info(
+                "[LOOKUP] Calling LookupWorkflowIntegration.process_workflow_enrichment"
+            )
             enriched_output, was_enriched = (
                 LookupWorkflowIntegration.process_workflow_enrichment(
                     workflow_id=str(workflow.id),
@@ -1102,9 +1111,13 @@ def _try_lookup_enrichment(
                 )
             )
 
+            logger.info(
+                f"[LOOKUP] process_workflow_enrichment returned: was_enriched={was_enriched}"
+            )
+
             if was_enriched:
                 logger.info(
-                    f"Look-up enrichment applied for workflow {workflow.id}, "
+                    f"[LOOKUP] Look-up enrichment applied for workflow {workflow.id}, "
                     f"file execution {file_execution_id}"
                 )
                 # Convert back to string if needed for storage
@@ -1116,15 +1129,18 @@ def _try_lookup_enrichment(
 
             return output_result
 
-        except ImportError:
+        except ImportError as e:
             # Look-up module not available - gracefully skip
-            logger.debug("Look-up module not available, skipping enrichment")
+            logger.info(
+                f"[LOOKUP] Look-up module not available, skipping enrichment: {e}"
+            )
             return output_result
         except Exception as e:
             # Log error but don't fail the workflow
             logger.warning(
-                f"Look-up enrichment failed for workflow {workflow.id}, "
-                f"file execution {file_execution_id}: {e}"
+                f"[LOOKUP] Look-up enrichment failed for workflow {workflow.id}, "
+                f"file execution {file_execution_id}: {e}",
+                exc_info=True,
             )
             return output_result
 
diff --git a/frontend/src/components/custom-tools/combined-output/CombinedOutput.jsx b/frontend/src/components/custom-tools/combined-output/CombinedOutput.jsx
index abf0b12584..36c043d0d0 100644
--- a/frontend/src/components/custom-tools/combined-output/CombinedOutput.jsx
+++ b/frontend/src/components/custom-tools/combined-output/CombinedOutput.jsx
@@ -2,7 +2,7 @@ import "prismjs/components/prism-json";
 import "prismjs/plugins/line-numbers/prism-line-numbers.css";
 import "prismjs/plugins/line-numbers/prism-line-numbers.js";
 import "prismjs/themes/prism.css";
-import { useEffect, useState, useCallback, useRef } from "react";
+import { useEffect, useState, useCallback } from "react";
 import { useParams } from "react-router-dom";
 import PropTypes from "prop-types";
 
@@ -64,12 +64,6 @@ function CombinedOutput({ docId, setFilledFields, selectedPrompts }) {
   const [selectedProfile, setSelectedProfile] = useState(defaultLlmProfile);
   const [filteredCombinedOutput, setFilteredCombinedOutput] = useState({});
 
-  // Lookup enrichment state
-  const [isEnriching, setIsEnriching] = useState(false);
-  const [enrichmentResult, setEnrichmentResult] = useState(null);
-  const [hasLinkedLookups, setHasLinkedLookups] = useState(false);
-  const enrichmentCheckedRef = useRef(false);
-
   const { id } = useParams();
   const { sessionDetails } = useSessionStore();
   const { setAlertDetails } = useAlertStore();
@@ -103,90 +97,6 @@ function CombinedOutput({ docId, setFilledFields, selectedPrompts }) {
     setSelectedProfile(singlePassExtractMode ? defaultLlmProfile : null);
   }, [singlePassExtractMode]);
 
-  // Check if there are linked Look-Ups for this project
-  useEffect(() => {
-    if (isSimplePromptStudio || isPublicSource) return;
-
-    // Use id from URL params as fallback (same as tool_id)
-    const toolId = details?.tool_id || id;
-    if (!toolId || !sessionDetails?.orgId) return;
-
-    // Skip if already checked for this tool
-    if (enrichmentCheckedRef.current === toolId) return;
-
-    const checkLinkedLookups = async () => {
-      try {
-        const url = `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-links/?prompt_studio_project_id=${toolId}`;
-        const res = await axiosPrivate.get(url);
-        const links = res?.data?.results || res?.data || [];
-        setHasLinkedLookups(links.length > 0);
-        enrichmentCheckedRef.current = toolId;
-      } catch (err) {
-        // Silently fail - lookups may not be available
-        console.debug("Could not check for linked Look-Ups:", err);
-        setHasLinkedLookups(false);
-      }
-    };
-
-    checkLinkedLookups();
-  }, [details?.tool_id, id, sessionDetails?.orgId]);
-
-  // Reset enrichment when document changes
-  useEffect(() => {
-    setEnrichmentResult(null);
-  }, [docId]);
-
-  // Handler for enriching output with Look-Ups
-  const handleEnrichWithLookups = useCallback(async () => {
-    if (isEnriching || Object.keys(filteredCombinedOutput).length === 0) return;
-
-    setIsEnriching(true);
-    try {
-      const toolId = details?.tool_id || id;
-      const url = `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-debug/enrich_ps_output/`;
-
-      // Get fresh CSRF token from cookie
-      const csrfToken =
-        sessionDetails?.csrfToken ||
-        document.cookie
-          .split("; ")
-          .find((row) => row.startsWith("csrftoken="))
-          ?.split("=")[1];
-
-      const res = await axiosPrivate.post(
-        url,
-        {
-          prompt_studio_project_id: toolId,
-          extracted_data: filteredCombinedOutput,
-        },
-        {
-          headers: {
-            "X-CSRFToken": csrfToken,
-            "Content-Type": "application/json",
-          },
-        }
-      );
-
-      setEnrichmentResult(res.data);
-      setAlertDetails({
-        type: "success",
-        content: `Successfully enriched with ${
-          res.data._lookup_metadata?.lookups_executed || 0
-        } Look-Up(s)`,
-      });
-    } catch (err) {
-      setAlertDetails(handleException(err, "Failed to enrich with Look-Ups"));
-    } finally {
-      setIsEnriching(false);
-    }
-  }, [
-    filteredCombinedOutput,
-    details?.tool_id,
-    id,
-    sessionDetails?.orgId,
-    isEnriching,
-  ]);
-
   useEffect(() => {
     if (!docId || isSinglePassExtractLoading) return;
 
@@ -319,10 +229,6 @@ function CombinedOutput({ docId, setFilledFields, selectedPrompts }) {
       adapterData={adapterData}
       isSinglePass={singlePassExtractMode}
       isLoading={isOutputLoading}
-      onEnrichWithLookups={handleEnrichWithLookups}
-      isEnriching={isEnriching}
-      enrichmentResult={enrichmentResult}
-      hasLinkedLookups={hasLinkedLookups}
     />
   );
 }
diff --git a/frontend/src/components/custom-tools/combined-output/JsonView.jsx b/frontend/src/components/custom-tools/combined-output/JsonView.jsx
index f803bab378..8ef0caf885 100644
--- a/frontend/src/components/custom-tools/combined-output/JsonView.jsx
+++ b/frontend/src/components/custom-tools/combined-output/JsonView.jsx
@@ -1,9 +1,8 @@
 import PropTypes from "prop-types";
 import Prism from "prismjs";
-import { useEffect, useState } from "react";
+import { useEffect } from "react";
 import TabPane from "antd/es/tabs/TabPane";
-import { Tabs, Button, Tooltip, Badge } from "antd";
-import { ThunderboltOutlined, CheckCircleOutlined } from "@ant-design/icons";
+import { Tabs } from "antd";
 
 import { JsonViewBody } from "./JsonViewBody";
 
@@ -16,32 +15,10 @@ function JsonView({
   llmProfiles,
   isSinglePass,
   isLoading,
-  onEnrichWithLookups,
-  isEnriching,
-  enrichmentResult,
-  hasLinkedLookups,
 }) {
-  const [showEnriched, setShowEnriched] = useState(false);
-
   useEffect(() => {
     Prism.highlightAll();
-  }, [combinedOutput, enrichmentResult, showEnriched]);
-
-  // Determine what output to display
-  const displayOutput =
-    showEnriched && enrichmentResult?.enriched_data
-      ? enrichmentResult.enriched_data
-      : combinedOutput;
-
-  const handleEnrichClick = () => {
-    if (enrichmentResult) {
-      // Toggle between original and enriched view
-      setShowEnriched(!showEnriched);
-    } else if (onEnrichWithLookups) {
-      // Trigger enrichment
-      onEnrichWithLookups();
-    }
-  };
+  }, [combinedOutput]);
 
   return (
     <div className="combined-op-layout">
@@ -57,58 +34,14 @@ function JsonView({
             />
           ))}
         </Tabs>
-        <div className="combined-op-segment">
-          {hasLinkedLookups && onEnrichWithLookups && (
-            <Tooltip
-              title={
-                enrichmentResult
-                  ? showEnriched
-                    ? "Show original output"
-                    : "Show enriched output"
-                  : "Enrich output with linked Look-Ups"
-              }
-            >
-              <Badge
-                dot={enrichmentResult && !showEnriched}
-                status="success"
-                offset={[-2, 2]}
-              >
-                <Button
-                  type={showEnriched ? "primary" : "default"}
-                  size="small"
-                  icon={
-                    enrichmentResult ? (
-                      <CheckCircleOutlined />
-                    ) : (
-                      <ThunderboltOutlined />
-                    )
-                  }
-                  loading={isEnriching}
-                  onClick={handleEnrichClick}
-                  disabled={
-                    isLoading || Object.keys(combinedOutput).length === 0
-                  }
-                >
-                  {enrichmentResult
-                    ? showEnriched
-                      ? "Show Original"
-                      : "Show Enriched"
-                    : "Enrich with Look-Ups"}
-                </Button>
-              </Badge>
-            </Tooltip>
-          )}
-        </div>
       </div>
       <div className="combined-op-divider" />
       <JsonViewBody
         activeKey={activeKey}
         selectedProfile={selectedProfile}
         llmProfiles={llmProfiles}
-        combinedOutput={displayOutput}
+        combinedOutput={combinedOutput}
         isLoading={isLoading}
-        isEnriched={showEnriched}
-        enrichmentMetadata={enrichmentResult?._lookup_metadata}
       />
       <div className="gap" />
     </div>
@@ -124,10 +57,6 @@ JsonView.propTypes = {
   activeKey: PropTypes.string,
   isSinglePass: PropTypes.bool,
   isLoading: PropTypes.bool.isRequired,
-  onEnrichWithLookups: PropTypes.func,
-  isEnriching: PropTypes.bool,
-  enrichmentResult: PropTypes.object,
-  hasLinkedLookups: PropTypes.bool,
 };
 
 export { JsonView };
diff --git a/frontend/src/components/custom-tools/combined-output/JsonViewBody.jsx b/frontend/src/components/custom-tools/combined-output/JsonViewBody.jsx
index 2947a79e18..97ddcd212e 100644
--- a/frontend/src/components/custom-tools/combined-output/JsonViewBody.jsx
+++ b/frontend/src/components/custom-tools/combined-output/JsonViewBody.jsx
@@ -1,6 +1,4 @@
 import PropTypes from "prop-types";
-import { Tag, Space } from "antd";
-import { CheckCircleOutlined, ThunderboltOutlined } from "@ant-design/icons";
 
 import { ProfileInfoBar } from "../profile-info-bar/ProfileInfoBar";
 import { SpinnerLoader } from "../../widgets/spinner-loader/SpinnerLoader";
@@ -11,8 +9,6 @@ function JsonViewBody({
   llmProfiles,
   combinedOutput,
   isLoading,
-  isEnriched,
-  enrichmentMetadata,
 }) {
   if (isLoading) {
     return <SpinnerLoader />;
@@ -23,38 +19,6 @@ function JsonViewBody({
       {activeKey !== "0" && (
         <ProfileInfoBar profileId={selectedProfile} profiles={llmProfiles} />
       )}
-      {isEnriched && enrichmentMetadata && (
-        <div className="enrichment-info-bar">
-          <Space size="small">
-            <Tag icon={<ThunderboltOutlined />} color="success">
-              Enriched with Look-Ups
-            </Tag>
-            <Tag color="blue">
-              {enrichmentMetadata.lookups_executed} Look-Up
-              {enrichmentMetadata.lookups_executed !== 1 ? "s" : ""} executed
-            </Tag>
-            {enrichmentMetadata.lookup_details?.map((detail, idx) => (
-              <Tag
-                key={idx}
-                icon={
-                  detail.status === "success" ? (
-                    <CheckCircleOutlined />
-                  ) : undefined
-                }
-                color={
-                  detail.status === "success"
-                    ? "green"
-                    : detail.status === "error"
-                    ? "red"
-                    : "default"
-                }
-              >
-                {detail.project_name}
-              </Tag>
-            ))}
-          </Space>
-        </div>
-      )}
       <div className="combined-op-body code-snippet">
         {combinedOutput && (
           <pre className="line-numbers width-100">
@@ -74,8 +38,6 @@ JsonViewBody.propTypes = {
   llmProfiles: PropTypes.string,
   combinedOutput: PropTypes.object,
   isLoading: PropTypes.bool.isRequired,
-  isEnriched: PropTypes.bool,
-  enrichmentMetadata: PropTypes.object,
 };
 
 export { JsonViewBody };
diff --git a/frontend/src/components/custom-tools/display-logs/DisplayLogs.css b/frontend/src/components/custom-tools/display-logs/DisplayLogs.css
new file mode 100644
index 0000000000..cc13b17287
--- /dev/null
+++ b/frontend/src/components/custom-tools/display-logs/DisplayLogs.css
@@ -0,0 +1,57 @@
+/* DisplayLogs.css - Custom styles for display logs component */
+
+/* Row highlighting for lookup logs */
+.display-logs-row-lookup {
+  background-color: #f9f0ff;
+}
+
+.display-logs-row-lookup:hover {
+  background-color: #efdbff !important;
+}
+
+/* Stage tag styling */
+.display-logs-stage-tag {
+  font-size: 11px;
+  margin-right: 8px;
+}
+
+/* Stage-specific colors */
+.display-logs-stage-lookup {
+  border-color: #722ed1;
+}
+
+.display-logs-stage-run {
+  border-color: #1890ff;
+}
+
+.display-logs-stage-extract {
+  border-color: #52c41a;
+}
+
+.display-logs-stage-index {
+  border-color: #faad14;
+}
+
+/* Log message with stage indicator */
+.display-logs-message-container {
+  display: flex;
+  align-items: center;
+  gap: 8px;
+}
+
+/* Icon styling for different stages */
+.display-logs-icon-lookup {
+  color: #722ed1;
+}
+
+.display-logs-icon-run {
+  color: #1890ff;
+}
+
+.display-logs-icon-extract {
+  color: #52c41a;
+}
+
+.display-logs-icon-index {
+  color: #faad14;
+}
diff --git a/frontend/src/components/custom-tools/display-logs/DisplayLogs.jsx b/frontend/src/components/custom-tools/display-logs/DisplayLogs.jsx
index 1fa43cc0a3..487e89a1d3 100644
--- a/frontend/src/components/custom-tools/display-logs/DisplayLogs.jsx
+++ b/frontend/src/components/custom-tools/display-logs/DisplayLogs.jsx
@@ -1,11 +1,42 @@
 import { useEffect, useRef } from "react";
-import { Col, Row, Typography } from "antd";
+import { Col, Row, Tag, Typography } from "antd";
+import { SearchOutlined } from "@ant-design/icons";
 
 import "../../agency/display-logs/DisplayLogs.css";
+import "./DisplayLogs.css";
 import { useSocketCustomToolStore } from "../../../store/socket-custom-tool";
 import { getDateTimeString } from "../../../helpers/GetStaticData";
 import CustomMarkdown from "../../helpers/custom-markdown/CustomMarkdown";
 
+/**
+ * Get stage-specific styling for log entries.
+ * LOOKUP stage uses purple color scheme for visual distinction.
+ */
+const getStageStyle = (stage) => {
+  switch (stage) {
+    case "LOOKUP":
+      return {
+        color: "purple",
+        className: "display-logs-stage-lookup",
+      };
+    case "RUN":
+      return {
+        color: "blue",
+        className: "display-logs-stage-run",
+      };
+    case "TOOL":
+      return {
+        color: "cyan",
+        className: "display-logs-stage-tool",
+      };
+    default:
+      return {
+        color: "default",
+        className: "display-logs-stage-default",
+      };
+  }
+};
+
 function DisplayLogs() {
   const bottomRef = useRef(null);
   const { messages } = useSocketCustomToolStore();
@@ -20,10 +51,14 @@ function DisplayLogs() {
   return (
     <div className="tool-logs">
       {messages.map((message) => {
+        const stageStyle = getStageStyle(message?.stage);
+        const isLookupLog = message?.stage === "LOOKUP";
+        const rowClassName = isLookupLog ? "display-logs-row-lookup" : "";
+
         return (
-          <div key={message?.timestamp}>
+          <div key={message?.timestamp} className={rowClassName}>
             <Row>
-              <Col span={5}>
+              <Col span={4}>
                 <Typography className="display-logs-col-first">
                   {getDateTimeString(message?.timestamp)}
                 </Typography>
@@ -34,21 +69,35 @@ function DisplayLogs() {
                 </Typography>
               </Col>
               <Col span={2}>
-                <Typography className="display-logs-col">
-                  {message?.state}
-                </Typography>
+                {message?.stage ? (
+                  <Tag
+                    color={stageStyle.color}
+                    className="display-logs-stage-tag"
+                  >
+                    {isLookupLog && (
+                      <SearchOutlined style={{ marginRight: 4 }} />
+                    )}
+                    {message?.stage}
+                  </Tag>
+                ) : (
+                  <Typography className="display-logs-col">
+                    {message?.state}
+                  </Typography>
+                )}
               </Col>
               <Col span={3}>
                 <Typography className="display-logs-col">
-                  {message?.component?.prompt_key}
+                  {message?.component?.prompt_key ||
+                    message?.component?.lookup_project ||
+                    ""}
                 </Typography>
               </Col>
               <Col span={3}>
                 <Typography className="display-logs-col">
-                  {message?.component?.doc_name}
+                  {message?.component?.doc_name || ""}
                 </Typography>
               </Col>
-              <Col span={8}>
+              <Col span={10}>
                 <CustomMarkdown
                   text={message?.message}
                   styleClassName="display-logs-col"
diff --git a/frontend/src/components/custom-tools/prompt-card/LookupReplacementIndicator.css b/frontend/src/components/custom-tools/prompt-card/LookupReplacementIndicator.css
new file mode 100644
index 0000000000..167687cb9b
--- /dev/null
+++ b/frontend/src/components/custom-tools/prompt-card/LookupReplacementIndicator.css
@@ -0,0 +1,74 @@
+.lookup-indicator-btn {
+  margin-right: 4px;
+}
+
+.lookup-indicator-icon {
+  color: #52c41a;
+}
+
+.lookup-replacement-popover .ant-popover-inner {
+  padding: 0;
+}
+
+.lookup-replacement-content {
+  padding: 12px;
+  min-width: 220px;
+  max-width: 350px;
+}
+
+.lookup-replacement-header {
+  display: flex;
+  align-items: center;
+  gap: 8px;
+  margin-bottom: 12px;
+  padding-bottom: 8px;
+  border-bottom: 1px solid #f0f0f0;
+}
+
+.lookup-replacement-icon {
+  color: #52c41a;
+  font-size: 14px;
+}
+
+.lookup-replacement-details {
+  display: flex;
+  flex-direction: column;
+  gap: 4px;
+}
+
+.lookup-replacement-row {
+  display: flex;
+  flex-direction: column;
+  gap: 2px;
+}
+
+.lookup-replacement-label {
+  font-size: 11px;
+  text-transform: uppercase;
+}
+
+.lookup-replacement-value {
+  font-family: monospace;
+  font-size: 12px;
+  padding: 4px 8px;
+  border-radius: 4px;
+  word-break: break-word;
+}
+
+.lookup-replacement-value.original {
+  background-color: #fff1f0;
+  color: #cf1322;
+  text-decoration: line-through;
+}
+
+.lookup-replacement-value.enriched {
+  background-color: #f6ffed;
+  color: #389e0d;
+}
+
+.lookup-replacement-arrow {
+  display: flex;
+  justify-content: center;
+  padding: 4px 0;
+  color: #8c8c8c;
+}
diff --git a/frontend/src/components/custom-tools/prompt-card/LookupReplacementIndicator.jsx b/frontend/src/components/custom-tools/prompt-card/LookupReplacementIndicator.jsx
new file mode 100644
index 0000000000..d06ea91f1a
--- /dev/null
+++ b/frontend/src/components/custom-tools/prompt-card/LookupReplacementIndicator.jsx
@@ -0,0 +1,74 @@
+import { SwapOutlined } from "@ant-design/icons";
+import { Button, Popover, Typography } from "antd";
+import PropTypes from "prop-types";
+
+import "./LookupReplacementIndicator.css";
+
+const { Text } = Typography;
+
+function LookupReplacementIndicator({ lookupReplacement }) {
+  if (!lookupReplacement) {
+    return null;
+  }
+
+  const { original_value: originalValue, enriched_value: enrichedValue } =
+    lookupReplacement;
+
+  const content = (
+    <div className="lookup-replacement-content">
+      <div className="lookup-replacement-header">
+        <SwapOutlined className="lookup-replacement-icon" />
+        <Text strong>Look-up Replacement</Text>
+      </div>
+      <div className="lookup-replacement-details">
+        <div className="lookup-replacement-row">
+          <Text type="secondary" className="lookup-replacement-label">
+            Original:
+          </Text>
+          <Text className="lookup-replacement-value original">
+            {originalValue || "(empty)"}
+          </Text>
+        </div>
+        <div className="lookup-replacement-arrow">
+          <SwapOutlined rotate={90} />
+        </div>
+        <div className="lookup-replacement-row">
+          <Text type="secondary" className="lookup-replacement-label">
+            Replaced:
+          </Text>
+          <Text className="lookup-replacement-value enriched">
+            {enrichedValue || "(empty)"}
+          </Text>
+        </div>
+      </div>
+    </div>
+  );
+
+  return (
+    <Popover
+      content={content}
+      title={null}
+      trigger="hover"
+      placement="top"
+      overlayClassName="lookup-replacement-popover"
+    >
+      <Button
+        size="small"
+        type="text"
+        className="prompt-card-action-button lookup-indicator-btn"
+      >
+        <SwapOutlined className="prompt-card-actions-head lookup-indicator-icon" />
+      </Button>
+    </Popover>
+  );
+}
+
+LookupReplacementIndicator.propTypes = {
+  lookupReplacement: PropTypes.shape({
+    original_value: PropTypes.oneOfType([PropTypes.string, PropTypes.any]),
+    enriched_value: PropTypes.oneOfType([PropTypes.string, PropTypes.any]),
+    field_name: PropTypes.string,
+  }),
+};
+
+export { LookupReplacementIndicator };
diff --git a/frontend/src/components/custom-tools/prompt-card/PromptOutput.jsx b/frontend/src/components/custom-tools/prompt-card/PromptOutput.jsx
index 3286db0799..1dfc0cc6b7 100644
--- a/frontend/src/components/custom-tools/prompt-card/PromptOutput.jsx
+++ b/frontend/src/components/custom-tools/prompt-card/PromptOutput.jsx
@@ -35,6 +35,7 @@ import { DisplayPromptResult } from "./DisplayPromptResult";
 import usePromptOutput from "../../../hooks/usePromptOutput";
 import { PromptRunTimer } from "./PromptRunTimer";
 import { PromptRunCost } from "./PromptRunCost";
+import { LookupReplacementIndicator } from "./LookupReplacementIndicator";
 
 let TableOutput;
 try {
@@ -112,6 +113,9 @@ function PromptOutput({
             setOpenExpandModal={setOpenExpandModal}
           />
           <div className="prompt-profile-run">
+            <LookupReplacementIndicator
+              lookupReplacement={promptOutputData?.lookupReplacement}
+            />
             <CopyPromptOutputBtn
               copyToClipboard={() =>
                 copyOutputToClipboard(
@@ -204,6 +208,9 @@ function PromptOutput({
             }
           />
           <div className="prompt-profile-run">
+            <LookupReplacementIndicator
+              lookupReplacement={promptOutputData?.lookupReplacement}
+            />
             <CopyPromptOutputBtn
               isDisabled={isTableExtraction}
               copyToClipboard={() =>
@@ -439,6 +446,11 @@ function PromptOutput({
                           promptDetails={promptDetails}
                         />
                         <div className="prompt-profile-run">
+                          <LookupReplacementIndicator
+                            lookupReplacement={
+                              promptOutputData?.lookupReplacement
+                            }
+                          />
                           <CopyPromptOutputBtn
                             isDisabled={isTableExtraction}
                             copyToClipboard={() =>
diff --git a/frontend/src/components/logging/log-modal/LogModal.css b/frontend/src/components/logging/log-modal/LogModal.css
index b2ed5754b8..ca9c6ed7cb 100644
--- a/frontend/src/components/logging/log-modal/LogModal.css
+++ b/frontend/src/components/logging/log-modal/LogModal.css
@@ -1,4 +1,30 @@
-.clear-button{
-    margin-left: 50px;
-    margin-top: 10px;
+.clear-button {
+  margin-left: 50px;
+  margin-top: 10px;
+}
+
+/* Stage-specific row styling */
+.log-modal-row-lookup {
+  background-color: #f9f0ff;
+}
+
+.log-modal-row-lookup:hover td {
+  background-color: #efdbff !important;
+}
+
+/* Log level styling */
+.info {
+  color: #1890ff;
+}
+
+.warn {
+  color: #faad14;
+}
+
+.debug {
+  color: #8c8c8c;
+}
+
+.error {
+  color: #ff4d4f;
 }
diff --git a/frontend/src/components/logging/log-modal/LogModal.jsx b/frontend/src/components/logging/log-modal/LogModal.jsx
index 61e5aed121..2773f4fb68 100644
--- a/frontend/src/components/logging/log-modal/LogModal.jsx
+++ b/frontend/src/components/logging/log-modal/LogModal.jsx
@@ -1,6 +1,7 @@
-import { Modal, Table, Tooltip } from "antd";
+import { Modal, Table, Tag, Tooltip } from "antd";
 import { useEffect, useState } from "react";
 import PropTypes from "prop-types";
+import { SearchOutlined } from "@ant-design/icons";
 
 import "./LogModal.css";
 import { useExceptionHandler } from "../../../hooks/useExceptionHandler";
@@ -36,6 +37,22 @@ function LogModal({
   });
   const filterOptions = ["INFO", "WARN", "DEBUG", "ERROR"];
 
+  // Get stage-specific styling for visual differentiation
+  const getStageStyle = (stage) => {
+    switch (stage) {
+      case "LOOKUP":
+        return { color: "purple", icon: <SearchOutlined /> };
+      case "RUN":
+        return { color: "blue", icon: null };
+      case "EXTRACT":
+        return { color: "green", icon: null };
+      case "INDEX":
+        return { color: "orange", icon: null };
+      default:
+        return { color: "default", icon: null };
+    }
+  };
+
   const fetchExecutionFileLogs = async (executionId, fileId, page) => {
     try {
       const url = getUrl(`/execution/${executionId}/logs/`);
@@ -96,6 +113,14 @@ function LogModal({
       title: "Event Stage",
       dataIndex: "eventStage",
       key: "stage",
+      render: (stage) => {
+        const stageStyle = getStageStyle(stage);
+        return (
+          <Tag color={stageStyle.color} icon={stageStyle.icon}>
+            {stage}
+          </Tag>
+        );
+      },
     },
     {
       title: "Log Level",
@@ -170,6 +195,12 @@ function LogModal({
         loading={loading}
         onChange={handleTableChange}
         sortDirections={["ascend", "descend", "ascend"]}
+        rowClassName={(record) => {
+          if (record.eventStage === "LOOKUP") {
+            return "log-modal-row-lookup";
+          }
+          return "";
+        }}
       />
     </Modal>
   );
diff --git a/frontend/src/hooks/usePromptOutput.js b/frontend/src/hooks/usePromptOutput.js
index ec09be105a..1e3221183c 100644
--- a/frontend/src/hooks/usePromptOutput.js
+++ b/frontend/src/hooks/usePromptOutput.js
@@ -146,6 +146,8 @@ const usePromptOutput = () => {
         // Lookup enrichment data
         lookupEnrichment: item?.lookup_enrichment,
         lookupMetadata: item?._lookup_metadata,
+        // Lookup replacement info for UI indicator
+        lookupReplacement: item?.lookup_replacement,
       };
 
       if (item?.is_single_pass_extract && isTokenUsageForSinglePassAdded)
diff --git a/unstract/workflow-execution/src/unstract/workflow_execution/enums.py b/unstract/workflow-execution/src/unstract/workflow_execution/enums.py
index a87e57df4d..74feec5aa2 100644
--- a/unstract/workflow-execution/src/unstract/workflow_execution/enums.py
+++ b/unstract/workflow-execution/src/unstract/workflow_execution/enums.py
@@ -27,6 +27,7 @@ class LogStage(Enum):
         SUCCESS (str): The state when the execution is successful.
         ERROR (str): The state when an error occurs in the workflow.
         MESSAGE (str): The state when a message is being logged.
+        LOOKUP (str): The state when Look-up enrichment is being executed.
     """
 
     COMPILE = "COMPILE"
@@ -38,6 +39,7 @@ class LogStage(Enum):
     INITIALIZE = "INITIALIZE"
     FINALIZE = "FINALIZE"
     PROCESSING = "PROCESSING"
+    LOOKUP = "LOOKUP"
 
 
 class LogState(Enum):

From d6ac066636a80a04d666618e6caeff519d6b0eaf Mon Sep 17 00:00:00 2001
From: gayathrivijayakumar <gayathri@zipstack.com>
Date: Tue, 13 Jan 2026 13:39:40 +0530
Subject: [PATCH 07/22] Chunk size 0 fix

---
 backend/lookup/exceptions.py                  | 27 ++++++
 .../integrations/unstract_llm_client.py       | 82 +++++++++++++++++++
 backend/lookup/serializers.py                 | 30 +++++++
 backend/lookup/services/log_emitter.py        | 38 +++++++++
 backend/lookup/services/lookup_executor.py    | 29 +++++++
 .../ProfileFormModal.jsx                      |  8 +-
 6 files changed, 211 insertions(+), 3 deletions(-)

diff --git a/backend/lookup/exceptions.py b/backend/lookup/exceptions.py
index 70d09a4bb3..4e24b3c7dd 100644
--- a/backend/lookup/exceptions.py
+++ b/backend/lookup/exceptions.py
@@ -58,3 +58,30 @@ class DefaultProfileError(LookupError):
     """
 
     pass
+
+
+class ContextWindowExceededError(LookupError):
+    """Raised when prompt + reference data exceeds LLM context window.
+
+    This exception is raised when the combined size of the prompt template,
+    reference data, and extracted data exceeds the configured LLM's context
+    window limit.
+    """
+
+    def __init__(self, token_count: int, context_limit: int, model: str):
+        """Initialize the exception.
+
+        Args:
+            token_count: Number of tokens in the prompt
+            context_limit: Maximum tokens allowed by the model
+            model: Name of the LLM model
+        """
+        self.token_count = token_count
+        self.context_limit = context_limit
+        self.model = model
+        message = (
+            f"Context window exceeded: prompt requires {token_count:,} tokens "
+            f"but {model} has a limit of {context_limit:,} tokens. "
+            f"Reduce reference data size or use a model with larger context window."
+        )
+        super().__init__(message)
diff --git a/backend/lookup/integrations/unstract_llm_client.py b/backend/lookup/integrations/unstract_llm_client.py
index 48baf8484b..f18e9c2844 100644
--- a/backend/lookup/integrations/unstract_llm_client.py
+++ b/backend/lookup/integrations/unstract_llm_client.py
@@ -9,7 +9,11 @@
 from typing import Any, Protocol
 
 from adapter_processor_v2.models import AdapterInstance
+from litellm import get_max_tokens, token_counter
 
+from lookup.exceptions import ContextWindowExceededError
+from unstract.sdk1.adapters.constants import Common
+from unstract.sdk1.adapters.llm1 import adapters
 from unstract.sdk1.llm import LLM
 
 logger = logging.getLogger(__name__)
@@ -30,6 +34,11 @@ class UnstractLLMClient(LLMClient):
     to generate enrichment data for Look-Ups.
     """
 
+    # Reserve tokens for LLM response output
+    RESERVED_OUTPUT_TOKENS = 2048
+    # Default context window if we can't determine the model's limit
+    DEFAULT_CONTEXT_WINDOW = 4096
+
     def __init__(self, adapter_instance: AdapterInstance):
         """Initialize the LLM client with an adapter instance.
 
@@ -41,6 +50,75 @@ def __init__(self, adapter_instance: AdapterInstance):
         self.adapter_id = adapter_instance.adapter_id
         self.adapter_metadata = adapter_instance.metadata  # Decrypted metadata
 
+        # Initialize model info for context validation
+        self._model_name = self._get_model_name()
+        self._context_limit = self._get_context_limit()
+
+    def _get_model_name(self) -> str:
+        """Get the model name from adapter metadata.
+
+        Returns:
+            The model name string used by litellm
+        """
+        try:
+            adapter = adapters[self.adapter_id][Common.MODULE]
+            return adapter.validate_model(self.adapter_metadata)
+        except Exception as e:
+            logger.warning(f"Failed to get model name: {e}")
+            return "unknown"
+
+    def _get_context_limit(self) -> int:
+        """Get context window limit for the configured LLM.
+
+        Returns:
+            Maximum number of tokens the model can handle
+        """
+        try:
+            return get_max_tokens(self._model_name)
+        except Exception as e:
+            logger.warning(
+                f"Failed to get context limit for {self._model_name}: {e}. "
+                f"Using default: {self.DEFAULT_CONTEXT_WINDOW}"
+            )
+            return self.DEFAULT_CONTEXT_WINDOW
+
+    def validate_context_size(self, prompt: str) -> None:
+        """Validate that the prompt fits within the LLM's context window.
+
+        This method counts the tokens in the prompt and compares against
+        the model's context window limit, accounting for reserved output tokens.
+
+        Args:
+            prompt: The complete prompt to send to the LLM
+
+        Raises:
+            ContextWindowExceededError: If the prompt exceeds the context limit
+        """
+        try:
+            # Count tokens using litellm's accurate counter
+            messages = [{"role": "user", "content": prompt}]
+            token_count = token_counter(model=self._model_name, messages=messages)
+        except Exception as e:
+            # Fallback to rough estimation if token counting fails
+            logger.warning(f"Token counting failed, using estimation: {e}")
+            token_count = len(prompt) // 4  # Rough estimate: ~4 chars per token
+
+        # Account for reserved output tokens
+        available_tokens = self._context_limit - self.RESERVED_OUTPUT_TOKENS
+
+        logger.debug(
+            f"Context validation: {token_count:,} tokens in prompt, "
+            f"{available_tokens:,} available (limit: {self._context_limit:,}, "
+            f"reserved: {self.RESERVED_OUTPUT_TOKENS})"
+        )
+
+        if token_count > available_tokens:
+            raise ContextWindowExceededError(
+                token_count=token_count,
+                context_limit=available_tokens,
+                model=self._model_name,
+            )
+
     def generate(self, prompt: str, config: dict[str, Any], timeout: int = 30) -> str:
         """Generate LLM response for Look-Up enrichment.
 
@@ -53,8 +131,12 @@ def generate(self, prompt: str, config: dict[str, Any], timeout: int = 30) -> st
             JSON-formatted string with enrichment data
 
         Raises:
+            ContextWindowExceededError: If prompt exceeds context window
             RuntimeError: If LLM call fails
         """
+        # Validate context size before calling LLM
+        self.validate_context_size(prompt)
+
         try:
             # Create LLM instance using SDK
             llm = LLM(adapter_id=self.adapter_id, adapter_metadata=self.adapter_metadata)
diff --git a/backend/lookup/serializers.py b/backend/lookup/serializers.py
index 7aa8d09f25..5c30e8ac0e 100644
--- a/backend/lookup/serializers.py
+++ b/backend/lookup/serializers.py
@@ -202,6 +202,7 @@ class Meta:
             "lookup_project_name",
             "prompt_studio_project_id",
             "execution_id",
+            "file_execution_id",
             "input_data",
             "enriched_output",
             "reference_data_version",
@@ -220,6 +221,35 @@ class Meta:
         read_only_fields = fields  # All fields are read-only for audit records
 
 
+class LookupExecutionAuditSummarySerializer(serializers.ModelSerializer):
+    """Lightweight serializer for lookup audit summaries in log views.
+
+    Used by the Nav Bar Logs page to show lookup enrichment details
+    without the full prompt/response content.
+    """
+
+    lookup_project_name = serializers.CharField(
+        source="lookup_project.name", read_only=True
+    )
+
+    class Meta:
+        model = LookupExecutionAudit
+        fields = [
+            "id",
+            "lookup_project",
+            "lookup_project_name",
+            "execution_id",
+            "file_execution_id",
+            "status",
+            "llm_response_cached",
+            "execution_time_ms",
+            "confidence_score",
+            "error_message",
+            "executed_at",
+        ]
+        read_only_fields = fields
+
+
 class LookupExecutionRequestSerializer(serializers.Serializer):
     """Serializer for Look-Up execution requests."""
 
diff --git a/backend/lookup/services/log_emitter.py b/backend/lookup/services/log_emitter.py
index 2fc9fd4551..47e636529f 100644
--- a/backend/lookup/services/log_emitter.py
+++ b/backend/lookup/services/log_emitter.py
@@ -272,6 +272,44 @@ def emit_enrichment_failure(
             error_message=error_message,
         )
 
+    def emit_context_overflow_error(
+        self,
+        lookup_project_name: str,
+        token_count: int,
+        context_limit: int,
+        model: str,
+    ) -> None:
+        """Emit log when context window is exceeded.
+
+        This provides a clear, actionable error message when the prompt
+        (reference data + template + extracted data) exceeds the LLM's
+        context window limit.
+
+        Args:
+            lookup_project_name: Name of the Look-up project
+            token_count: Number of tokens in the prompt
+            context_limit: Maximum tokens allowed by the model
+            model: Name of the LLM model
+        """
+        message = (
+            f"Look-Up '{lookup_project_name}' failed: Context window exceeded - "
+            f"prompt requires {token_count:,} tokens but {model} limit is "
+            f"{context_limit:,} tokens. Reduce reference data size or use a "
+            f"model with larger context window."
+        )
+
+        self.emit_log(
+            level=LogLevel.ERROR.value,
+            state="FAILED",
+            message=message,
+            lookup_project_name=lookup_project_name,
+            error_type="context_window_exceeded",
+            token_count=token_count,
+            context_limit=context_limit,
+            model=model,
+            suggestion="Reduce reference data or use larger context model",
+        )
+
     def emit_enrichment_partial(
         self,
         lookup_project_name: str,
diff --git a/backend/lookup/services/lookup_executor.py b/backend/lookup/services/lookup_executor.py
index 05fe91b86f..c2d79d8958 100644
--- a/backend/lookup/services/lookup_executor.py
+++ b/backend/lookup/services/lookup_executor.py
@@ -12,6 +12,7 @@
 from typing import Any, Protocol
 
 from lookup.exceptions import (
+    ContextWindowExceededError,
     ExtractionNotCompleteError,
     ParseError,
     TemplateNotFoundError,
@@ -257,6 +258,34 @@ def execute(
                 if self.cache and cache_key:
                     self.cache.set(cache_key, llm_response)
 
+            except ContextWindowExceededError as e:
+                # Context window exceeded - provide clear actionable error
+                error_msg = (
+                    f"Context window exceeded: prompt requires {e.token_count:,} "
+                    f"tokens but {e.model} limit is {e.context_limit:,} tokens. "
+                    f"Reduce reference data size or use a model with larger "
+                    f"context window."
+                )
+                result = self._failed_result(lookup_project, error_msg, start_time)
+                self._log_audit(
+                    exec_id,
+                    lookup_project,
+                    prompt_studio_project_id,
+                    input_data,
+                    reference_data_version,
+                    llm_provider,
+                    llm_model,
+                    resolved_prompt,
+                    None,
+                    None,
+                    "failed",
+                    None,
+                    result["execution_time_ms"],
+                    None,
+                    False,
+                    error_msg,
+                )
+                return result
             except TimeoutError as e:
                 result = self._failed_result(
                     lookup_project, f"LLM request timed out: {str(e)}", start_time
diff --git a/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx b/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx
index 4459480972..918fb59073 100644
--- a/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx
+++ b/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx
@@ -357,16 +357,18 @@ function ProfileFormModal({ projectId, profileId, onClose }) {
                   { required: true, message: "Please enter chunk size" },
                   {
                     type: "number",
-                    min: 100,
+                    min: 0,
                     max: 10000,
-                    message: "Chunk size must be between 100 and 10000",
+                    message:
+                      "Chunk size must be between 0 and 10000 (0 = full context mode)",
                   },
                 ]}
+                tooltip="Set to 0 to use full context mode (no chunking)"
               >
                 <InputNumber
                   style={{ width: "100%" }}
                   placeholder="1000"
-                  min={100}
+                  min={0}
                   max={10000}
                 />
               </Form.Item>

From 65763a2092a61ddacb5e3a5d37963f776816cb75 Mon Sep 17 00:00:00 2001
From: gayathrivijayakumar <gayathri@zipstack.com>
Date: Wed, 14 Jan 2026 22:20:34 +0530
Subject: [PATCH 08/22] Fix RAG retrieval issues

---
 backend/lookup/exceptions.py                  |  10 +
 backend/lookup/services/lookup_executor.py    | 140 +++++++++-
 .../services/lookup_integration_service.py    |   3 +
 .../services/lookup_retrieval_service.py      | 262 ++++++++++++++++++
 backend/lookup/services/variable_resolver.py  |  11 +
 backend/lookup/views.py                       | 256 ++++++++++++++---
 .../output_manager_helper.py                  |   6 +
 7 files changed, 644 insertions(+), 44 deletions(-)
 create mode 100644 backend/lookup/services/lookup_retrieval_service.py

diff --git a/backend/lookup/exceptions.py b/backend/lookup/exceptions.py
index 4e24b3c7dd..3a8999eda2 100644
--- a/backend/lookup/exceptions.py
+++ b/backend/lookup/exceptions.py
@@ -85,3 +85,13 @@ def __init__(self, token_count: int, context_limit: int, model: str):
             f"Reduce reference data size or use a model with larger context window."
         )
         super().__init__(message)
+
+
+class RetrievalError(LookupError):
+    """Raised when RAG retrieval fails.
+
+    This exception is raised when the vector similarity search fails
+    to retrieve context from indexed reference data.
+    """
+
+    pass
diff --git a/backend/lookup/services/lookup_executor.py b/backend/lookup/services/lookup_executor.py
index c2d79d8958..fb16598476 100644
--- a/backend/lookup/services/lookup_executor.py
+++ b/backend/lookup/services/lookup_executor.py
@@ -17,8 +17,9 @@
     ParseError,
     TemplateNotFoundError,
 )
-from lookup.models import LookupProject
+from lookup.models import LookupProfileManager, LookupProject
 from lookup.services.audit_logger import AuditLogger
+from lookup.services.lookup_retrieval_service import LookupRetrievalService
 
 logger = logging.getLogger(__name__)
 
@@ -45,6 +46,7 @@ def __init__(
         cache_manager,
         reference_loader,
         llm_client: LLMClient,
+        org_id: str | None = None,
     ):
         """Initialize the Look-Up executor.
 
@@ -53,11 +55,14 @@ def __init__(
             cache_manager: LLMResponseCache instance
             reference_loader: ReferenceDataLoader instance
             llm_client: LLM provider client implementing LLMClient protocol
+            org_id: Organization ID for multi-tenancy (used in RAG retrieval)
         """
         self.variable_resolver_class = variable_resolver
         self.cache = cache_manager
         self.ref_loader = reference_loader
         self.llm_client = llm_client
+        self.org_id = org_id
+        logger.info(f"LookUpExecutor initialized with org_id='{org_id}'")
 
     def execute(
         self,
@@ -108,13 +113,57 @@ def execute(
         _cached = False  # noqa F841
 
         try:
-            # Step 1: Load reference data
+            # Step 1: Load reference data (RAG or full context based on chunk_size)
             try:
-                reference_data_dict = self.ref_loader.load_latest_for_project(
-                    lookup_project.id
+                # Get the default profile to check chunk_size
+                profile = LookupProfileManager.get_default_profile(lookup_project)
+
+                # Log profile configuration for debugging
+                logger.info(
+                    f"Profile config for {lookup_project.name}: "
+                    f"chunk_size={profile.chunk_size}, "
+                    f"chunk_overlap={profile.chunk_overlap}, "
+                    f"similarity_top_k={profile.similarity_top_k}, "
+                    f"vector_store={profile.vector_store.id}, "
+                    f"embedding_model={profile.embedding_model.id}"
                 )
-                reference_data = reference_data_dict["content"]
-                reference_data_version = reference_data_dict.get("version", 1)
+
+                if profile.chunk_size > 0:
+                    # RAG Mode: Retrieve relevant chunks from vector DB
+                    logger.info(
+                        f"Using RAG mode (chunk_size={profile.chunk_size}) "
+                        f"for project {lookup_project.name}"
+                    )
+                    reference_data = self._retrieve_rag_context(
+                        lookup_project=lookup_project,
+                        profile=profile,
+                        input_data=input_data,
+                    )
+                    reference_data_version = 1  # RAG mode doesn't have versions
+                    logger.info(
+                        f"RAG retrieval returned {len(reference_data)} chars "
+                        f"for project {lookup_project.name}"
+                    )
+
+                    # Warn if RAG returned empty - likely indexing issue
+                    if not reference_data.strip():
+                        logger.warning(
+                            f"RAG returned EMPTY context for project {lookup_project.name}. "
+                            "Check: 1) Data sources are uploaded, 2) Extraction completed, "
+                            "3) Indexing completed with chunk_size > 0"
+                        )
+                else:
+                    # Full Context Mode: Load all reference data (existing behavior)
+                    logger.info(
+                        f"Using full context mode (chunk_size=0) "
+                        f"for project {lookup_project.name}"
+                    )
+                    reference_data_dict = self.ref_loader.load_latest_for_project(
+                        lookup_project.id
+                    )
+                    reference_data = reference_data_dict["content"]
+                    reference_data_version = reference_data_dict.get("version", 1)
+
             except ExtractionNotCompleteError as e:
                 result = self._failed_result(
                     lookup_project,
@@ -414,6 +463,85 @@ def execute(
             )
             return result
 
+    def _retrieve_rag_context(
+        self,
+        lookup_project: LookupProject,
+        profile: LookupProfileManager,
+        input_data: dict[str, Any],
+    ) -> str:
+        """Retrieve context using RAG when chunk_size > 0.
+
+        Builds a semantic query from input_data and retrieves relevant
+        chunks from the vector DB using similarity search.
+
+        Args:
+            lookup_project: The lookup project being executed
+            profile: Profile with RAG configuration (vector store, embeddings, etc.)
+            input_data: Input data to build the retrieval query from
+
+        Returns:
+            Retrieved context as a string (concatenated chunks)
+        """
+        query = self._build_retrieval_query(input_data)
+
+        retrieval_service = LookupRetrievalService(profile, org_id=self.org_id)
+        context = retrieval_service.retrieve_context(
+            query=query,
+            project_id=str(lookup_project.id),
+        )
+
+        if not context:
+            logger.warning(
+                f"RAG retrieval returned empty for project {lookup_project.id}. "
+                "Ensure data sources are indexed with chunk_size > 0."
+            )
+
+        return context
+
+    def _build_retrieval_query(self, input_data: dict[str, Any]) -> str:
+        """Build retrieval query from input data fields with semantic context.
+
+        Includes field names with values to preserve semantic meaning for
+        vector similarity search. This allows the embedding model to understand
+        the context of each value (e.g., "vendor: Slack" vs just "Slack").
+
+        Args:
+            input_data: Dictionary of extracted input fields
+
+        Returns:
+            Query string for vector retrieval with field context
+
+        Example:
+            >>> executor._build_retrieval_query({"vendor": "Slack", "type": "SaaS"})
+            'vendor: Slack, type: SaaS'
+        """
+        query_parts = []
+
+        for key, value in input_data.items():
+            if value is not None:
+                # Include field name to preserve semantic context
+                if isinstance(value, dict):
+                    # For nested dicts, include key-value pairs
+                    nested_parts = [f"{k}: {v}" for k, v in value.items() if v]
+                    if nested_parts:
+                        query_parts.append(f"{key}: {', '.join(nested_parts)}")
+                elif isinstance(value, list):
+                    # For lists, join values with the field name
+                    list_values = [str(v) for v in value if v]
+                    if list_values:
+                        query_parts.append(f"{key}: {', '.join(list_values)}")
+                else:
+                    # Simple key-value pair
+                    query_parts.append(f"{key}: {value}")
+
+        query = ", ".join(query_parts)
+
+        if not query.strip():
+            query = "find relevant reference data"
+
+        logger.info(f"Built retrieval query: {query[:200]}...")
+        return query
+
     def _log_audit(
         self,
         execution_id: str,
diff --git a/backend/lookup/services/lookup_integration_service.py b/backend/lookup/services/lookup_integration_service.py
index b6974386b2..e852e0a8b2 100644
--- a/backend/lookup/services/lookup_integration_service.py
+++ b/backend/lookup/services/lookup_integration_service.py
@@ -192,6 +192,7 @@ def _execute_enrichment(
                 execution_id=run_id or str(uuid.uuid4()),
                 prompt_studio_project_id=prompt_studio_project_id,
                 log_emitter=log_emitter,
+                organization_id=organization_id,
             )
             result = future.result(timeout=timeout)
 
@@ -216,6 +217,7 @@ def _run_orchestrator(
         execution_id: str,
         prompt_studio_project_id: str,
         log_emitter: Any = None,
+        organization_id: str | None = None,
     ) -> dict[str, Any]:
         """Execute the lookup orchestrator for all linked projects."""
         from lookup.integrations.file_storage_client import FileStorageClient
@@ -281,6 +283,7 @@ def _run_orchestrator(
                 cache_manager=cache,
                 reference_loader=ref_loader,
                 llm_client=LLMClientWrapper(llm_client),
+                org_id=organization_id,
             )
 
             # Create orchestrator with log emitter for WebSocket logs
diff --git a/backend/lookup/services/lookup_retrieval_service.py b/backend/lookup/services/lookup_retrieval_service.py
new file mode 100644
index 0000000000..efb0673f47
--- /dev/null
+++ b/backend/lookup/services/lookup_retrieval_service.py
@@ -0,0 +1,262 @@
+"""RAG retrieval service for Lookup projects using similarity search with ranking.
+
+This module provides functionality to retrieve relevant context chunks from
+indexed reference data using vector similarity search. Chunks are ranked by
+similarity score and annotated with source information for better context.
+"""
+
+import logging
+from dataclasses import dataclass
+from typing import TYPE_CHECKING
+
+from llama_index.core.vector_stores import ExactMatchFilter, MetadataFilters
+from prompt_studio.prompt_studio_core_v2.prompt_ide_base_tool import PromptIdeBaseTool
+from utils.user_context import UserContext
+
+from lookup.models import LookupIndexManager
+
+if TYPE_CHECKING:
+    from lookup.models import LookupProfileManager
+
+from unstract.sdk1.constants import LogLevel
+from unstract.sdk1.embedding import EmbeddingCompat
+from unstract.sdk1.vector_db import VectorDB
+
+logger = logging.getLogger(__name__)
+
+
+@dataclass
+class RetrievedChunk:
+    """A retrieved chunk with metadata for ranking and attribution."""
+
+    content: str
+    score: float
+    source_file: str
+    doc_id: str
+
+
+class LookupRetrievalService:
+    """Service to perform RAG retrieval for Lookup projects.
+
+    Uses simple cosine similarity search against indexed reference data.
+    When chunk_size > 0, this service retrieves relevant chunks instead
+    of loading the entire reference data.
+    """
+
+    def __init__(self, profile: "LookupProfileManager", org_id: str | None = None):
+        """Initialize the retrieval service.
+
+        Args:
+            profile: LookupProfileManager with adapter configuration
+            org_id: Organization ID (if None, gets from UserContext)
+        """
+        self.profile = profile
+        self.org_id = org_id or UserContext.get_organization_identifier()
+        logger.info(
+            f"LookupRetrievalService initialized with org_id='{self.org_id}' "
+            f"(provided={org_id}, from_context={UserContext.get_organization_identifier()})"
+        )
+
+    def retrieve_context(
+        self, query: str, project_id: str, min_score: float = 0.3
+    ) -> str:
+        r"""Retrieve relevant context chunks from indexed data sources.
+
+        Queries the vector DB for chunks semantically similar to the query,
+        filtering by doc_id to ensure results come from the correct
+        indexed reference data. Chunks are ranked by similarity score and
+        annotated with source file information.
+
+        Args:
+            query: The semantic query to search for (built from input_data)
+            project_id: UUID of the lookup project
+            min_score: Minimum similarity score threshold (default 0.3)
+
+        Returns:
+            Concatenated retrieved chunks as context string, sorted by
+            relevance score (highest first) with source attribution.
+            Returns empty string if no indexed sources found.
+
+        Example:
+            >>> service = LookupRetrievalService(profile)
+            >>> context = service.retrieve_context("vendor: Slack, type: SaaS", project_id)
+            >>> print(context[:100])
+            '=== Source: vendors.csv (relevance: 0.89) ===\nSlack Technologies Inc...'
+        """
+        # Get all indexed data sources for this project with extraction complete
+        index_managers = LookupIndexManager.objects.filter(
+            data_source__project_id=project_id,
+            data_source__is_latest=True,
+            data_source__extraction_status="completed",  # Only fully extracted sources
+            profile_manager=self.profile,
+            raw_index_id__isnull=False,
+        ).select_related("data_source")
+
+        if not index_managers.exists():
+            logger.warning(
+                f"No indexed data sources for project {project_id}. "
+                "Ensure data sources are uploaded and extraction is complete."
+            )
+            return ""
+
+        # Build doc_id to source file mapping for attribution
+        doc_id_to_source: dict[str, str] = {}
+        for im in index_managers:
+            if im.raw_index_id:
+                doc_id_to_source[im.raw_index_id] = im.data_source.file_name
+
+        doc_ids = list(doc_id_to_source.keys())
+
+        if not doc_ids:
+            logger.warning(f"No valid doc_ids found for project {project_id}")
+            return ""
+
+        logger.info(
+            f"Retrieving context for project {project_id} "
+            f"from {len(doc_ids)} indexed sources: {list(doc_id_to_source.values())}"
+        )
+
+        # Retrieve from each doc_id and aggregate results with metadata
+        all_chunks: list[RetrievedChunk] = []
+        for doc_id in doc_ids:
+            source_file = doc_id_to_source.get(doc_id, "unknown")
+            try:
+                chunks = self._retrieve_chunks(query, doc_id, source_file, min_score)
+                all_chunks.extend(chunks)
+            except Exception as e:
+                logger.error(
+                    f"Failed to retrieve chunks for doc_id {doc_id} "
+                    f"(source: {source_file}): {e}"
+                )
+                # Continue with other doc_ids
+
+        if not all_chunks:
+            logger.warning(
+                f"No chunks retrieved for project {project_id} with query: {query[:100]}. "
+                f"This may indicate poor semantic match or indexing issues."
+            )
+            return ""
+
+        # Sort by score (highest first) for better context quality
+        all_chunks.sort(key=lambda c: c.score, reverse=True)
+
+        # Deduplicate by content while preserving score-based order
+        seen_content: set[str] = set()
+        unique_chunks: list[RetrievedChunk] = []
+        for chunk in all_chunks:
+            if chunk.content not in seen_content:
+                seen_content.add(chunk.content)
+                unique_chunks.append(chunk)
+
+        logger.info(
+            f"Retrieved {len(unique_chunks)} unique chunks "
+            f"(from {len(all_chunks)} total) for project {project_id}. "
+            f"Score range: {unique_chunks[-1].score:.3f} - {unique_chunks[0].score:.3f}"
+        )
+
+        # Format chunks with source attribution for LLM context
+        formatted_chunks = []
+        for chunk in unique_chunks:
+            header = f"=== Source: {chunk.source_file} (relevance: {chunk.score:.2f}) ==="
+            formatted_chunks.append(f"{header}\n{chunk.content}")
+
+        return "\n\n".join(formatted_chunks)
+
+    def _retrieve_chunks(
+        self, query: str, doc_id: str, source_file: str, min_score: float = 0.3
+    ) -> list[RetrievedChunk]:
+        """Retrieve chunks from vector DB with similarity scores.
+
+        Uses the configured embedding model and vector store from the profile
+        to perform cosine similarity search with doc_id filtering. Returns
+        chunks with their similarity scores for ranking.
+
+        Args:
+            query: The semantic query to search for
+            doc_id: Document ID to filter results (from LookupIndexManager)
+            source_file: Source file name for attribution
+            min_score: Minimum similarity score threshold (default 0.3)
+
+        Returns:
+            List of RetrievedChunk objects with content, score, and source info
+        """
+        util = PromptIdeBaseTool(log_level=LogLevel.INFO, org_id=self.org_id)
+
+        # Initialize embedding model from profile
+        embedding = EmbeddingCompat(
+            adapter_instance_id=str(self.profile.embedding_model.id),
+            tool=util,
+            kwargs={},
+        )
+
+        # Initialize vector DB from profile
+        vector_db = VectorDB(
+            tool=util,
+            adapter_instance_id=str(self.profile.vector_store.id),
+            embedding=embedding,
+        )
+
+        try:
+            # Get vector store index for retrieval
+            vector_store_index = vector_db.get_vector_store_index()
+
+            # Create retriever with doc_id filter and top-k from profile
+            retriever = vector_store_index.as_retriever(
+                similarity_top_k=self.profile.similarity_top_k,
+                filters=MetadataFilters(
+                    filters=[ExactMatchFilter(key="doc_id", value=doc_id)],
+                ),
+            )
+
+            # Execute retrieval
+            logger.info(
+                f"Executing vector retrieval for doc_id={doc_id}, "
+                f"query='{query[:100]}...', top_k={self.profile.similarity_top_k}"
+            )
+            nodes = retriever.retrieve(query)
+
+            logger.info(f"Vector DB returned {len(nodes)} nodes for doc_id {doc_id}")
+
+            # Extract chunks with scores above threshold
+            chunks: list[RetrievedChunk] = []
+            for node in nodes:
+                logger.debug(
+                    f"Node {node.node_id}: score={node.score:.4f}, "
+                    f"content_length={len(node.get_content())}"
+                )
+                if node.score >= min_score:
+                    chunks.append(
+                        RetrievedChunk(
+                            content=node.get_content(),
+                            score=node.score,
+                            source_file=source_file,
+                            doc_id=doc_id,
+                        )
+                    )
+                else:
+                    logger.debug(
+                        f"Ignored node {node.node_id} with score {node.score:.3f} "
+                        f"(below threshold {min_score})"
+                    )
+
+            if len(nodes) > 0 and len(chunks) == 0:
+                logger.warning(
+                    f"All {len(nodes)} nodes for doc_id {doc_id} were below "
+                    f"min_score threshold ({min_score}). Highest score: "
+                    f"{max(n.score for n in nodes):.4f}"
+                )
+            elif len(nodes) == 0:
+                logger.warning(
+                    f"Vector DB returned 0 nodes for doc_id {doc_id}. "
+                    "This doc_id may not exist in the vector DB - check indexing."
+                )
+
+            logger.info(
+                f"Retrieved {len(chunks)} chunks for doc_id {doc_id} "
+                f"(source: {source_file})"
+            )
+            return chunks
+
+        finally:
+            # Always close vector DB connection
+            vector_db.close()
diff --git a/backend/lookup/services/variable_resolver.py b/backend/lookup/services/variable_resolver.py
index 75861a1f14..45d57fb6bb 100644
--- a/backend/lookup/services/variable_resolver.py
+++ b/backend/lookup/services/variable_resolver.py
@@ -20,8 +20,19 @@ def __init__(self, input_data: dict[str, Any], reference_data: str):
         Args:
             input_data: Extracted data from Prompt Studio
             reference_data: Concatenated text from all reference files
+
+        Note:
+            Variables can be accessed in templates as:
+            - {{reference_data}} - the full reference data string
+            - {{input_data.field_name}} - explicit input_data prefix
+            - {{field_name}} - shorthand for input_data fields (auto-resolved)
         """
         self.context = {"input_data": input_data, "reference_data": reference_data}
+        # Also add input_data fields at top level for shorthand access
+        # This allows {{vendor_name}} instead of {{input_data.vendor_name}}
+        for key, value in input_data.items():
+            if key not in self.context:  # Don't override reference_data
+                self.context[key] = value
 
     def resolve(self, template: str) -> str:
         r"""Replace all {{variable}} references in template with actual values.
diff --git a/backend/lookup/views.py b/backend/lookup/views.py
index 2961bad5b3..f9f840aa9d 100644
--- a/backend/lookup/views.py
+++ b/backend/lookup/views.py
@@ -104,9 +104,14 @@ def execute(self, request, pk=None):
 
         try:
             # Get the LLM adapter from Lookup profile
+            from utils.user_context import UserContext
+
             from .integrations.file_storage_client import FileStorageClient
             from .integrations.unstract_llm_client import UnstractLLMClient
 
+            # Get organization ID for RAG retrieval (must match what was used during indexing)
+            org_id = UserContext.get_organization_identifier()
+
             # Get profile for this project
             profile = LookupProfileManager.objects.filter(lookup_project=project).first()
 
@@ -128,6 +133,7 @@ def execute(self, request, pk=None):
                 cache_manager=cache,
                 reference_loader=ref_loader,
                 llm_client=llm_client,
+                org_id=org_id,
             )
 
             orchestrator = LookUpOrchestrator(
@@ -171,16 +177,10 @@ def upload_reference_data(self, request, pk=None):
         extract_text = upload_serializer.validated_data["extract_text"]
 
         try:
-            from utils.file_storage.constants import FileStorageKeys
-
-            from unstract.sdk1.file_storage.constants import StorageType
-            from unstract.sdk1.file_storage.env_helper import EnvHelper
-
-            # Get file storage instance
-            fs_instance = EnvHelper.get_storage(
-                storage_type=StorageType.PERMANENT,
-                env_name=FileStorageKeys.PERMANENT_REMOTE_STORAGE,
+            from utils.file_storage.helpers.prompt_studio_file_helper import (
+                PromptStudioFileHelper,
             )
+            from utils.user_context import UserContext
 
             # Determine file type from extension
             file_ext = file.name.split(".")[-1].lower()
@@ -190,42 +190,37 @@ def upload_reference_data(self, request, pk=None):
                 else "txt"
             )
 
-            # Upload file to storage following Prompt Studio's path structure
-            # Pattern: {base_path}/{org_id}/{project_id}/{filename}
-            # Keep Lookup file storage independent of PS project linkage
-            from utils.file_storage.constants import FileStorageConstants
-            from utils.user_context import UserContext
-
-            from unstract.core.utilities import UnstractUtils
-
             org_id = UserContext.get_organization_identifier()
-            # Use REMOTE path for MinIO storage, not local filesystem path
-            base_path = UnstractUtils.get_env(
-                env_key=FileStorageConstants.REMOTE_PROMPT_STUDIO_FILE_PATH
-            )
+            # Use a fixed user_id for lookup uploads to match PS path structure
+            # Path: {base_path}/{org_id}/{user_id}/{tool_id}/{filename}
+            user_id = "lookup"
+            tool_id = str(project.id)
 
-            # Store files under Lookup project ID, not PS tool ID
-            # This ensures files remains accessible regardless of PS linkage changes
-            file_path = f"{base_path}/{org_id}/{project.id}/{file.name}"
-
-            # Debug logging
             logger.info(
-                f"Upload debug: org_id={org_id}, base_path={base_path}, "
-                f"file_path={file_path}, file.name={file.name}, file.size={file.size}"
+                f"Upload via PromptStudioFileHelper: org_id={org_id}, "
+                f"user_id={user_id}, tool_id={tool_id}, file={file.name}"
             )
 
-            # Create parent directories if they don't exist
-            fs_instance.mkdir(f"{base_path}/{org_id}/{project.id}", create_parents=True)
-            fs_instance.mkdir(
-                f"{base_path}/{org_id}/{project.id}/extract", create_parents=True
+            # Use PromptStudioFileHelper - exact same code path as working PS upload
+            PromptStudioFileHelper.upload_for_ide(
+                org_id=org_id,
+                user_id=user_id,
+                tool_id=tool_id,
+                file_name=file.name,
+                file_data=file,
             )
 
-            # Upload the file - reset file position and handle bytes/file object
-            # Following Prompt Studio's pattern for reliable file upload
-            file.seek(0)  # Reset file position in case it was read during validation
-            file_data = file.read()
-            logger.info(f"File data read: {len(file_data)} bytes")
-            fs_instance.write(path=file_path, mode="wb", data=file_data)
+            # Build file_path for database record (matching PS helper's path structure)
+            from pathlib import Path
+
+            from utils.file_storage.constants import FileStorageConstants
+
+            from unstract.core.utilities import UnstractUtils
+
+            base_path = UnstractUtils.get_env(
+                env_key=FileStorageConstants.REMOTE_PROMPT_STUDIO_FILE_PATH
+            )
+            file_path = str(Path(base_path) / org_id / user_id / tool_id / file.name)
 
             logger.info(f"Uploaded file to storage: {file_path}")
 
@@ -648,9 +643,14 @@ def enrich_ps_output(self, request):
             lookup_projects = [link.lookup_project for link in links]
 
             # Initialize services with real clients
+            from utils.user_context import UserContext
+
             from .integrations.file_storage_client import FileStorageClient
             from .integrations.unstract_llm_client import UnstractLLMClient
 
+            # Get organization ID for RAG retrieval
+            org_id = UserContext.get_organization_identifier()
+
             storage_client = FileStorageClient()
             cache = LLMResponseCache()
             ref_loader = ReferenceDataLoader(storage_client)
@@ -693,6 +693,7 @@ def enrich_ps_output(self, request):
                         cache_manager=cache,
                         reference_loader=ref_loader,
                         llm_client=llm_client,
+                        org_id=org_id,
                     )
 
                     orchestrator = LookUpOrchestrator(executor=executor, merger=merger)
@@ -797,8 +798,13 @@ def test_with_ps_project(self, request):
             lookup_projects = [link.lookup_project for link in links]
 
             # Initialize services
+            from utils.user_context import UserContext
+
             from .services.mock_clients import MockLLMClient, MockStorageClient
 
+            # Get organization ID for RAG retrieval
+            org_id = UserContext.get_organization_identifier()
+
             llm_client = MockLLMClient()
             storage_client = MockStorageClient()
             cache = LLMResponseCache()
@@ -810,6 +816,7 @@ def test_with_ps_project(self, request):
                 cache_manager=cache,
                 reference_loader=ref_loader,
                 llm_client=llm_client,
+                org_id=org_id,
             )
 
             orchestrator = LookUpOrchestrator(executor=executor, merger=merger)
@@ -827,6 +834,179 @@ def test_with_ps_project(self, request):
                 {"error": str(e)}, status=status.HTTP_500_INTERNAL_SERVER_ERROR
             )
 
+    @action(detail=False, methods=["post"])
+    def check_indexing_status(self, request):
+        """Check indexing status and optionally test vector DB retrieval.
+
+        POST /api/v1/lookup-debug/check_indexing_status/
+
+        Request body:
+            {
+                "project_id": "uuid",
+                "test_query": "optional query to test retrieval"
+            }
+
+        Returns detailed status of data sources, index managers, and vector DB.
+        """
+        from lookup.models import LookupIndexManager
+
+        project_id = request.data.get("project_id")
+        test_query = request.data.get("test_query")
+
+        if not project_id:
+            return Response(
+                {"error": "project_id is required"},
+                status=status.HTTP_400_BAD_REQUEST,
+            )
+
+        try:
+            project = LookupProject.objects.get(id=project_id)
+        except LookupProject.DoesNotExist:
+            return Response(
+                {"error": f"Project not found: {project_id}"},
+                status=status.HTTP_404_NOT_FOUND,
+            )
+
+        # Get profile
+        try:
+            profile = LookupProfileManager.get_default_profile(project)
+        except Exception as e:
+            return Response(
+                {"error": f"No default profile: {e}"},
+                status=status.HTTP_400_BAD_REQUEST,
+            )
+
+        result = {
+            "project": {
+                "id": str(project.id),
+                "name": project.name,
+            },
+            "profile": {
+                "name": profile.profile_name,
+                "chunk_size": profile.chunk_size,
+                "chunk_overlap": profile.chunk_overlap,
+                "similarity_top_k": profile.similarity_top_k,
+                "vector_store_id": str(profile.vector_store.id),
+                "embedding_model_id": str(profile.embedding_model.id),
+                "rag_enabled": profile.chunk_size > 0,
+            },
+            "data_sources": [],
+            "index_managers": [],
+            "retrieval_test": None,
+        }
+
+        # Check data sources
+        data_sources = LookupDataSource.objects.filter(project_id=project_id).order_by(
+            "-created_at"
+        )
+
+        for ds in data_sources:
+            result["data_sources"].append(
+                {
+                    "id": str(ds.id),
+                    "file_name": ds.file_name,
+                    "extraction_status": ds.extraction_status,
+                    "is_latest": ds.is_latest,
+                    "file_path": ds.file_path,
+                }
+            )
+
+        # Check index managers
+        index_managers = LookupIndexManager.objects.filter(
+            data_source__project_id=project_id,
+            profile_manager=profile,
+        ).select_related("data_source")
+
+        for im in index_managers:
+            result["index_managers"].append(
+                {
+                    "data_source": im.data_source.file_name,
+                    "raw_index_id": im.raw_index_id,
+                    "has_index": im.raw_index_id is not None,
+                    "extraction_status": im.extraction_status,
+                    "index_ids_history": im.index_ids_history,
+                }
+            )
+
+        # Test retrieval if query provided
+        if test_query and profile.chunk_size > 0:
+            try:
+                from utils.user_context import UserContext
+
+                from lookup.services.lookup_retrieval_service import (
+                    LookupRetrievalService,
+                )
+
+                org_id = UserContext.get_organization_identifier()
+                service = LookupRetrievalService(profile, org_id=org_id)
+                context = service.retrieve_context(test_query, str(project.id))
+
+                result["retrieval_test"] = {
+                    "query": test_query,
+                    "success": bool(context),
+                    "context_length": len(context) if context else 0,
+                    "context_preview": context[:500] if context else None,
+                }
+            except Exception as e:
+                logger.exception("Retrieval test failed")
+                result["retrieval_test"] = {
+                    "query": test_query,
+                    "success": False,
+                    "error": str(e),
+                }
+
+        return Response(result)
+
+    @action(detail=False, methods=["post"])
+    def force_reindex(self, request):
+        """Force re-indexing of all data sources for a project.
+
+        POST /api/v1/lookup-debug/force_reindex/
+
+        Request body:
+            {
+                "project_id": "uuid"
+            }
+        """
+        from utils.user_context import UserContext
+
+        from lookup.services.indexing_service import IndexingService
+
+        project_id = request.data.get("project_id")
+
+        if not project_id:
+            return Response(
+                {"error": "project_id is required"},
+                status=status.HTTP_400_BAD_REQUEST,
+            )
+
+        try:
+            org_id = UserContext.get_organization_identifier()
+            user_id = str(request.user.id) if request.user else None
+
+            result = IndexingService.index_with_default_profile(
+                project_id=project_id,
+                org_id=org_id,
+                user_id=user_id,
+            )
+
+            return Response(
+                {
+                    "status": "success",
+                    "total": result["total"],
+                    "success": result["success"],
+                    "failed": result["failed"],
+                    "errors": result.get("errors", []),
+                }
+            )
+
+        except Exception as e:
+            logger.exception(f"Re-indexing failed for project {project_id}")
+            return Response(
+                {"error": str(e)},
+                status=status.HTTP_500_INTERNAL_SERVER_ERROR,
+            )
+
 
 class LookupDataSourceViewSet(viewsets.ModelViewSet):
     """ViewSet for managing LookupDataSource instances.
diff --git a/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py b/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
index 99019b5903..a7da45cd8a 100644
--- a/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
+++ b/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
@@ -51,16 +51,22 @@ def _try_lookup_enrichment(
         or empty dict if Lookup is not available or no links exist.
     """
     try:
+        from utils.user_context import UserContext
+
         from lookup.services.lookup_integration_service import (
             LookupIntegrationService,
         )
 
+        # Get organization ID from user context for RAG retrieval
+        organization_id = UserContext.get_organization_identifier()
+
         return LookupIntegrationService.enrich_if_linked(
             prompt_studio_project_id=tool_id,
             extracted_data=extracted_data,
             run_id=run_id,
             session_id=session_id,
             doc_name=doc_name,
+            organization_id=organization_id,
         )
     except ImportError:
         # Lookup app not installed

From 59f5c53cd054ec51f4c359c3c79502a04561cf5a Mon Sep 17 00:00:00 2001
From: gayathrivijayakumar <gayathri@zipstack.com>
Date: Mon, 19 Jan 2026 11:42:09 +0530
Subject: [PATCH 09/22] Re-indexing & disallow deletion of Lookup project on
 exisiting linked prompt studio projects

---
 backend/lookup/services/log_emitter.py        | 16 +++-
 backend/lookup/services/lookup_executor.py    | 20 +++-
 .../lookup/services/lookup_orchestrator.py    |  2 +
 backend/lookup/views.py                       | 29 ++++++
 .../ProfileFormModal.jsx                      | 91 ++++++++++++++++++-
 5 files changed, 150 insertions(+), 8 deletions(-)

diff --git a/backend/lookup/services/log_emitter.py b/backend/lookup/services/log_emitter.py
index 47e636529f..07bed5e703 100644
--- a/backend/lookup/services/log_emitter.py
+++ b/backend/lookup/services/log_emitter.py
@@ -221,6 +221,7 @@ def emit_enrichment_success(
         cached: bool,
         execution_time_ms: int,
         confidence: float | None = None,
+        context_type: str = "full",
     ) -> None:
         """Emit log when Look-up enrichment succeeds.
 
@@ -230,11 +231,14 @@ def emit_enrichment_success(
             cached: Whether the response was from cache
             execution_time_ms: Execution time in milliseconds
             confidence: Optional confidence score (0.0-1.0)
+            context_type: Type of context used - "rag" or "full"
         """
         cache_msg = " (cached)" if cached else ""
+        # Display context type clearly: RAG-based or Full context
+        context_display = "RAG" if context_type == "rag" else "Full context"
         message = (
-            f"Look-Up '{lookup_project_name}' enriched {enriched_count} "
-            f"field(s){cache_msg} in {execution_time_ms}ms"
+            f"Look-Up '{lookup_project_name}' [{context_display}] enriched "
+            f"{enriched_count} field(s){cache_msg} in {execution_time_ms}ms"
         )
 
         if confidence is not None:
@@ -249,6 +253,7 @@ def emit_enrichment_success(
             execution_time_ms=execution_time_ms,
             enriched_count=enriched_count,
             confidence=confidence,
+            context_type=context_type,
         )
 
     def emit_enrichment_failure(
@@ -317,6 +322,7 @@ def emit_enrichment_partial(
         execution_time_ms: int,
         warning_message: str,
         confidence: float | None = None,
+        context_type: str = "full",
     ) -> None:
         """Emit log when Look-up enrichment partially succeeds.
 
@@ -326,9 +332,12 @@ def emit_enrichment_partial(
             execution_time_ms: Execution time in milliseconds
             warning_message: Warning message about partial success
             confidence: Optional confidence score (0.0-1.0)
+            context_type: Type of context used - "rag" or "full"
         """
+        # Display context type clearly: RAG-based or Full context
+        context_display = "RAG" if context_type == "rag" else "Full context"
         message = (
-            f"Look-Up '{lookup_project_name}' partial success: "
+            f"Look-Up '{lookup_project_name}' [{context_display}] partial success: "
             f"enriched {enriched_count} field(s) in {execution_time_ms}ms - "
             f"{warning_message}"
         )
@@ -342,6 +351,7 @@ def emit_enrichment_partial(
             execution_time_ms=execution_time_ms,
             warning_message=warning_message,
             confidence=confidence,
+            context_type=context_type,
         )
 
     def emit_no_linked_lookups(self) -> None:
diff --git a/backend/lookup/services/lookup_executor.py b/backend/lookup/services/lookup_executor.py
index fb16598476..d2a9924c91 100644
--- a/backend/lookup/services/lookup_executor.py
+++ b/backend/lookup/services/lookup_executor.py
@@ -111,6 +111,7 @@ def execute(
         llm_provider = "unknown"
         llm_model = "unknown"
         _cached = False  # noqa F841
+        context_type = "full"  # Track whether using RAG or full context
 
         try:
             # Step 1: Load reference data (RAG or full context based on chunk_size)
@@ -130,6 +131,7 @@ def execute(
 
                 if profile.chunk_size > 0:
                     # RAG Mode: Retrieve relevant chunks from vector DB
+                    context_type = "rag"
                     logger.info(
                         f"Using RAG mode (chunk_size={profile.chunk_size}) "
                         f"for project {lookup_project.name}"
@@ -274,6 +276,7 @@ def execute(
                         confidence,
                         cached=True,
                         execution_time_ms=0,  # No execution time for cached response
+                        context_type=context_type,
                     )
                     self._log_audit(
                         exec_id,
@@ -416,6 +419,7 @@ def execute(
                 confidence,
                 cached=False,
                 execution_time_ms=llm_time_ms,
+                context_type=context_type,
             )
             self._log_audit(
                 exec_id,
@@ -666,8 +670,21 @@ def _success_result(
         confidence: float | None,
         cached: bool,
         execution_time_ms: int,
+        context_type: str = "full",
     ) -> dict[str, Any]:
-        """Build success result dictionary."""
+        """Build success result dictionary.
+
+        Args:
+            project: The LookupProject that was executed
+            data: Enrichment data from the LLM response
+            confidence: Confidence score (0.0-1.0) if available
+            cached: Whether the response was from cache
+            execution_time_ms: Execution time in milliseconds
+            context_type: Type of context used - "rag" or "full"
+
+        Returns:
+            Dictionary with execution results including context_type
+        """
         return {
             "status": "success",
             "project_id": str(project.id),  # Convert UUID to string for JSON
@@ -676,6 +693,7 @@ def _success_result(
             "confidence": confidence,
             "cached": cached,
             "execution_time_ms": execution_time_ms,
+            "context_type": context_type,
         }
 
     def _failed_result(
diff --git a/backend/lookup/services/lookup_orchestrator.py b/backend/lookup/services/lookup_orchestrator.py
index a0d9472cb9..3e10394af1 100644
--- a/backend/lookup/services/lookup_orchestrator.py
+++ b/backend/lookup/services/lookup_orchestrator.py
@@ -405,6 +405,7 @@ def _emit_success_log(
             cached = result.get("cached", False)
             execution_time_ms = result.get("execution_time_ms", 0)
             confidence = result.get("confidence")
+            context_type = result.get("context_type", "full")
 
             self.log_emitter.emit_enrichment_success(
                 lookup_project_name=lookup_project.name,
@@ -412,6 +413,7 @@ def _emit_success_log(
                 cached=cached,
                 execution_time_ms=execution_time_ms,
                 confidence=confidence,
+                context_type=context_type,
             )
         except Exception as e:
             logger.warning(f"Failed to emit success log: {e}")
diff --git a/backend/lookup/views.py b/backend/lookup/views.py
index f9f840aa9d..37f6104ac2 100644
--- a/backend/lookup/views.py
+++ b/backend/lookup/views.py
@@ -86,6 +86,35 @@ def perform_create(self, serializer):
         # Note: organization is set automatically by DefaultOrganizationMixin's save() method
         serializer.save(created_by=self.request.user)
 
+    def destroy(self, request, *args, **kwargs):
+        """Delete a Look-Up project.
+
+        Prevents deletion if the project is linked to any Prompt Studio projects.
+        """
+        instance = self.get_object()
+
+        # Check if the project is linked to any Prompt Studio projects
+        linked_ps_projects = instance.ps_links.all()
+        if linked_ps_projects.exists():
+            # Get linked project IDs for the error message
+            linked_ids = list(
+                linked_ps_projects.values_list("prompt_studio_project_id", flat=True)
+            )
+            return Response(
+                {
+                    "error": "Cannot delete Look-Up project that is linked to "
+                    "Prompt Studio projects",
+                    "detail": f"This Look-Up project is linked to {len(linked_ids)} "
+                    f"Prompt Studio project(s). Please unlink it from all Prompt "
+                    f"Studio projects before deleting.",
+                    "linked_prompt_studio_projects": [str(id) for id in linked_ids],
+                },
+                status=status.HTTP_400_BAD_REQUEST,
+            )
+
+        # Proceed with deletion
+        return super().destroy(request, *args, **kwargs)
+
     @action(detail=True, methods=["post"])
     def execute(self, request, pk=None):
         """Execute a Look-Up project with provided input data.
diff --git a/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx b/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx
index 918fb59073..b5508157ab 100644
--- a/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx
+++ b/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx
@@ -7,6 +7,7 @@ import {
   Row,
   Col,
   Typography,
+  Alert,
 } from "antd";
 import { useEffect, useState } from "react";
 import PropTypes from "prop-types";
@@ -29,6 +30,8 @@ function ProfileFormModal({ projectId, profileId, onClose }) {
   const [embeddingItems, setEmbeddingItems] = useState([]);
   const [x2TextItems, setX2TextItems] = useState([]);
   const [adaptersLoaded, setAdaptersLoaded] = useState(false);
+  const [originalChunkSize, setOriginalChunkSize] = useState(null);
+  const [showReindexWarning, setShowReindexWarning] = useState(false);
 
   const axiosPrivate = useAxiosPrivate();
   const { sessionDetails } = useSessionStore();
@@ -111,6 +114,10 @@ function ProfileFormModal({ projectId, profileId, onClose }) {
       .then((res) => {
         const profile = res?.data;
 
+        // Store original chunk_size for reindex warning check
+        console.log("Profile data loaded, chunk_size:", profile?.chunk_size);
+        setOriginalChunkSize(profile?.chunk_size);
+
         // Find adapter IDs by matching adapter names from the profile response
         // The API returns adapter names as strings (e.g., "Azure LLM")
         const llmItem = llmItems.find((item) => item?.label === profile?.llm);
@@ -175,11 +182,39 @@ function ProfileFormModal({ projectId, profileId, onClose }) {
 
         axiosPrivate(requestOptions)
           .then(() => {
-            setAlertDetails({
-              type: "success",
-              content: `Profile ${isEdit ? "updated" : "created"} successfully`,
+            // Check if reindexing warning should be shown (only for edit mode)
+            // Show warning if chunk_size was > 0 before OR after the change
+            // This means RAG mode is/was being used and config changes require reindexing
+            const newChunkSize = values.chunk_size;
+            const originalWasRag =
+              originalChunkSize !== null && originalChunkSize > 0;
+            const newIsRag = newChunkSize !== null && newChunkSize > 0;
+            const needsReindex = isEdit && (originalWasRag || newIsRag);
+
+            console.log("Reindex check:", {
+              isEdit,
+              originalChunkSize,
+              newChunkSize,
+              originalWasRag,
+              newIsRag,
+              needsReindex,
             });
-            onClose(true); // Close and refresh
+
+            if (needsReindex) {
+              setShowReindexWarning(true);
+              setAlertDetails({
+                type: "success",
+                content: "Profile updated successfully",
+              });
+            } else {
+              setAlertDetails({
+                type: "success",
+                content: `Profile ${
+                  isEdit ? "updated" : "created"
+                } successfully`,
+              });
+              onClose(true); // Close and refresh
+            }
           })
           .catch((err) => {
             handleException(
@@ -196,6 +231,54 @@ function ProfileFormModal({ projectId, profileId, onClose }) {
       });
   };
 
+  const handleCloseWithWarning = () => {
+    setShowReindexWarning(false);
+    onClose(true); // Close and refresh
+  };
+
+  // If showing reindex warning, render the warning modal instead
+  if (showReindexWarning) {
+    return (
+      <Modal
+        title="Profile Updated - Reindexing Required"
+        open={true}
+        onOk={handleCloseWithWarning}
+        onCancel={handleCloseWithWarning}
+        width={600}
+        okText="Got it"
+        cancelButtonProps={{ style: { display: "none" } }}
+      >
+        <Alert
+          type="warning"
+          showIcon
+          message="Reindexing Required"
+          description={
+            <div>
+              <p>
+                Your profile settings have been updated successfully. However,
+                since this profile uses <strong>RAG mode</strong> (chunk_size
+                &gt; 0), the changes to chunking configuration, embedding model,
+                or vector database will only take effect after you re-index the
+                reference data.
+              </p>
+              <p style={{ marginBottom: 0 }}>
+                <strong>Action needed:</strong> Go to the{" "}
+                <strong>Reference Data</strong> tab and click{" "}
+                <strong>Index</strong> to re-index your data with the new
+                profile settings.
+              </p>
+            </div>
+          }
+          style={{ marginBottom: 16 }}
+        />
+        <Typography.Text type="secondary">
+          Note: If you skip re-indexing, the Look-Up will continue using the
+          previously indexed data until you manually trigger re-indexing.
+        </Typography.Text>
+      </Modal>
+    );
+  }
+
   return (
     <Modal
       title={modalTitle}

From 204a821e41a58993da7b170c1d31e9630efeee82 Mon Sep 17 00:00:00 2001
From: gayathrivijayakumar <gayathri@zipstack.com>
Date: Tue, 20 Jan 2026 12:07:01 +0530
Subject: [PATCH 10/22] Deleting vector DB nodes as appropriate

---
 .../0005_add_reindex_required_field.py        |  27 ++
 backend/lookup/models/lookup_index_manager.py |  45 +--
 .../lookup/models/lookup_profile_manager.py   |  69 ++++
 .../lookup/services/lookup_index_helper.py    |  35 +-
 .../services/vector_db_cleanup_service.py     | 366 ++++++++++++++++++
 backend/lookup/views.py                       | 220 +++++++++++
 6 files changed, 730 insertions(+), 32 deletions(-)
 create mode 100644 backend/lookup/migrations/0005_add_reindex_required_field.py
 create mode 100644 backend/lookup/services/vector_db_cleanup_service.py

diff --git a/backend/lookup/migrations/0005_add_reindex_required_field.py b/backend/lookup/migrations/0005_add_reindex_required_field.py
new file mode 100644
index 0000000000..5749dd91a2
--- /dev/null
+++ b/backend/lookup/migrations/0005_add_reindex_required_field.py
@@ -0,0 +1,27 @@
+# Generated migration for adding reindex_required field to LookupIndexManager
+
+from django.db import migrations, models
+
+
+class Migration(migrations.Migration):
+    """Add reindex_required field to LookupIndexManager.
+
+    This field tracks whether indexes are stale and need re-indexing
+    when profile settings change (chunk_size, embedding_model, etc.).
+    """
+
+    dependencies = [
+        ("lookup", "0004_fix_file_paths_for_minio"),
+    ]
+
+    operations = [
+        migrations.AddField(
+            model_name="lookupindexmanager",
+            name="reindex_required",
+            field=models.BooleanField(
+                default=False,
+                db_comment="Flag indicating indexes are stale and need re-indexing",
+                help_text="Set to True when profile settings change and re-indexing is needed",
+            ),
+        ),
+    ]
diff --git a/backend/lookup/models/lookup_index_manager.py b/backend/lookup/models/lookup_index_manager.py
index 3d483a7a3a..8cc501e222 100644
--- a/backend/lookup/models/lookup_index_manager.py
+++ b/backend/lookup/models/lookup_index_manager.py
@@ -8,10 +8,6 @@
 from django.db.models.signals import pre_delete
 from django.dispatch import receiver
 from utils.models.base_model import BaseModel
-from utils.user_context import UserContext
-
-from unstract.sdk1.constants import LogLevel
-from unstract.sdk1.vector_db import VectorDB
 
 logger = logging.getLogger(__name__)
 
@@ -83,6 +79,14 @@ class LookupIndexManager(BaseModel):
         db_comment="Extraction and indexing status", null=False, blank=False, default=dict
     )
 
+    # Flag to indicate that indexes are stale and need re-indexing
+    # Set to True when profile settings change (chunk_size, embedding_model, etc.)
+    reindex_required = models.BooleanField(
+        default=False,
+        db_comment="Flag indicating indexes are stale and need re-indexing",
+        help_text="Set to True when profile settings change and re-indexing is needed",
+    )
+
     # Audit fields
     created_by = models.ForeignKey(
         User,
@@ -120,33 +124,24 @@ def __str__(self):
 def delete_from_vector_db(index_ids_history, vector_db_instance_id):
     """Delete index IDs from vector database.
 
+    This function is kept for backward compatibility and signal handler usage.
+    For new code, prefer using VectorDBCleanupService directly.
+
     Args:
         index_ids_history: List of index IDs to delete
         vector_db_instance_id: UUID of the vector DB adapter instance
     """
-    try:
-        from prompt_studio.prompt_studio_core_v2.prompt_ide_base_tool import (
-            PromptIdeBaseTool,
-        )
+    from lookup.services.vector_db_cleanup_service import VectorDBCleanupService
 
-        organization_identifier = UserContext.get_organization_identifier()
-        util = PromptIdeBaseTool(log_level=LogLevel.INFO, org_id=organization_identifier)
-
-        vector_db = VectorDB(
-            tool=util,
-            adapter_instance_id=vector_db_instance_id,
-        )
-
-        for index_id in index_ids_history:
-            logger.debug(f"Deleting from VectorDB - index id: {index_id}")
-            try:
-                vector_db.delete(ref_doc_id=index_id)
-            except Exception as e:
-                # Log error and continue with the next index id
-                logger.error(f"Error deleting index: {index_id} - {e}")
+    cleanup_service = VectorDBCleanupService()
+    result = cleanup_service.cleanup_index_ids(
+        index_ids=index_ids_history,
+        vector_db_instance_id=vector_db_instance_id,
+    )
 
-    except Exception as e:
-        logger.error(f"Error in delete_from_vector_db: {e}", exc_info=True)
+    if result["errors"]:
+        for error in result["errors"]:
+            logger.error(error)
 
 
 # Signal to perform vector DB cleanup on deletion
diff --git a/backend/lookup/models/lookup_profile_manager.py b/backend/lookup/models/lookup_profile_manager.py
index 6d1472d23c..681a8897e9 100644
--- a/backend/lookup/models/lookup_profile_manager.py
+++ b/backend/lookup/models/lookup_profile_manager.py
@@ -1,14 +1,19 @@
 """LookupProfileManager model for managing adapter profiles in Look-Up projects."""
 
+import logging
 import uuid
 
 from account_v2.models import User
 from adapter_processor_v2.models import AdapterInstance
 from django.db import models
+from django.db.models.signals import pre_delete
+from django.dispatch import receiver
 from utils.models.base_model import BaseModel
 
 from lookup.exceptions import DefaultProfileError
 
+logger = logging.getLogger(__name__)
+
 
 class LookupProfileManager(BaseModel):
     """Model to store adapter configuration profiles for Look-Up projects.
@@ -155,3 +160,67 @@ def get_default_profile(project):
             raise DefaultProfileError(
                 f"No default profile found for project {project.name}"
             )
+
+
+@receiver(pre_delete, sender=LookupProfileManager)
+def cleanup_profile_indexes(sender, instance, **kwargs):
+    """Clean up all vector DB indexes created with this profile before deletion.
+
+    This signal handler ensures that when a LookupProfileManager is deleted,
+    all associated vector DB indexes are cleaned up to prevent stale data
+    accumulation.
+
+    Args:
+        sender: The model class (LookupProfileManager)
+        instance: The profile instance being deleted
+        **kwargs: Additional arguments from the signal
+    """
+    # Import here to avoid circular imports
+    from lookup.services.vector_db_cleanup_service import VectorDBCleanupService
+
+    try:
+        # Get all index managers associated with this profile
+        index_managers = instance.index_managers.all()
+
+        if not index_managers.exists():
+            logger.debug(
+                f"No index managers found for profile {instance.profile_name}, "
+                "skipping cleanup"
+            )
+            return
+
+        cleanup_service = VectorDBCleanupService()
+        total_deleted = 0
+        total_failed = 0
+        errors = []
+
+        for index_manager in index_managers:
+            if index_manager.index_ids_history:
+                result = cleanup_service.cleanup_index_ids(
+                    index_ids=index_manager.index_ids_history,
+                    vector_db_instance_id=str(instance.vector_store.id),
+                )
+                total_deleted += result.get("deleted", 0)
+                total_failed += result.get("failed", 0)
+                if result.get("errors"):
+                    errors.extend(result["errors"])
+
+        if total_deleted > 0:
+            logger.info(
+                f"Profile deletion cleanup for '{instance.profile_name}': "
+                f"deleted {total_deleted} indexes from vector DB"
+            )
+
+        if total_failed > 0:
+            logger.warning(
+                f"Profile deletion cleanup for '{instance.profile_name}': "
+                f"failed to delete {total_failed} indexes. Errors: {errors}"
+            )
+
+    except Exception as e:
+        # Log error but don't block deletion - cleanup is best-effort
+        logger.error(
+            f"Error during profile deletion cleanup for '{instance.profile_name}': "
+            f"{str(e)}",
+            exc_info=True,
+        )
diff --git a/backend/lookup/services/lookup_index_helper.py b/backend/lookup/services/lookup_index_helper.py
index d22a7d86b3..81e5f2fa8e 100644
--- a/backend/lookup/services/lookup_index_helper.py
+++ b/backend/lookup/services/lookup_index_helper.py
@@ -8,6 +8,7 @@
 from django.db import transaction
 
 from lookup.models import LookupIndexManager
+from lookup.services.vector_db_cleanup_service import VectorDBCleanupService
 
 logger = logging.getLogger(__name__)
 
@@ -21,13 +22,20 @@ def handle_index_manager(
         data_source_id: str,
         profile_manager,
         doc_id: str,
+        cleanup_old_indexes: bool = True,
     ) -> LookupIndexManager:
         """Create or update LookupIndexManager with doc_id.
 
+        When re-indexing (updating existing index manager), this method
+        will clean up old vector DB nodes before adding the new doc_id
+        to prevent stale data accumulation.
+
         Args:
             data_source_id: UUID of the LookupDataSource
             profile_manager: LookupProfileManager instance
             doc_id: Document ID returned from indexing service
+            cleanup_old_indexes: If True, deletes old indexes from vector DB
+                               before adding new doc_id (default: True)
 
         Returns:
             LookupIndexManager instance
@@ -49,15 +57,28 @@ def handle_index_manager(
             )
 
             if not created:
-                # Update existing index manager
+                # Re-indexing: Clean up old indexes before adding new one
+                if cleanup_old_indexes and index_manager.index_ids_history:
+                    cleanup_service = VectorDBCleanupService()
+                    cleanup_result = cleanup_service.cleanup_before_reindex(index_manager)
+                    if cleanup_result["deleted"] > 0:
+                        logger.info(
+                            f"Cleaned up {cleanup_result['deleted']} old index(es) "
+                            f"for data source {data_source.file_name}"
+                        )
+                    if cleanup_result["errors"]:
+                        logger.warning(
+                            f"Some cleanup errors occurred: {cleanup_result['errors']}"
+                        )
+
+                # Update with new doc_id
                 index_manager.raw_index_id = doc_id
-
-                # Add to history if not already present
-                if doc_id not in index_manager.index_ids_history:
-                    index_manager.index_ids_history.append(doc_id)
-
-                # Update status
+                # Start fresh history with only the new doc_id
+                index_manager.index_ids_history = [doc_id]
+                # Update status and clear reindex_required flag
                 index_manager.status = {"indexed": True, "error": None}
+                if hasattr(index_manager, "reindex_required"):
+                    index_manager.reindex_required = False
 
                 index_manager.save()
                 logger.debug(f"Updated index manager for data source {data_source_id}")
diff --git a/backend/lookup/services/vector_db_cleanup_service.py b/backend/lookup/services/vector_db_cleanup_service.py
new file mode 100644
index 0000000000..3319e61e60
--- /dev/null
+++ b/backend/lookup/services/vector_db_cleanup_service.py
@@ -0,0 +1,366 @@
+"""Vector DB Cleanup Service for Lookup feature.
+
+Provides centralized cleanup operations for removing obsolete
+vector DB nodes when reference data is re-indexed, profiles
+are changed, or data sources are deleted.
+"""
+
+import logging
+from typing import Any
+
+from utils.user_context import UserContext
+
+from unstract.sdk1.constants import LogLevel
+from unstract.sdk1.vector_db import VectorDB
+
+logger = logging.getLogger(__name__)
+
+
+class VectorDBCleanupService:
+    """Centralized service for vector DB cleanup operations.
+
+    This service handles all vector DB node deletion scenarios:
+    - Cleanup on re-indexing (delete old nodes before adding new)
+    - Cleanup on profile deletion
+    - Cleanup on data source deletion
+    - Manual cleanup of stale indexes
+    - Cleanup when switching from RAG to full context mode
+
+    Example:
+        >>> service = VectorDBCleanupService()
+        >>> result = service.cleanup_index_ids(
+        ...     index_ids=["doc_id_1", "doc_id_2"], vector_db_instance_id="uuid-of-vector-db"
+        ... )
+        >>> print(result)
+        {'success': True, 'deleted': 2, 'failed': 0, 'errors': []}
+    """
+
+    def __init__(self, org_id: str | None = None):
+        """Initialize the cleanup service.
+
+        Args:
+            org_id: Organization ID for multi-tenancy. If not provided,
+                   will be fetched from UserContext.
+        """
+        self.org_id = org_id or UserContext.get_organization_identifier()
+
+    def _get_vector_db_client(self, vector_db_instance_id: str) -> VectorDB:
+        """Get a VectorDB client for the given adapter instance.
+
+        Args:
+            vector_db_instance_id: UUID of the vector DB adapter instance
+
+        Returns:
+            VectorDB client instance
+        """
+        from prompt_studio.prompt_studio_core_v2.prompt_ide_base_tool import (
+            PromptIdeBaseTool,
+        )
+
+        util = PromptIdeBaseTool(log_level=LogLevel.INFO, org_id=self.org_id)
+        return VectorDB(tool=util, adapter_instance_id=vector_db_instance_id)
+
+    def cleanup_index_ids(
+        self,
+        index_ids: list[str],
+        vector_db_instance_id: str,
+    ) -> dict[str, Any]:
+        """Delete specific index IDs from vector DB.
+
+        Args:
+            index_ids: List of index IDs (doc_ids) to delete
+            vector_db_instance_id: UUID of the vector DB adapter instance
+
+        Returns:
+            Dictionary with cleanup results:
+                - success: True if all deletions succeeded
+                - deleted: Number of successfully deleted indexes
+                - failed: Number of failed deletions
+                - errors: List of error messages for failed deletions
+        """
+        if not index_ids:
+            logger.debug("No index IDs to clean up")
+            return {"success": True, "deleted": 0, "failed": 0, "errors": []}
+
+        if not vector_db_instance_id:
+            logger.warning("Cannot cleanup: vector_db_instance_id not provided")
+            return {
+                "success": False,
+                "deleted": 0,
+                "failed": len(index_ids),
+                "errors": ["vector_db_instance_id not provided"],
+            }
+
+        deleted = 0
+        failed = 0
+        errors = []
+
+        try:
+            vector_db = self._get_vector_db_client(vector_db_instance_id)
+
+            for index_id in index_ids:
+                try:
+                    logger.debug(f"Deleting from VectorDB - index id: {index_id}")
+                    vector_db.delete(ref_doc_id=index_id)
+                    deleted += 1
+                except Exception as e:
+                    error_msg = f"Error deleting index {index_id}: {e}"
+                    logger.error(error_msg)
+                    errors.append(error_msg)
+                    failed += 1
+
+            logger.info(
+                f"Vector DB cleanup completed: {deleted} deleted, {failed} failed"
+            )
+
+        except Exception as e:
+            error_msg = f"Error initializing vector DB client: {e}"
+            logger.error(error_msg, exc_info=True)
+            return {
+                "success": False,
+                "deleted": deleted,
+                "failed": len(index_ids) - deleted,
+                "errors": [error_msg] + errors,
+            }
+
+        return {
+            "success": failed == 0,
+            "deleted": deleted,
+            "failed": failed,
+            "errors": errors,
+        }
+
+    def cleanup_for_data_source(
+        self,
+        data_source_id: str,
+        profile_id: str | None = None,
+    ) -> dict[str, Any]:
+        """Clean up all indexes for a data source.
+
+        Args:
+            data_source_id: UUID of the LookupDataSource
+            profile_id: Optional profile ID to filter by. If not provided,
+                       cleans up indexes for all profiles.
+
+        Returns:
+            Dictionary with cleanup results
+        """
+        from lookup.models import LookupIndexManager
+
+        try:
+            queryset = LookupIndexManager.objects.filter(data_source_id=data_source_id)
+            if profile_id:
+                queryset = queryset.filter(profile_manager_id=profile_id)
+
+            total_deleted = 0
+            total_failed = 0
+            all_errors = []
+
+            for index_manager in queryset:
+                if (
+                    index_manager.index_ids_history
+                    and index_manager.profile_manager
+                    and index_manager.profile_manager.vector_store
+                ):
+                    result = self.cleanup_index_ids(
+                        index_ids=index_manager.index_ids_history,
+                        vector_db_instance_id=str(
+                            index_manager.profile_manager.vector_store.id
+                        ),
+                    )
+                    total_deleted += result["deleted"]
+                    total_failed += result["failed"]
+                    all_errors.extend(result["errors"])
+
+                    # Clear the history after successful cleanup
+                    if result["success"]:
+                        index_manager.index_ids_history = []
+                        index_manager.raw_index_id = None
+                        index_manager.status = {"indexed": False, "cleaned": True}
+                        index_manager.save()
+
+            return {
+                "success": total_failed == 0,
+                "deleted": total_deleted,
+                "failed": total_failed,
+                "errors": all_errors,
+            }
+
+        except Exception as e:
+            error_msg = f"Error cleaning up data source {data_source_id}: {e}"
+            logger.error(error_msg, exc_info=True)
+            return {"success": False, "deleted": 0, "failed": 0, "errors": [error_msg]}
+
+    def cleanup_stale_indexes(
+        self,
+        index_manager,
+        keep_current: bool = True,
+    ) -> dict[str, Any]:
+        """Clean up old indexes, optionally keeping the current one.
+
+        This is useful when re-indexing - delete old nodes but keep
+        the most recent one (which will be replaced).
+
+        Args:
+            index_manager: LookupIndexManager instance
+            keep_current: If True, keeps the current raw_index_id
+
+        Returns:
+            Dictionary with cleanup results
+        """
+        if not index_manager.index_ids_history:
+            return {"success": True, "deleted": 0, "failed": 0, "errors": []}
+
+        if (
+            not index_manager.profile_manager
+            or not index_manager.profile_manager.vector_store
+        ):
+            logger.warning(
+                f"Cannot cleanup stale indexes: missing profile or vector store "
+                f"for index manager {index_manager.index_manager_id}"
+            )
+            return {
+                "success": False,
+                "deleted": 0,
+                "failed": 0,
+                "errors": ["Missing profile or vector store"],
+            }
+
+        # Determine which IDs to delete
+        ids_to_delete = list(index_manager.index_ids_history)
+        if keep_current and index_manager.raw_index_id:
+            ids_to_delete = [
+                id for id in ids_to_delete if id != index_manager.raw_index_id
+            ]
+
+        if not ids_to_delete:
+            return {"success": True, "deleted": 0, "failed": 0, "errors": []}
+
+        result = self.cleanup_index_ids(
+            index_ids=ids_to_delete,
+            vector_db_instance_id=str(index_manager.profile_manager.vector_store.id),
+        )
+
+        # Update history to remove deleted IDs
+        if result["deleted"] > 0:
+            remaining_ids = [
+                id for id in index_manager.index_ids_history if id not in ids_to_delete
+            ]
+            index_manager.index_ids_history = remaining_ids
+            index_manager.save()
+
+        return result
+
+    def cleanup_for_profile(self, profile_id: str) -> dict[str, Any]:
+        """Clean up all indexes created with a specific profile.
+
+        Use this when a profile is being deleted or when switching
+        from RAG mode to full context mode.
+
+        Args:
+            profile_id: UUID of the LookupProfileManager
+
+        Returns:
+            Dictionary with cleanup results
+        """
+        from lookup.models import LookupIndexManager, LookupProfileManager
+
+        try:
+            profile = LookupProfileManager.objects.get(pk=profile_id)
+            if not profile.vector_store:
+                logger.warning(f"Profile {profile_id} has no vector store configured")
+                return {
+                    "success": False,
+                    "deleted": 0,
+                    "failed": 0,
+                    "errors": ["Profile has no vector store configured"],
+                }
+
+            vector_db_instance_id = str(profile.vector_store.id)
+            index_managers = LookupIndexManager.objects.filter(profile_manager=profile)
+
+            total_deleted = 0
+            total_failed = 0
+            all_errors = []
+
+            for index_manager in index_managers:
+                if index_manager.index_ids_history:
+                    result = self.cleanup_index_ids(
+                        index_ids=index_manager.index_ids_history,
+                        vector_db_instance_id=vector_db_instance_id,
+                    )
+                    total_deleted += result["deleted"]
+                    total_failed += result["failed"]
+                    all_errors.extend(result["errors"])
+
+                    # Clear the history after cleanup
+                    index_manager.index_ids_history = []
+                    index_manager.raw_index_id = None
+                    index_manager.status = {"indexed": False, "cleaned": True}
+                    index_manager.reindex_required = True
+                    index_manager.save()
+
+            logger.info(
+                f"Profile cleanup completed for {profile_id}: "
+                f"{total_deleted} deleted, {total_failed} failed"
+            )
+
+            return {
+                "success": total_failed == 0,
+                "deleted": total_deleted,
+                "failed": total_failed,
+                "errors": all_errors,
+            }
+
+        except LookupProfileManager.DoesNotExist:
+            error_msg = f"Profile {profile_id} not found"
+            logger.error(error_msg)
+            return {"success": False, "deleted": 0, "failed": 0, "errors": [error_msg]}
+        except Exception as e:
+            error_msg = f"Error cleaning up profile {profile_id}: {e}"
+            logger.error(error_msg, exc_info=True)
+            return {"success": False, "deleted": 0, "failed": 0, "errors": [error_msg]}
+
+    def cleanup_before_reindex(
+        self,
+        index_manager,
+    ) -> dict[str, Any]:
+        """Clean up all existing indexes before re-indexing.
+
+        This should be called before adding a new doc_id during re-indexing
+        to ensure old stale data is removed from the vector DB.
+
+        Args:
+            index_manager: LookupIndexManager instance
+
+        Returns:
+            Dictionary with cleanup results
+        """
+        if not index_manager.index_ids_history:
+            return {"success": True, "deleted": 0, "failed": 0, "errors": []}
+
+        if (
+            not index_manager.profile_manager
+            or not index_manager.profile_manager.vector_store
+        ):
+            logger.warning(
+                "Cannot cleanup before reindex: missing profile or vector store"
+            )
+            return {
+                "success": False,
+                "deleted": 0,
+                "failed": 0,
+                "errors": ["Missing profile or vector store"],
+            }
+
+        logger.info(
+            f"Cleaning up {len(index_manager.index_ids_history)} old index(es) "
+            f"before re-indexing data source {index_manager.data_source.file_name}"
+        )
+
+        result = self.cleanup_index_ids(
+            index_ids=index_manager.index_ids_history,
+            vector_db_instance_id=str(index_manager.profile_manager.vector_store.id),
+        )
+
+        return result
diff --git a/backend/lookup/views.py b/backend/lookup/views.py
index 37f6104ac2..f2e573fb2d 100644
--- a/backend/lookup/views.py
+++ b/backend/lookup/views.py
@@ -293,6 +293,72 @@ def data_sources(self, request, pk=None):
         serializer = LookupDataSourceSerializer(data_sources, many=True)
         return Response(serializer.data)
 
+    @action(detail=True, methods=["post"])
+    def cleanup_stale_indexes(self, request, pk=None):
+        """Manually trigger cleanup of stale vector DB indexes for a project.
+
+        POST /api/v1/lookup-projects/{id}/cleanup_stale_indexes/
+
+        Cleans up vector DB nodes that are marked as stale or no longer needed.
+        This is useful for reclaiming storage and ensuring data consistency.
+
+        Returns:
+            Summary of cleanup operations performed.
+        """
+        project = self.get_object()
+
+        try:
+            from lookup.models import LookupIndexManager
+            from lookup.services.vector_db_cleanup_service import (
+                VectorDBCleanupService,
+            )
+
+            cleanup_service = VectorDBCleanupService()
+            total_deleted = 0
+            total_failed = 0
+            errors = []
+
+            # Get all index managers for this project that need cleanup
+            index_managers = LookupIndexManager.objects.filter(
+                data_source__project=project
+            ).select_related("profile_manager", "data_source")
+
+            for index_manager in index_managers:
+                if not index_manager.profile_manager:
+                    continue
+
+                # Clean up stale indexes (keeping only the current one)
+                result = cleanup_service.cleanup_stale_indexes(
+                    index_manager=index_manager, keep_current=True
+                )
+                total_deleted += result.get("deleted", 0)
+                total_failed += result.get("failed", 0)
+                if result.get("errors"):
+                    errors.extend(result["errors"])
+
+                # Reset reindex_required flag if cleanup was successful
+                if result.get("success"):
+                    index_manager.reindex_required = False
+                    index_manager.save(update_fields=["reindex_required"])
+
+            return Response(
+                {
+                    "message": "Cleanup completed",
+                    "project_id": str(project.id),
+                    "indexes_deleted": total_deleted,
+                    "indexes_failed": total_failed,
+                    "errors": errors[:10] if errors else [],  # Limit errors shown
+                },
+                status=status.HTTP_200_OK,
+            )
+
+        except Exception as e:
+            logger.exception(f"Error during cleanup for project {project.id}")
+            return Response(
+                {"error": f"Cleanup failed: {str(e)}"},
+                status=status.HTTP_500_INTERNAL_SERVER_ERROR,
+            )
+
     @action(detail=True, methods=["post"])
     def index_all(self, request, pk=None):
         """Index all reference data using the project's default profile.
@@ -1049,6 +1115,84 @@ class LookupDataSourceViewSet(viewsets.ModelViewSet):
     permission_classes = [IsAuthenticated]
     pagination_class = CustomPagination
 
+    @action(detail=True, methods=["post"])
+    def cleanup_indexes(self, request, pk=None):
+        """Clean up vector DB indexes for a specific data source.
+
+        POST /api/v1/data-sources/{id}/cleanup_indexes/
+
+        Cleans up all vector DB nodes associated with this data source.
+        Use this before re-uploading a data source or when indexes are corrupted.
+
+        Returns:
+            Summary of cleanup operations performed.
+        """
+        data_source = self.get_object()
+
+        try:
+            from lookup.models import LookupIndexManager
+            from lookup.services.vector_db_cleanup_service import (
+                VectorDBCleanupService,
+            )
+
+            cleanup_service = VectorDBCleanupService()
+            total_deleted = 0
+            total_failed = 0
+            errors = []
+
+            # Get all index managers for this data source
+            index_managers = LookupIndexManager.objects.filter(
+                data_source=data_source
+            ).select_related("profile_manager")
+
+            for index_manager in index_managers:
+                if not index_manager.profile_manager:
+                    continue
+
+                if index_manager.index_ids_history:
+                    result = cleanup_service.cleanup_index_ids(
+                        index_ids=index_manager.index_ids_history,
+                        vector_db_instance_id=str(
+                            index_manager.profile_manager.vector_store_id
+                        ),
+                    )
+                    total_deleted += result.get("deleted", 0)
+                    total_failed += result.get("failed", 0)
+                    if result.get("errors"):
+                        errors.extend(result["errors"])
+
+                    # Clear history if cleanup was successful
+                    if result.get("success"):
+                        index_manager.index_ids_history = []
+                        index_manager.raw_index_id = None
+                        index_manager.reindex_required = True
+                        index_manager.save(
+                            update_fields=[
+                                "index_ids_history",
+                                "raw_index_id",
+                                "reindex_required",
+                            ]
+                        )
+
+            return Response(
+                {
+                    "message": "Cleanup completed",
+                    "data_source_id": str(data_source.id),
+                    "file_name": data_source.file_name,
+                    "indexes_deleted": total_deleted,
+                    "indexes_failed": total_failed,
+                    "errors": errors[:10] if errors else [],
+                },
+                status=status.HTTP_200_OK,
+            )
+
+        except Exception as e:
+            logger.exception(f"Error during cleanup for data source {data_source.id}")
+            return Response(
+                {"error": f"Cleanup failed: {str(e)}"},
+                status=status.HTTP_500_INTERNAL_SERVER_ERROR,
+            )
+
     def get_queryset(self):
         """Filter data sources by project if specified."""
         queryset = super().get_queryset()
@@ -1228,3 +1372,79 @@ def set_default(self, request, pk=None):
 
         serializer = self.get_serializer(profile)
         return Response(serializer.data)
+
+    def partial_update(self, request, *args, **kwargs):
+        """Update a profile and mark indexes as stale if RAG settings changed.
+
+        When chunk_size, chunk_overlap, embedding_model, or vector_store
+        are changed, existing indexes become stale and need re-indexing.
+        """
+        profile = self.get_object()
+
+        # Track original values for RAG-relevant fields
+        original_values = {
+            "chunk_size": profile.chunk_size,
+            "chunk_overlap": profile.chunk_overlap,
+            "embedding_model": str(profile.embedding_model_id)
+            if profile.embedding_model
+            else None,
+            "vector_store": str(profile.vector_store_id)
+            if profile.vector_store
+            else None,
+        }
+
+        # Perform the update
+        response = super().partial_update(request, *args, **kwargs)
+
+        # Check if any RAG-relevant fields changed
+        if response.status_code == status.HTTP_200_OK:
+            profile.refresh_from_db()
+
+            new_values = {
+                "chunk_size": profile.chunk_size,
+                "chunk_overlap": profile.chunk_overlap,
+                "embedding_model": str(profile.embedding_model_id)
+                if profile.embedding_model
+                else None,
+                "vector_store": str(profile.vector_store_id)
+                if profile.vector_store
+                else None,
+            }
+
+            # Determine if re-indexing is needed
+            rag_settings_changed = original_values != new_values
+            was_rag_mode = (
+                original_values["chunk_size"] and original_values["chunk_size"] > 0
+            )
+            is_rag_mode = new_values["chunk_size"] and new_values["chunk_size"] > 0
+
+            if rag_settings_changed and (was_rag_mode or is_rag_mode):
+                # Mark all indexes for this profile as requiring re-index
+                from lookup.models import LookupIndexManager
+
+                updated_count = LookupIndexManager.objects.filter(
+                    profile_manager=profile
+                ).update(reindex_required=True)
+
+                if updated_count > 0:
+                    logger.info(
+                        f"Marked {updated_count} index(es) as requiring re-index "
+                        f"for profile {profile.profile_name}"
+                    )
+
+                # If switching from RAG to full context mode, clean up old indexes
+                if was_rag_mode and not is_rag_mode:
+                    from lookup.services.vector_db_cleanup_service import (
+                        VectorDBCleanupService,
+                    )
+
+                    cleanup_service = VectorDBCleanupService()
+                    cleanup_result = cleanup_service.cleanup_for_profile(
+                        str(profile.profile_id)
+                    )
+                    logger.info(
+                        f"Cleaned up {cleanup_result['deleted']} index(es) "
+                        f"after switching profile {profile.profile_name} to full context mode"
+                    )
+
+        return response

From dc866a18656489fb58c9ea8ff58063ddcc16201f Mon Sep 17 00:00:00 2001
From: gayathrivijayakumar <gayathri@zipstack.com>
Date: Wed, 21 Jan 2026 21:00:56 +0530
Subject: [PATCH 11/22] Introducing prompt level lookups

---
 .../services/lookup_integration_service.py    | 115 ++++++++++--
 .../output_manager_helper.py                  |  34 ++++
 .../0014_toolstudioprompt_lookup_project.py   |  30 ++++
 .../prompt_studio/prompt_studio_v2/models.py  |  10 ++
 .../prompt_studio_v2/serializers.py           |  49 +++++
 .../prompt_studio/prompt_studio_v2/urls.py    |   6 +
 .../prompt_studio/prompt_studio_v2/views.py   |  47 +++++
 .../custom-tools/prompt-card/Header.jsx       | 167 +++++++++++++++++-
 frontend/src/hooks/useAxiosPrivate.js         |   4 +-
 9 files changed, 446 insertions(+), 16 deletions(-)
 create mode 100644 backend/prompt_studio/prompt_studio_v2/migrations/0014_toolstudioprompt_lookup_project.py

diff --git a/backend/lookup/services/lookup_integration_service.py b/backend/lookup/services/lookup_integration_service.py
index e852e0a8b2..93e2a2b459 100644
--- a/backend/lookup/services/lookup_integration_service.py
+++ b/backend/lookup/services/lookup_integration_service.py
@@ -38,6 +38,7 @@ def enrich_if_linked(
         file_execution_id: str | None = None,
         workflow_execution_id: str | None = None,
         organization_id: str | None = None,
+        prompt_lookup_map: dict[str, str] | None = None,
     ) -> dict[str, Any]:
         """Execute Lookup enrichment if PS project has linked Lookups.
 
@@ -48,6 +49,7 @@ def enrich_if_linked(
         - Full audit logging
         - WebSocket log emission for Prompt Studio UI
         - ExecutionLog persistence for Nav bar display (workflow context)
+        - Prompt-level lookup support: specific lookups per field
 
         Args:
             prompt_studio_project_id: UUID of Prompt Studio project
@@ -59,6 +61,10 @@ def enrich_if_linked(
             file_execution_id: File execution ID for Nav bar logs
             workflow_execution_id: Workflow execution ID for Nav bar logs
             organization_id: Organization ID for multi-tenancy
+            prompt_lookup_map: Optional mapping of field names (prompt_key) to
+                specific lookup_project_id. Fields with a specific lookup will
+                ONLY be enriched by that lookup. Fields without a specific
+                lookup will use all project-level linked lookups.
 
         Returns:
             Dict with 'lookup_enrichment' and '_lookup_metadata' keys,
@@ -74,6 +80,7 @@ def enrich_if_linked(
             return {}
 
         timeout = timeout or LOOKUP_ENRICHMENT_TIMEOUT
+        prompt_lookup_map = prompt_lookup_map or {}
 
         try:
             return LookupIntegrationService._execute_enrichment(
@@ -86,6 +93,7 @@ def enrich_if_linked(
                 file_execution_id=file_execution_id,
                 workflow_execution_id=workflow_execution_id,
                 organization_id=organization_id,
+                prompt_lookup_map=prompt_lookup_map,
             )
         except FuturesTimeoutError:
             logger.warning(
@@ -128,8 +136,14 @@ def _execute_enrichment(
         file_execution_id: str | None = None,
         workflow_execution_id: str | None = None,
         organization_id: str | None = None,
+        prompt_lookup_map: dict[str, str] | None = None,
     ) -> dict[str, Any]:
-        """Internal method to execute enrichment with timeout."""
+        """Internal method to execute enrichment with timeout.
+
+        Args:
+            prompt_lookup_map: Mapping of field names to specific lookup project IDs.
+                Fields in this map will only be enriched by their specific lookup.
+        """
         from lookup.models import PromptStudioLookupLink
         from lookup.services.log_emitter import LookupLogEmitter
 
@@ -193,6 +207,7 @@ def _execute_enrichment(
                 prompt_studio_project_id=prompt_studio_project_id,
                 log_emitter=log_emitter,
                 organization_id=organization_id,
+                prompt_lookup_map=prompt_lookup_map or {},
             )
             result = future.result(timeout=timeout)
 
@@ -218,8 +233,23 @@ def _run_orchestrator(
         prompt_studio_project_id: str,
         log_emitter: Any = None,
         organization_id: str | None = None,
+        prompt_lookup_map: dict[str, str] | None = None,
     ) -> dict[str, Any]:
-        """Execute the lookup orchestrator for all linked projects."""
+        """Execute the lookup orchestrator for all linked projects.
+
+        Supports prompt-level lookups: if a field has a specific lookup assigned
+        via prompt_lookup_map, only that lookup will enrich it. Fields without
+        specific lookups will use all project-level linked lookups.
+
+        Args:
+            lookup_projects: List of LookupProject instances linked at project level
+            input_data: Dict of extracted field values
+            execution_id: Execution run ID for tracking
+            prompt_studio_project_id: UUID of Prompt Studio project
+            log_emitter: Optional log emitter for WebSocket logs
+            organization_id: Organization ID for multi-tenancy
+            prompt_lookup_map: Mapping of field names to specific lookup project IDs
+        """
         from lookup.integrations.file_storage_client import FileStorageClient
         from lookup.integrations.unstract_llm_client import UnstractLLMClient
         from lookup.models import LookupProfileManager
@@ -291,17 +321,80 @@ def _run_orchestrator(
                 executor=executor, merger=merger, log_emitter=log_emitter
             )
 
-            # Execute lookups with audit context
-            result = orchestrator.execute_lookups(
-                input_data=input_data,
-                lookup_projects=lookup_projects,
-                execution_id=execution_id,
-                prompt_studio_project_id=prompt_studio_project_id,
-            )
+            # Handle prompt-level lookups if mapping is provided
+            prompt_lookup_map = prompt_lookup_map or {}
+
+            # Separate fields by their lookup assignment
+            # Fields with specific lookups: only that lookup enriches them
+            # Fields without specific lookups: all project-level lookups apply
+            fields_with_specific_lookup: dict[str, dict[str, Any]] = {}
+            fields_without_specific_lookup: dict[str, Any] = {}
+
+            for field_name, field_value in input_data.items():
+                if field_name in prompt_lookup_map:
+                    lookup_id = prompt_lookup_map[field_name]
+                    if lookup_id not in fields_with_specific_lookup:
+                        fields_with_specific_lookup[lookup_id] = {}
+                    fields_with_specific_lookup[lookup_id][field_name] = field_value
+                else:
+                    fields_without_specific_lookup[field_name] = field_value
+
+            all_enrichment: dict[str, Any] = {}
+            total_executed = 0
+            total_successful = 0
+
+            # Execute specific lookups for their assigned fields
+            for lookup_id, fields in fields_with_specific_lookup.items():
+                specific_project = next(
+                    (p for p in lookup_projects if str(p.id) == lookup_id), None
+                )
+                if specific_project:
+                    logger.info(
+                        f"Executing prompt-level lookup {specific_project.name} "
+                        f"for fields: {list(fields.keys())}"
+                    )
+                    result = orchestrator.execute_lookups(
+                        input_data=fields,
+                        lookup_projects=[specific_project],
+                        execution_id=execution_id,
+                        prompt_studio_project_id=prompt_studio_project_id,
+                    )
+                    all_enrichment.update(result.get("lookup_enrichment", {}))
+                    metadata = result.get("_lookup_metadata", {})
+                    total_executed += metadata.get("lookups_executed", 0)
+                    total_successful += metadata.get("lookups_successful", 0)
+                else:
+                    logger.warning(
+                        f"Lookup project {lookup_id} not found in linked projects "
+                        f"for fields: {list(fields.keys())}"
+                    )
+
+            # Execute all project-level lookups for remaining fields
+            if fields_without_specific_lookup:
+                logger.info(
+                    f"Executing project-level lookups for fields: "
+                    f"{list(fields_without_specific_lookup.keys())}"
+                )
+                result = orchestrator.execute_lookups(
+                    input_data=fields_without_specific_lookup,
+                    lookup_projects=lookup_projects,
+                    execution_id=execution_id,
+                    prompt_studio_project_id=prompt_studio_project_id,
+                )
+                all_enrichment.update(result.get("lookup_enrichment", {}))
+                metadata = result.get("_lookup_metadata", {})
+                total_executed += metadata.get("lookups_executed", 0)
+                total_successful += metadata.get("lookups_successful", 0)
 
             return {
-                "lookup_enrichment": result.get("lookup_enrichment", {}),
-                "_lookup_metadata": result.get("_lookup_metadata", {}),
+                "lookup_enrichment": all_enrichment,
+                "_lookup_metadata": {
+                    "status": "success",
+                    "lookups_executed": total_executed,
+                    "lookups_successful": total_successful,
+                    "prompt_level_lookups": len(fields_with_specific_lookup),
+                    "project_level_fields": len(fields_without_specific_lookup),
+                },
             }
 
         except Exception as e:
diff --git a/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py b/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
index a7da45cd8a..25ec86ef7c 100644
--- a/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
+++ b/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
@@ -27,24 +27,50 @@
 logger = logging.getLogger(__name__)
 
 
+def _build_prompt_lookup_map(
+    prompts: list[ToolStudioPrompt],
+) -> dict[str, str]:
+    """Build mapping of prompt_key to lookup_project_id for prompts with lookups.
+
+    Args:
+        prompts: List of ToolStudioPrompt instances
+
+    Returns:
+        Dict mapping prompt_key to lookup_project_id (as string) for prompts
+        that have a lookup_project assigned.
+    """
+    prompt_lookup_map: dict[str, str] = {}
+    for prompt in prompts:
+        if prompt.lookup_project_id:
+            prompt_lookup_map[prompt.prompt_key] = str(prompt.lookup_project_id)
+    return prompt_lookup_map
+
+
 def _try_lookup_enrichment(
     tool_id: str,
     extracted_data: dict[str, Any],
     run_id: str | None = None,
     session_id: str | None = None,
     doc_name: str | None = None,
+    prompt_lookup_map: dict[str, str] | None = None,
 ) -> dict[str, Any]:
     """Attempt Lookup enrichment if available.
 
     This function safely attempts to enrich extracted data using linked
     Lookup projects. Returns empty dict if Lookup app is not available.
 
+    Supports prompt-level lookups: if a field has a specific lookup assigned
+    via prompt_lookup_map, only that lookup will enrich it. Fields without
+    specific lookups will use all project-level linked lookups.
+
     Args:
         tool_id: Prompt Studio project (CustomTool) UUID
         extracted_data: Dict of extracted field values from prompts
         run_id: Optional execution run ID for tracking
         session_id: Optional WebSocket session ID for real-time log emission
         doc_name: Optional document name being processed
+        prompt_lookup_map: Optional mapping of field names (prompt_key) to
+            specific lookup_project_id for prompt-level lookup support
 
     Returns:
         Dict with 'lookup_enrichment' and '_lookup_metadata' keys,
@@ -67,6 +93,7 @@ def _try_lookup_enrichment(
             session_id=session_id,
             doc_name=doc_name,
             organization_id=organization_id,
+            prompt_lookup_map=prompt_lookup_map,
         )
     except ImportError:
         # Lookup app not installed
@@ -283,12 +310,19 @@ def update_or_create_prompt_output(
             # Get session_id for WebSocket log emission
             session_id = StateStore.get(Common.LOG_EVENTS_ID)
             doc_name = metadata.get("file_name") or document_manager.document_name
+
+            # Build prompt-level lookup mapping for per-prompt lookup support
+            prompt_lookup_map = _build_prompt_lookup_map(prompts)
+            if prompt_lookup_map:
+                logger.info(f"Using prompt-level lookups: {prompt_lookup_map}")
+
             lookup_result = _try_lookup_enrichment(
                 tool_id=tool_id_str,
                 extracted_data=extracted_data_for_lookup,
                 run_id=run_id,
                 session_id=session_id,
                 doc_name=doc_name,
+                prompt_lookup_map=prompt_lookup_map,
             )
             logger.info(f"Lookup enrichment result: {lookup_result}")
 
diff --git a/backend/prompt_studio/prompt_studio_v2/migrations/0014_toolstudioprompt_lookup_project.py b/backend/prompt_studio/prompt_studio_v2/migrations/0014_toolstudioprompt_lookup_project.py
new file mode 100644
index 0000000000..0317e76183
--- /dev/null
+++ b/backend/prompt_studio/prompt_studio_v2/migrations/0014_toolstudioprompt_lookup_project.py
@@ -0,0 +1,30 @@
+# Generated by Django 4.2.1 on 2025-01-21 09:15
+
+import django.db.models.deletion
+from django.db import migrations, models
+
+
+class Migration(migrations.Migration):
+    dependencies = [
+        ("lookup", "0001_initial"),
+        (
+            "prompt_studio_v2",
+            "0013_toolstudioprompt_enable_postprocessing_webhook_and_more",
+        ),
+    ]
+
+    operations = [
+        migrations.AddField(
+            model_name="toolstudioprompt",
+            name="lookup_project",
+            field=models.ForeignKey(
+                blank=True,
+                db_comment="Lookup project for this prompt's enrichment. "
+                "Must be linked at project level via PromptStudioLookupLink.",
+                null=True,
+                on_delete=django.db.models.deletion.SET_NULL,
+                related_name="linked_prompts",
+                to="lookup.lookupproject",
+            ),
+        ),
+    ]
diff --git a/backend/prompt_studio/prompt_studio_v2/models.py b/backend/prompt_studio/prompt_studio_v2/models.py
index 74739bfe5a..ceebacd8a3 100644
--- a/backend/prompt_studio/prompt_studio_v2/models.py
+++ b/backend/prompt_studio/prompt_studio_v2/models.py
@@ -139,6 +139,16 @@ class RequiredType(models.TextChoices):
     postprocessing_webhook_url = models.TextField(
         blank=True, null=True, db_comment="URL endpoint for postprocessing webhook"
     )
+    # Prompt-level lookup association
+    lookup_project = models.ForeignKey(
+        "lookup.LookupProject",
+        on_delete=models.SET_NULL,
+        related_name="linked_prompts",
+        null=True,
+        blank=True,
+        db_comment="Lookup project for this prompt's enrichment. "
+        "Must be linked at project level via PromptStudioLookupLink.",
+    )
     # Eval settings for the prompt
     # NOTE:
     # - Field name format is eval_<metric_type>_<metric_name>
diff --git a/backend/prompt_studio/prompt_studio_v2/serializers.py b/backend/prompt_studio/prompt_studio_v2/serializers.py
index e1adddc33c..9ade56e2a8 100644
--- a/backend/prompt_studio/prompt_studio_v2/serializers.py
+++ b/backend/prompt_studio/prompt_studio_v2/serializers.py
@@ -6,10 +6,59 @@
 
 
 class ToolStudioPromptSerializer(AuditSerializer):
+    """Serializer for ToolStudioPrompt model with lookup project validation."""
+
+    lookup_project_details = serializers.SerializerMethodField(read_only=True)
+
     class Meta:
         model = ToolStudioPrompt
         fields = "__all__"
 
+    def get_lookup_project_details(self, obj: ToolStudioPrompt) -> dict | None:
+        """Return lookup project name and id if set."""
+        if obj.lookup_project:
+            return {
+                "id": str(obj.lookup_project.id),
+                "name": obj.lookup_project.name,
+            }
+        return None
+
+    def validate_lookup_project(self, value):
+        """Validate that the lookup project is linked to the PS project.
+
+        The selected lookup project must be linked at the project level
+        via PromptStudioLookupLink before it can be assigned to a prompt.
+        """
+        if value is None:
+            return value
+
+        # Get tool_id from instance (update) or initial data (create)
+        tool_id = None
+        if self.instance:
+            tool_id = self.instance.tool_id_id
+        elif "tool_id" in self.initial_data:
+            tool_id = self.initial_data["tool_id"]
+
+        if tool_id:
+            try:
+                from lookup.models import PromptStudioLookupLink
+
+                link_exists = PromptStudioLookupLink.objects.filter(
+                    prompt_studio_project_id=tool_id,
+                    lookup_project=value,
+                ).exists()
+
+                if not link_exists:
+                    raise serializers.ValidationError(
+                        "Selected lookup project must be linked to this "
+                        "Prompt Studio project at the project level first."
+                    )
+            except ImportError:
+                # Lookup app not installed, skip validation
+                pass
+
+        return value
+
 
 class ToolStudioIndexSerializer(serializers.Serializer):
     file_name = serializers.CharField()
diff --git a/backend/prompt_studio/prompt_studio_v2/urls.py b/backend/prompt_studio/prompt_studio_v2/urls.py
index 23e5f02438..767c7f209e 100644
--- a/backend/prompt_studio/prompt_studio_v2/urls.py
+++ b/backend/prompt_studio/prompt_studio_v2/urls.py
@@ -13,6 +13,7 @@
 )
 
 reorder_prompts = ToolStudioPromptView.as_view({"post": "reorder_prompts"})
+available_lookups = ToolStudioPromptView.as_view({"get": "available_lookups"})
 
 urlpatterns = format_suffix_patterns(
     [
@@ -26,5 +27,10 @@
             reorder_prompts,
             name="reorder_prompts",
         ),
+        path(
+            "prompt/available_lookups/",
+            available_lookups,
+            name="available_lookups",
+        ),
     ]
 )
diff --git a/backend/prompt_studio/prompt_studio_v2/views.py b/backend/prompt_studio/prompt_studio_v2/views.py
index f120baf15f..95483a1fd4 100644
--- a/backend/prompt_studio/prompt_studio_v2/views.py
+++ b/backend/prompt_studio/prompt_studio_v2/views.py
@@ -53,3 +53,50 @@ def reorder_prompts(self, request: Request) -> Response:
         """
         prompt_studio_controller = PromptStudioController()
         return prompt_studio_controller.reorder_prompts(request, ToolStudioPrompt)
+
+    @action(detail=False, methods=["get"])
+    def available_lookups(self, request: Request) -> Response:
+        """Get lookup projects linked to a Prompt Studio project.
+
+        Returns the list of lookup projects that are linked at the project level
+        and can be assigned to individual prompts for enrichment.
+
+        Query Parameters:
+            tool_id: UUID of the Prompt Studio project (CustomTool)
+
+        Returns:
+            Response: List of available lookup projects with id, name, and is_ready status
+        """
+        tool_id = request.query_params.get("tool_id")
+        if not tool_id:
+            return Response(
+                {"error": "tool_id query parameter is required"},
+                status=400,
+            )
+
+        try:
+            from lookup.models import PromptStudioLookupLink
+
+            links = PromptStudioLookupLink.objects.filter(
+                prompt_studio_project_id=tool_id
+            ).select_related("lookup_project")
+
+            available_lookups = [
+                {
+                    "id": str(link.lookup_project.id),
+                    "name": link.lookup_project.name,
+                    "is_ready": link.lookup_project.is_ready,
+                }
+                for link in links
+                if link.lookup_project.is_active
+            ]
+
+            return Response(available_lookups)
+        except ImportError:
+            # Lookup app not installed
+            return Response([])
+        except Exception as e:
+            return Response(
+                {"error": f"Failed to fetch available lookups: {str(e)}"},
+                status=500,
+            )
diff --git a/frontend/src/components/custom-tools/prompt-card/Header.jsx b/frontend/src/components/custom-tools/prompt-card/Header.jsx
index d46b181ab5..fce10b6043 100644
--- a/frontend/src/components/custom-tools/prompt-card/Header.jsx
+++ b/frontend/src/components/custom-tools/prompt-card/Header.jsx
@@ -8,7 +8,6 @@ import {
   SyncOutlined,
   InfoCircleOutlined,
 } from "@ant-design/icons";
-import { useEffect, useState, useRef } from "react";
 import {
   Button,
   Checkbox,
@@ -16,12 +15,16 @@ import {
   Dropdown,
   Input,
   Row,
+  Select,
   Tag,
   Tooltip,
 } from "antd";
 import debounce from "lodash/debounce";
 import PropTypes from "prop-types";
+import { useEffect, useState, useRef, useCallback } from "react";
 
+import { useAxiosPrivate } from "../../../hooks/useAxiosPrivate";
+import { useSessionStore } from "../../../store/session-store";
 import {
   PROMPT_RUN_TYPES,
   promptStudioUpdateStatus,
@@ -67,6 +70,8 @@ function Header({
     isSimplePromptStudio,
     details,
   } = useCustomToolStore();
+  const axiosPrivate = useAxiosPrivate();
+  const { sessionDetails } = useSessionStore();
   const [items, setItems] = useState([]);
 
   const [isDisablePrompt, setIsDisablePrompt] = useState(null);
@@ -74,6 +79,13 @@ function Header({
   const [webhookEnabled, setWebhookEnabled] = useState(false);
   const [webhookUrl, setWebhookUrl] = useState("");
 
+  // Lookup state
+  const [lookupEnabled, setLookupEnabled] = useState(false);
+  const [selectedLookup, setSelectedLookup] = useState(null);
+  const [availableLookups, setAvailableLookups] = useState([]);
+  const [lookupLoading, setLookupLoading] = useState(false);
+  const [lookupsFetched, setLookupsFetched] = useState(false);
+
   // Stable debounced functions using useRef
   const debouncedWebhookEnabledChangeRef = useRef(
     debounce((value, promptId, handleChangeFn, setStateFn) => {
@@ -151,13 +163,84 @@ function Header({
       setWebhookUrl
     );
   };
+
+  // Fetch available lookup projects for this PS project (lazy load on dropdown open)
+  const fetchAvailableLookups = useCallback(async () => {
+    if (!details?.tool_id || !sessionDetails?.orgId) return;
+    if (lookupsFetched) return; // Already fetched, skip
+
+    setLookupLoading(true);
+    try {
+      const response = await axiosPrivate.get(
+        `/api/v1/unstract/${sessionDetails.orgId}/prompt-studio/prompt/available_lookups/`,
+        { params: { tool_id: details.tool_id } }
+      );
+      setAvailableLookups(response?.data || []);
+      setLookupsFetched(true);
+    } catch (error) {
+      console.error("Failed to fetch available lookups:", error);
+      setAvailableLookups([]);
+    } finally {
+      setLookupLoading(false);
+    }
+  }, [details?.tool_id, sessionDetails?.orgId, axiosPrivate, lookupsFetched]);
+
+  // Handle lookup enabled checkbox change
+  const handleLookupEnabledChange = (e) => {
+    const newValue = e.target.checked;
+    setLookupEnabled(newValue);
+    if (!newValue) {
+      // When disabling, clear the selected lookup
+      setSelectedLookup(null);
+      handleChange(
+        null,
+        promptDetails?.prompt_id,
+        "lookup_project",
+        true,
+        true
+      ).catch(() => {
+        // Rollback on error
+        setLookupEnabled(true);
+        setSelectedLookup(promptDetails?.lookup_project || null);
+      });
+    }
+  };
+
+  // Handle lookup project selection change
+  const handleLookupChange = (value) => {
+    const newValue = value || null;
+    setSelectedLookup(newValue);
+    if (!newValue) {
+      // If clearing the selection, also disable lookup
+      setLookupEnabled(false);
+    }
+    handleChange(
+      newValue,
+      promptDetails?.prompt_id,
+      "lookup_project",
+      true,
+      true
+    ).catch(() => {
+      // Rollback on error
+      setLookupEnabled(!!promptDetails?.lookup_project);
+      setSelectedLookup(promptDetails?.lookup_project || null);
+    });
+  };
+
   useEffect(() => {
     setIsDisablePrompt(promptDetails?.active);
     setRequired(promptDetails?.required);
     setWebhookEnabled(promptDetails?.enable_postprocessing_webhook || false);
     setWebhookUrl(promptDetails?.postprocessing_webhook_url || "");
+    setLookupEnabled(!!promptDetails?.lookup_project);
+    setSelectedLookup(promptDetails?.lookup_project || null);
   }, [promptDetails, details]);
 
+  // Reset lookupsFetched when tool changes so we refetch on next dropdown open
+  useEffect(() => {
+    setLookupsFetched(false);
+  }, [details?.tool_id]);
+
   useEffect(() => {
     const dropdownItems = [
       {
@@ -248,6 +331,65 @@ function Header({
         ),
         key: "required",
       },
+      {
+        label: (
+          <div>
+            <Checkbox
+              checked={lookupEnabled}
+              onChange={handleLookupEnabledChange}
+              onClick={(e) => e.stopPropagation()}
+              disabled={availableLookups.length === 0 && !lookupEnabled}
+            >
+              Enable Look-up{" "}
+              <Tooltip title="Enable lookup enrichment for this prompt. Only lookup projects linked at the project level can be selected.">
+                <InfoCircleOutlined />
+              </Tooltip>
+            </Checkbox>
+            {lookupEnabled && availableLookups.length > 0 && (
+              <div style={{ marginTop: "8px", marginLeft: "24px" }}>
+                <Select
+                  placeholder="Select Lookup Project"
+                  value={selectedLookup}
+                  onChange={handleLookupChange}
+                  onClick={(e) => e.stopPropagation()}
+                  onMouseDown={(e) => e.stopPropagation()}
+                  size="small"
+                  style={{ width: "100%" }}
+                  allowClear
+                  loading={lookupLoading}
+                >
+                  {availableLookups.map((lookup) => (
+                    <Select.Option
+                      key={lookup.id}
+                      value={lookup.id}
+                      disabled={!lookup.is_ready}
+                    >
+                      {lookup.name} {!lookup.is_ready && "(Not Ready)"}
+                    </Select.Option>
+                  ))}
+                </Select>
+              </div>
+            )}
+            {availableLookups.length === 0 && !lookupLoading && (
+              <div
+                style={{
+                  fontSize: "11px",
+                  color: "#999",
+                  marginTop: "4px",
+                }}
+              >
+                No lookup projects linked at project level.
+                <br />
+                Link lookups in Settings → Lookups first.
+              </div>
+            )}
+          </div>
+        ),
+        key: "lookup",
+      },
+      {
+        type: "divider",
+      },
       {
         label: (
           <ConfirmModal
@@ -270,7 +412,17 @@ function Header({
     }
 
     setItems(dropdownItems);
-  }, [isDisablePrompt, required, enforceType, webhookEnabled, webhookUrl]);
+  }, [
+    isDisablePrompt,
+    required,
+    enforceType,
+    webhookEnabled,
+    webhookUrl,
+    lookupEnabled,
+    selectedLookup,
+    availableLookups,
+    lookupLoading,
+  ]);
 
   return (
     <Row>
@@ -400,7 +552,16 @@ function Header({
             promptDetails={promptDetails}
           />
         )}
-        <Dropdown menu={{ items }} trigger={["click"]} placement="bottomLeft">
+        <Dropdown
+          menu={{ items }}
+          trigger={["click"]}
+          placement="bottomLeft"
+          onOpenChange={(open) => {
+            if (open) {
+              fetchAvailableLookups();
+            }
+          }}
+        >
           <Button
             size="small"
             type="text"
diff --git a/frontend/src/hooks/useAxiosPrivate.js b/frontend/src/hooks/useAxiosPrivate.js
index 26e4cea963..b7c940e7ee 100644
--- a/frontend/src/hooks/useAxiosPrivate.js
+++ b/frontend/src/hooks/useAxiosPrivate.js
@@ -1,10 +1,10 @@
 import axios from "axios";
-import { useEffect } from "react";
+import { useEffect, useMemo } from "react";
 
 import useLogout from "./useLogout";
 
 function useAxiosPrivate() {
-  const axiosPrivate = axios.create();
+  const axiosPrivate = useMemo(() => axios.create(), []);
   const logout = useLogout();
 
   useEffect(() => {

From b22742e703a4a4fb958f72ea91cab75aaa5fe188 Mon Sep 17 00:00:00 2001
From: gayathrivijayakumar <gayathri@zipstack.com>
Date: Fri, 23 Jan 2026 21:07:55 +0530
Subject: [PATCH 12/22] Fix lookup for api deployments and combined output

---
 backend/lookup/models/lookup_data_source.py   |  27 ++-
 backend/lookup/services/lookup_executor.py    |   5 +
 .../services/lookup_integration_service.py    |   6 +
 .../lookup/services/lookup_orchestrator.py    |  21 +-
 .../lookup/services/workflow_integration.py   |  70 ++++++-
 backend/lookup/views.py                       |  39 ++++
 .../prompt_studio_core_v2/views.py            |  33 +++-
 .../output_manager_helper.py                  |  82 +++++++-
 .../components/lookups/debug-tab/DebugTab.jsx | 186 ++++++++++++++++--
 .../ProfileFormModal.jsx                      | 134 ++++++-------
 10 files changed, 500 insertions(+), 103 deletions(-)

diff --git a/backend/lookup/models/lookup_data_source.py b/backend/lookup/models/lookup_data_source.py
index 9417543b61..afa0406e66 100644
--- a/backend/lookup/models/lookup_data_source.py
+++ b/backend/lookup/models/lookup_data_source.py
@@ -4,7 +4,7 @@
 
 from django.contrib.auth import get_user_model
 from django.db import models
-from django.db.models.signals import pre_save
+from django.db.models.signals import post_delete, pre_save
 from django.dispatch import receiver
 from utils.models.base_model import BaseModel
 
@@ -193,3 +193,28 @@ def auto_increment_version_and_update_latest(sender, instance, **kwargs):
 
         # Ensure new version is marked as latest
         instance.is_latest = True
+
+
+@receiver(post_delete, sender=LookupDataSource)
+def promote_previous_version_to_latest(sender, instance, **kwargs):
+    """Signal to promote the previous version to latest when the current latest is deleted.
+
+    This signal:
+    1. Checks if the deleted instance was the latest version
+    2. If so, promotes the next most recent version to be the latest
+    """
+    # Only act if the deleted instance was the latest
+    if not instance.is_latest:
+        return
+
+    # Find the next most recent data source for this project
+    # (highest version_number among remaining records)
+    next_latest = (
+        LookupDataSource.objects.filter(project_id=instance.project_id)
+        .order_by("-version_number")
+        .first()
+    )
+
+    if next_latest:
+        next_latest.is_latest = True
+        next_latest.save(update_fields=["is_latest"])
diff --git a/backend/lookup/services/lookup_executor.py b/backend/lookup/services/lookup_executor.py
index d2a9924c91..0fb6349f22 100644
--- a/backend/lookup/services/lookup_executor.py
+++ b/backend/lookup/services/lookup_executor.py
@@ -319,6 +319,11 @@ def execute(
                     f"context window."
                 )
                 result = self._failed_result(lookup_project, error_msg, start_time)
+                # Add context window error details for specialized logging
+                result["error_type"] = "context_window_exceeded"
+                result["token_count"] = e.token_count
+                result["context_limit"] = e.context_limit
+                result["model"] = e.model
                 self._log_audit(
                     exec_id,
                     lookup_project,
diff --git a/backend/lookup/services/lookup_integration_service.py b/backend/lookup/services/lookup_integration_service.py
index 93e2a2b459..7967854a91 100644
--- a/backend/lookup/services/lookup_integration_service.py
+++ b/backend/lookup/services/lookup_integration_service.py
@@ -340,6 +340,7 @@ def _run_orchestrator(
                     fields_without_specific_lookup[field_name] = field_value
 
             all_enrichment: dict[str, Any] = {}
+            all_enrichments: list[dict[str, Any]] = []  # Collect all enrichment results
             total_executed = 0
             total_successful = 0
 
@@ -363,6 +364,8 @@ def _run_orchestrator(
                     metadata = result.get("_lookup_metadata", {})
                     total_executed += metadata.get("lookups_executed", 0)
                     total_successful += metadata.get("lookups_successful", 0)
+                    # Collect enrichment details for error checking
+                    all_enrichments.extend(metadata.get("enrichments", []))
                 else:
                     logger.warning(
                         f"Lookup project {lookup_id} not found in linked projects "
@@ -385,6 +388,8 @@ def _run_orchestrator(
                 metadata = result.get("_lookup_metadata", {})
                 total_executed += metadata.get("lookups_executed", 0)
                 total_successful += metadata.get("lookups_successful", 0)
+                # Collect enrichment details for error checking
+                all_enrichments.extend(metadata.get("enrichments", []))
 
             return {
                 "lookup_enrichment": all_enrichment,
@@ -394,6 +399,7 @@ def _run_orchestrator(
                     "lookups_successful": total_successful,
                     "prompt_level_lookups": len(fields_with_specific_lookup),
                     "project_level_fields": len(fields_without_specific_lookup),
+                    "enrichments": all_enrichments,  # Include for error checking
                 },
             }
 
diff --git a/backend/lookup/services/lookup_orchestrator.py b/backend/lookup/services/lookup_orchestrator.py
index 3e10394af1..9f20e59726 100644
--- a/backend/lookup/services/lookup_orchestrator.py
+++ b/backend/lookup/services/lookup_orchestrator.py
@@ -431,10 +431,21 @@ def _emit_failure_log(
             return
 
         try:
-            error_message = result.get("error", "Unknown error")
-            self.log_emitter.emit_enrichment_failure(
-                lookup_project_name=lookup_project.name,
-                error_message=error_message,
-            )
+            error_type = result.get("error_type")
+
+            # Use specialized log for context window exceeded errors
+            if error_type == "context_window_exceeded":
+                self.log_emitter.emit_context_overflow_error(
+                    lookup_project_name=lookup_project.name,
+                    token_count=result.get("token_count", 0),
+                    context_limit=result.get("context_limit", 0),
+                    model=result.get("model", "unknown"),
+                )
+            else:
+                error_message = result.get("error", "Unknown error")
+                self.log_emitter.emit_enrichment_failure(
+                    lookup_project_name=lookup_project.name,
+                    error_message=error_message,
+                )
         except Exception as e:
             logger.warning(f"Failed to emit failure log: {e}")
diff --git a/backend/lookup/services/workflow_integration.py b/backend/lookup/services/workflow_integration.py
index b2bb1f68ba..637f3e438b 100644
--- a/backend/lookup/services/workflow_integration.py
+++ b/backend/lookup/services/workflow_integration.py
@@ -89,10 +89,23 @@ def execute_lookups_for_file(
             # Get enrichment result
             enrichment = result.get("lookup_enrichment", {})
 
-            # Merge enrichment into extraction output
+            # Replace enriched values in extraction output (not add at top level)
+            # The enrichment dict contains {field_name: enriched_value} pairs
+            # These should replace the original values in extraction_output
             if enrichment:
                 merged_output = extraction_output.copy()
-                merged_output.update(enrichment)
+                for field_name, enriched_value in enrichment.items():
+                    if field_name in merged_output:
+                        logger.info(
+                            f"[LOOKUP] Replacing '{field_name}' value: "
+                            f"'{merged_output[field_name]}' -> '{enriched_value}'"
+                        )
+                        merged_output[field_name] = enriched_value
+                    else:
+                        logger.warning(
+                            f"[LOOKUP] Field '{field_name}' not found in extraction_output, "
+                            f"skipping enrichment"
+                        )
                 return merged_output
 
             return extraction_output
@@ -219,6 +232,21 @@ def process_workflow_enrichment(
             workflow_execution_id = file_execution.workflow_execution_id
             organization_id = str(workflow.organization_id)
 
+            # Extract the actual output data for enrichment
+            # The workflow output structure is: {metadata: {...}, metrics: {...}, output: {...}}
+            # The extracted fields are inside the 'output' key
+            extracted_fields = output_data.get("output", {})
+            if not extracted_fields or not isinstance(extracted_fields, dict):
+                logger.info(
+                    "[LOOKUP] No 'output' key found or not a dict in output_data, "
+                    "trying to use output_data directly"
+                )
+                extracted_fields = output_data
+
+            logger.info(
+                f"[LOOKUP] Extracted fields for enrichment: {list(extracted_fields.keys())}"
+            )
+
             # Execute lookups with file execution context for Nav bar logging
             # LookupIntegrationService handles all logging via LookupLogEmitter
             from lookup.services.lookup_integration_service import (
@@ -227,7 +255,7 @@ def process_workflow_enrichment(
 
             result = LookupIntegrationService.enrich_if_linked(
                 prompt_studio_project_id=prompt_studio_project_id,
-                extracted_data=output_data,
+                extracted_data=extracted_fields,
                 run_id=str(uuid.uuid4()),
                 file_execution_id=file_execution_id,
                 workflow_execution_id=str(workflow_execution_id),
@@ -239,10 +267,42 @@ def process_workflow_enrichment(
             _metadata = result.get("_lookup_metadata", {})  # noqa F841
             enrichment = result.get("lookup_enrichment", {})
 
-            # Merge enrichment into output
+            # Replace enriched values in the output structure
+            # The enrichment dict contains {field_name: enriched_value} pairs
             if enrichment:
                 merged_output = output_data.copy()
-                merged_output.update(enrichment)
+                # Check if we need to update inside 'output' key or at top level
+                if "output" in merged_output and isinstance(
+                    merged_output["output"], dict
+                ):
+                    # Update inside the 'output' sub-object
+                    merged_output["output"] = merged_output["output"].copy()
+                    for field_name, enriched_value in enrichment.items():
+                        if field_name in merged_output["output"]:
+                            logger.info(
+                                f"[LOOKUP] Replacing output['{field_name}'] value: "
+                                f"'{merged_output['output'][field_name]}' -> '{enriched_value}'"
+                            )
+                            merged_output["output"][field_name] = enriched_value
+                        else:
+                            logger.warning(
+                                f"[LOOKUP] Field '{field_name}' not found in output, "
+                                f"skipping enrichment"
+                            )
+                else:
+                    # Update at top level (fallback for flat structure)
+                    for field_name, enriched_value in enrichment.items():
+                        if field_name in merged_output:
+                            logger.info(
+                                f"[LOOKUP] Replacing '{field_name}' value: "
+                                f"'{merged_output[field_name]}' -> '{enriched_value}'"
+                            )
+                            merged_output[field_name] = enriched_value
+                        else:
+                            logger.warning(
+                                f"[LOOKUP] Field '{field_name}' not found in output_data, "
+                                f"skipping enrichment"
+                            )
                 return merged_output, True
 
             return original_output, False
diff --git a/backend/lookup/views.py b/backend/lookup/views.py
index f2e573fb2d..9416acc689 100644
--- a/backend/lookup/views.py
+++ b/backend/lookup/views.py
@@ -176,6 +176,45 @@ def execute(self, request, pk=None):
                 input_data=input_data, lookup_projects=[project]
             )
 
+            # Check if any lookups failed - return error response if so
+            metadata = result.get("_lookup_metadata", {})
+            enrichments = metadata.get("enrichments", [])
+            failed_enrichments = [e for e in enrichments if e.get("status") == "failed"]
+
+            if failed_enrichments:
+                # Find context window errors first (more specific)
+                context_window_error = next(
+                    (
+                        e
+                        for e in failed_enrichments
+                        if e.get("error_type") == "context_window_exceeded"
+                    ),
+                    None,
+                )
+
+                if context_window_error:
+                    return Response(
+                        {
+                            "error": context_window_error.get("error"),
+                            "error_type": "context_window_exceeded",
+                            "token_count": context_window_error.get("token_count"),
+                            "context_limit": context_window_error.get("context_limit"),
+                            "model": context_window_error.get("model"),
+                            "_lookup_metadata": metadata,
+                        },
+                        status=status.HTTP_400_BAD_REQUEST,
+                    )
+                else:
+                    # Other failure - return first error
+                    first_error = failed_enrichments[0]
+                    return Response(
+                        {
+                            "error": first_error.get("error", "Look-Up execution failed"),
+                            "_lookup_metadata": metadata,
+                        },
+                        status=status.HTTP_400_BAD_REQUEST,
+                    )
+
             # Serialize response
             response_serializer = LookupExecutionResponseSerializer(data=result)
             response_serializer.is_valid(raise_exception=True)
diff --git a/backend/prompt_studio/prompt_studio_core_v2/views.py b/backend/prompt_studio/prompt_studio_core_v2/views.py
index 5e1f0d2a3f..0083e1ea9a 100644
--- a/backend/prompt_studio/prompt_studio_core_v2/views.py
+++ b/backend/prompt_studio/prompt_studio_core_v2/views.py
@@ -399,6 +399,10 @@ def fetch_response(self, request: HttpRequest, pk: Any = None) -> Response:
         Returns:
             Response
         """
+        from prompt_studio.prompt_studio_output_manager_v2.output_manager_helper import (
+            LookupEnrichmentError,
+        )
+
         custom_tool = self.get_object()
         tool_id: str = str(custom_tool.tool_id)
         document_id: str = request.data.get(ToolStudioPromptKeys.DOCUMENT_ID)
@@ -408,16 +412,25 @@ def fetch_response(self, request: HttpRequest, pk: Any = None) -> Response:
         if not run_id:
             # Generate a run_id
             run_id = CommonUtils.generate_uuid()
-        response: dict[str, Any] = PromptStudioHelper.prompt_responder(
-            id=id,
-            tool_id=tool_id,
-            org_id=UserSessionUtils.get_organization_id(request),
-            user_id=custom_tool.created_by.user_id,
-            document_id=document_id,
-            run_id=run_id,
-            profile_manager_id=profile_manager,
-        )
-        return Response(response, status=status.HTTP_200_OK)
+        try:
+            response: dict[str, Any] = PromptStudioHelper.prompt_responder(
+                id=id,
+                tool_id=tool_id,
+                org_id=UserSessionUtils.get_organization_id(request),
+                user_id=custom_tool.created_by.user_id,
+                document_id=document_id,
+                run_id=run_id,
+                profile_manager_id=profile_manager,
+            )
+            return Response(response, status=status.HTTP_200_OK)
+        except LookupEnrichmentError as e:
+            # Return error response for critical lookup failures
+            error_response = {
+                "error": str(e),
+                "error_type": e.error_type,
+                **e.details,
+            }
+            return Response(error_response, status=status.HTTP_400_BAD_REQUEST)
 
     @action(detail=True, methods=["post"])
     def single_pass_extraction(self, request: HttpRequest, pk: uuid) -> Response:
diff --git a/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py b/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
index 25ec86ef7c..d9d03ab314 100644
--- a/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
+++ b/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
@@ -46,6 +46,24 @@ def _build_prompt_lookup_map(
     return prompt_lookup_map
 
 
+class LookupEnrichmentError(Exception):
+    """Exception raised when lookup enrichment fails critically.
+
+    This exception is raised for errors that should stop prompt execution
+    and be displayed to the user, such as context window exceeded errors.
+    """
+
+    def __init__(
+        self,
+        message: str,
+        error_type: str | None = None,
+        details: dict[str, Any] | None = None,
+    ):
+        super().__init__(message)
+        self.error_type = error_type
+        self.details = details or {}
+
+
 def _try_lookup_enrichment(
     tool_id: str,
     extracted_data: dict[str, Any],
@@ -75,6 +93,10 @@ def _try_lookup_enrichment(
     Returns:
         Dict with 'lookup_enrichment' and '_lookup_metadata' keys,
         or empty dict if Lookup is not available or no links exist.
+
+    Raises:
+        LookupEnrichmentError: When lookup fails with a critical error that
+            should stop execution (e.g., context window exceeded).
     """
     try:
         from utils.user_context import UserContext
@@ -86,7 +108,7 @@ def _try_lookup_enrichment(
         # Get organization ID from user context for RAG retrieval
         organization_id = UserContext.get_organization_identifier()
 
-        return LookupIntegrationService.enrich_if_linked(
+        result = LookupIntegrationService.enrich_if_linked(
             prompt_studio_project_id=tool_id,
             extracted_data=extracted_data,
             run_id=run_id,
@@ -95,12 +117,50 @@ def _try_lookup_enrichment(
             organization_id=organization_id,
             prompt_lookup_map=prompt_lookup_map,
         )
+
+        # Check if any lookups failed with critical errors
+        metadata = result.get("_lookup_metadata", {})
+        enrichments = metadata.get("enrichments", [])
+
+        logger.info(f"Checking {len(enrichments)} enrichments for critical errors")
+
+        for enrichment in enrichments:
+            logger.info(
+                f"Enrichment status={enrichment.get('status')}, "
+                f"error_type={enrichment.get('error_type')}, "
+                f"error={enrichment.get('error', '')[:100]}"
+            )
+            if enrichment.get("status") == "failed":
+                error_type = enrichment.get("error_type")
+                error_msg = enrichment.get("error", "Unknown lookup error")
+
+                # Context window exceeded is a critical error - raise it
+                if error_type == "context_window_exceeded":
+                    logger.error(
+                        f"Context window exceeded error detected! "
+                        f"Raising LookupEnrichmentError: {error_msg}"
+                    )
+                    raise LookupEnrichmentError(
+                        message=error_msg,
+                        error_type=error_type,
+                        details={
+                            "token_count": enrichment.get("token_count"),
+                            "context_limit": enrichment.get("context_limit"),
+                            "model": enrichment.get("model"),
+                            "project_name": enrichment.get("project_name"),
+                        },
+                    )
+
+        return result
     except ImportError:
         # Lookup app not installed
         logger.debug("Lookup app not available, skipping enrichment")
         return {}
+    except LookupEnrichmentError:
+        # Re-raise critical lookup errors to be handled by caller
+        raise
     except Exception as e:
-        # Don't let Lookup errors break PS execution
+        # Don't let non-critical Lookup errors break PS execution
         logger.warning(f"Lookup enrichment failed (non-fatal): {e}")
         return {
             "lookup_enrichment": {},
@@ -353,6 +413,24 @@ def update_or_create_prompt_output(
                                 "field_name": prompt_key,
                             }
                             item["output"] = enriched_value
+
+                            # Update the database record with the enriched value
+                            # so combined output also shows the correct lookup data
+                            output_manager_id = item.get("prompt_output_id")
+                            if output_manager_id:
+                                try:
+                                    PromptStudioOutputManager.objects.filter(
+                                        prompt_output_id=output_manager_id
+                                    ).update(output=enriched_value)
+                                    logger.info(
+                                        f"Updated DB record {output_manager_id} "
+                                        f"with enriched value for {prompt_key}"
+                                    )
+                                except Exception as db_err:
+                                    logger.warning(
+                                        f"Failed to update DB with enriched value "
+                                        f"for {prompt_key}: {db_err}"
+                                    )
                     # Add metadata for tracking
                     item["_lookup_metadata"] = lookup_metadata
 
diff --git a/frontend/src/components/lookups/debug-tab/DebugTab.jsx b/frontend/src/components/lookups/debug-tab/DebugTab.jsx
index ba22da3cbe..3fe212e04b 100644
--- a/frontend/src/components/lookups/debug-tab/DebugTab.jsx
+++ b/frontend/src/components/lookups/debug-tab/DebugTab.jsx
@@ -1,9 +1,19 @@
 import { useState } from "react";
-import { Button, Card, Space, Typography, Alert, Divider, Spin } from "antd";
+import {
+  Button,
+  Card,
+  Space,
+  Typography,
+  Alert,
+  Divider,
+  Spin,
+  Progress,
+} from "antd";
 import {
   PlayCircleOutlined,
   BugOutlined,
   ClearOutlined,
+  WarningOutlined,
 } from "@ant-design/icons";
 import PropTypes from "prop-types";
 import CodeMirror from "@uiw/react-codemirror";
@@ -22,6 +32,7 @@ export function DebugTab({ project }) {
   const [executing, setExecuting] = useState(false);
   const [result, setResult] = useState(null);
   const [error, setError] = useState(null);
+  const [errorDetails, setErrorDetails] = useState(null);
 
   const axiosPrivate = useAxiosPrivate();
   const { setAlertDetails } = useAlertStore();
@@ -31,6 +42,7 @@ export function DebugTab({ project }) {
     setExecuting(true);
     setResult(null);
     setError(null);
+    setErrorDetails(null);
 
     try {
       // Parse input JSON
@@ -58,20 +70,68 @@ export function DebugTab({ project }) {
       );
 
       setResult(response.data);
-      setAlertDetails({
-        type: "success",
-        content: "Execution completed successfully",
-      });
-    } catch (error) {
+
+      // Check for context window errors in failed enrichments (within successful response)
+      const enrichments = response.data?._lookup_metadata?.enrichments || [];
+      const contextWindowError = enrichments.find(
+        (e) =>
+          e.status === "failed" && e.error_type === "context_window_exceeded"
+      );
+
+      if (contextWindowError) {
+        setErrorDetails({
+          type: "context_window_exceeded",
+          tokenCount: contextWindowError.token_count,
+          contextLimit: contextWindowError.context_limit,
+          model: contextWindowError.model,
+        });
+        setError(contextWindowError.error);
+        setAlertDetails({
+          type: "error",
+          content: `Context window exceeded: ${contextWindowError.token_count?.toLocaleString()} tokens used, limit is ${contextWindowError.context_limit?.toLocaleString()}`,
+        });
+      } else if (response.data?._lookup_metadata?.lookups_failed > 0) {
+        // Check for other failures
+        const failedEnrichment = enrichments.find((e) => e.status === "failed");
+        if (failedEnrichment) {
+          setError(failedEnrichment.error);
+          setAlertDetails({
+            type: "error",
+            content: failedEnrichment.error || "Look-Up execution failed",
+          });
+        }
+      } else {
+        setAlertDetails({
+          type: "success",
+          content: "Execution completed successfully",
+        });
+      }
+    } catch (err) {
+      const responseData = err.response?.data;
       const errorMessage =
-        error.response?.data?.error ||
-        error.response?.data?.detail ||
-        "Execution failed";
+        responseData?.error || responseData?.detail || "Execution failed";
+
+      // Check for context window exceeded error in error response
+      if (responseData?.error_type === "context_window_exceeded") {
+        setErrorDetails({
+          type: "context_window_exceeded",
+          tokenCount: responseData.token_count,
+          contextLimit: responseData.context_limit,
+          model: responseData.model,
+        });
+        // Show specific popup for context window error
+        setAlertDetails({
+          type: "error",
+          content: `Context window exceeded: ${responseData.token_count?.toLocaleString()} tokens required, limit is ${responseData.context_limit?.toLocaleString()}`,
+        });
+      } else {
+        setAlertDetails({
+          type: "error",
+          content: errorMessage,
+        });
+      }
+
       setError(errorMessage);
-      setAlertDetails({
-        type: "error",
-        content: errorMessage,
-      });
     } finally {
       setExecuting(false);
     }
@@ -81,6 +141,100 @@ export function DebugTab({ project }) {
     setInputData("{}");
     setResult(null);
     setError(null);
+    setErrorDetails(null);
+  };
+
+  const renderContextWindowError = () => {
+    if (!errorDetails || errorDetails.type !== "context_window_exceeded") {
+      return null;
+    }
+
+    const { tokenCount, contextLimit, model } = errorDetails;
+    const usagePercent = Math.min(
+      Math.round((tokenCount / contextLimit) * 100),
+      100
+    );
+    const overflowAmount = tokenCount - contextLimit;
+    const overflowPercent = Math.round((overflowAmount / contextLimit) * 100);
+
+    return (
+      <Alert
+        message={
+          <Space>
+            <WarningOutlined />
+            <span>Context Window Exceeded</span>
+          </Space>
+        }
+        description={
+          <div>
+            <p style={{ marginBottom: 12 }}>
+              The prompt requires{" "}
+              <Text strong>{tokenCount.toLocaleString()}</Text> tokens, but the
+              model <Text code>{model}</Text> has a limit of{" "}
+              <Text strong>{contextLimit.toLocaleString()}</Text> tokens.
+            </p>
+
+            <div style={{ marginBottom: 16 }}>
+              <Text
+                type="secondary"
+                style={{ marginBottom: 4, display: "block" }}
+              >
+                Token Usage ({usagePercent}% of limit, {overflowPercent}% over)
+              </Text>
+              <Progress
+                percent={100}
+                success={{
+                  percent: Math.round((contextLimit / tokenCount) * 100),
+                }}
+                strokeColor="#f5222d"
+                trailColor="#f5222d"
+                showInfo={false}
+              />
+              <div
+                style={{
+                  display: "flex",
+                  justifyContent: "space-between",
+                  marginTop: 4,
+                }}
+              >
+                <Text type="secondary">0</Text>
+                <Text type="secondary">
+                  Limit: {contextLimit.toLocaleString()}
+                </Text>
+                <Text type="danger">Used: {tokenCount.toLocaleString()}</Text>
+              </div>
+            </div>
+
+            <Divider style={{ margin: "12px 0" }} />
+
+            <Title level={5} style={{ marginTop: 0 }}>
+              How to Fix
+            </Title>
+            <ul style={{ paddingLeft: 20, marginBottom: 0 }}>
+              <li>
+                <Text strong>Enable RAG mode:</Text> Set chunk_size {"> 0"} in
+                the profile to use vector retrieval instead of full context
+              </li>
+              <li>
+                <Text strong>Reduce reference data:</Text> Remove unnecessary
+                content from your data sources
+              </li>
+              <li>
+                <Text strong>Use a larger model:</Text> Switch to a model with a
+                larger context window (e.g., GPT-4-Turbo, Claude 3)
+              </li>
+              <li>
+                <Text strong>Simplify your template:</Text> Reduce the prompt
+                template size if possible
+              </li>
+            </ul>
+          </div>
+        }
+        type="error"
+        showIcon={false}
+        style={{ marginBottom: 16 }}
+      />
+    );
   };
 
   const formatJSON = () => {
@@ -172,7 +326,11 @@ export function DebugTab({ project }) {
         </Card>
       )}
 
-      {error && (
+      {error &&
+        errorDetails?.type === "context_window_exceeded" &&
+        renderContextWindowError()}
+
+      {error && errorDetails?.type !== "context_window_exceeded" && (
         <Alert
           message="Execution Error"
           description={error}
diff --git a/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx b/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx
index b5508157ab..778dbff85f 100644
--- a/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx
+++ b/frontend/src/components/lookups/profile-management-tab/ProfileFormModal.jsx
@@ -29,7 +29,6 @@ function ProfileFormModal({ projectId, profileId, onClose }) {
   const [vectorDbItems, setVectorDbItems] = useState([]);
   const [embeddingItems, setEmbeddingItems] = useState([]);
   const [x2TextItems, setX2TextItems] = useState([]);
-  const [adaptersLoaded, setAdaptersLoaded] = useState(false);
   const [originalChunkSize, setOriginalChunkSize] = useState(null);
   const [showReindexWarning, setShowReindexWarning] = useState(false);
 
@@ -41,27 +40,17 @@ function ProfileFormModal({ projectId, profileId, onClose }) {
   const isEdit = !!profileId;
   const modalTitle = isEdit ? "Edit Profile" : "Add New Profile";
 
-  // Fetch adapters
+  // Fetch adapters and then load profile data if editing
   useEffect(() => {
-    fetchAdapters();
-  }, []);
-
-  // Load profile data for editing (only after adapters are loaded)
-  useEffect(() => {
-    if (profileId && adaptersLoaded) {
-      fetchProfileData();
-    }
-  }, [profileId, adaptersLoaded]);
-
-  const fetchAdapters = () => {
-    setAdaptersLoading(true);
-    const requestOptions = {
-      method: "GET",
-      url: `/api/v1/unstract/${sessionDetails?.orgId}/adapter`,
-    };
-
-    axiosPrivate(requestOptions)
-      .then((res) => {
+    const fetchAdaptersAndProfile = async () => {
+      setAdaptersLoading(true);
+      const requestOptions = {
+        method: "GET",
+        url: `/api/v1/unstract/${sessionDetails?.orgId}/adapter/`,
+      };
+
+      try {
+        const res = await axiosPrivate(requestOptions);
         const data = res?.data || [];
 
         const llmList = [];
@@ -90,17 +79,32 @@ function ProfileFormModal({ projectId, profileId, onClose }) {
         setVectorDbItems(vectorDbList);
         setEmbeddingItems(embeddingList);
         setX2TextItems(x2TextList);
-      })
-      .catch((err) => {
+
+        // If editing, fetch profile data using the freshly loaded adapter lists
+        if (profileId) {
+          await fetchProfileData(
+            llmList,
+            embeddingList,
+            vectorDbList,
+            x2TextList
+          );
+        }
+      } catch (err) {
         handleException(err, "Failed to fetch adapters");
-      })
-      .finally(() => {
+      } finally {
         setAdaptersLoading(false);
-        setAdaptersLoaded(true);
-      });
-  };
+      }
+    };
+
+    fetchAdaptersAndProfile();
+  }, [profileId]);
 
-  const fetchProfileData = () => {
+  const fetchProfileData = async (
+    llmList,
+    embeddingList,
+    vectorDbList,
+    x2TextList
+  ) => {
     setLoading(true);
     const requestOptions = {
       method: "GET",
@@ -110,44 +114,42 @@ function ProfileFormModal({ projectId, profileId, onClose }) {
       },
     };
 
-    axiosPrivate(requestOptions)
-      .then((res) => {
-        const profile = res?.data;
-
-        // Store original chunk_size for reindex warning check
-        console.log("Profile data loaded, chunk_size:", profile?.chunk_size);
-        setOriginalChunkSize(profile?.chunk_size);
-
-        // Find adapter IDs by matching adapter names from the profile response
-        // The API returns adapter names as strings (e.g., "Azure LLM")
-        const llmItem = llmItems.find((item) => item?.label === profile?.llm);
-        const embeddingItem = embeddingItems.find(
-          (item) => item?.label === profile?.embedding_model
-        );
-        const vectorDbItem = vectorDbItems.find(
-          (item) => item?.label === profile?.vector_store
-        );
-        const x2textItem = x2TextItems.find(
-          (item) => item?.label === profile?.x2text
-        );
-
-        form.setFieldsValue({
-          profile_name: profile?.profile_name,
-          llm: llmItem?.value || null,
-          embedding_model: embeddingItem?.value || null,
-          vector_store: vectorDbItem?.value || null,
-          x2text: x2textItem?.value || null,
-          chunk_size: profile?.chunk_size,
-          chunk_overlap: profile?.chunk_overlap,
-          similarity_top_k: profile?.similarity_top_k,
-        });
-      })
-      .catch((err) => {
-        handleException(err, "Failed to fetch profile data");
-      })
-      .finally(() => {
-        setLoading(false);
+    try {
+      const res = await axiosPrivate(requestOptions);
+      const profile = res?.data;
+
+      // Store original chunk_size for reindex warning check
+      console.log("Profile data loaded, chunk_size:", profile?.chunk_size);
+      setOriginalChunkSize(profile?.chunk_size);
+
+      // Find adapter IDs by matching adapter names from the profile response
+      // The API returns adapter names as strings (e.g., "Azure LLM")
+      const llmItem = llmList.find((item) => item?.label === profile?.llm);
+      const embeddingItem = embeddingList.find(
+        (item) => item?.label === profile?.embedding_model
+      );
+      const vectorDbItem = vectorDbList.find(
+        (item) => item?.label === profile?.vector_store
+      );
+      const x2textItem = x2TextList.find(
+        (item) => item?.label === profile?.x2text
+      );
+
+      form.setFieldsValue({
+        profile_name: profile?.profile_name,
+        llm: llmItem?.value || null,
+        embedding_model: embeddingItem?.value || null,
+        vector_store: vectorDbItem?.value || null,
+        x2text: x2textItem?.value || null,
+        chunk_size: profile?.chunk_size,
+        chunk_overlap: profile?.chunk_overlap,
+        similarity_top_k: profile?.similarity_top_k,
       });
+    } catch (err) {
+      handleException(err, "Failed to fetch profile data");
+    } finally {
+      setLoading(false);
+    }
   };
 
   const handleSubmit = () => {

From 8d23d968b989c08650c01d2c8166b27c5dd82999 Mon Sep 17 00:00:00 2001
From: gayathrivijayakumar <gayathri@zipstack.com>
Date: Wed, 28 Jan 2026 10:25:08 +0530
Subject: [PATCH 13/22] Fix single pass mode

---
 .../services/lookup_integration_service.py    | 55 +++++++++--------
 .../output_manager_helper.py                  | 60 ++++++++++++++++++-
 frontend/src/hooks/useAxiosPrivate.js         |  2 +-
 3 files changed, 88 insertions(+), 29 deletions(-)

diff --git a/backend/lookup/services/lookup_integration_service.py b/backend/lookup/services/lookup_integration_service.py
index 7967854a91..bfb3219c1f 100644
--- a/backend/lookup/services/lookup_integration_service.py
+++ b/backend/lookup/services/lookup_integration_service.py
@@ -64,7 +64,7 @@ def enrich_if_linked(
             prompt_lookup_map: Optional mapping of field names (prompt_key) to
                 specific lookup_project_id. Fields with a specific lookup will
                 ONLY be enriched by that lookup. Fields without a specific
-                lookup will use all project-level linked lookups.
+                lookup will be SKIPPED (no enrichment applied).
 
         Returns:
             Dict with 'lookup_enrichment' and '_lookup_metadata' keys,
@@ -82,6 +82,23 @@ def enrich_if_linked(
         timeout = timeout or LOOKUP_ENRICHMENT_TIMEOUT
         prompt_lookup_map = prompt_lookup_map or {}
 
+        # Skip enrichment if no prompts have lookup enabled (prompt_lookup_map empty)
+        # This ensures lookups only run when explicitly enabled at the prompt level
+        if not prompt_lookup_map:
+            logger.debug(
+                "No prompts have lookup enabled (prompt_lookup_map is empty), "
+                "skipping enrichment"
+            )
+            return {
+                "lookup_enrichment": {},
+                "_lookup_metadata": {
+                    "status": "skipped",
+                    "message": "No prompts have lookup enabled",
+                    "lookups_executed": 0,
+                    "lookups_successful": 0,
+                },
+            }
+
         try:
             return LookupIntegrationService._execute_enrichment(
                 prompt_studio_project_id=prompt_studio_project_id,
@@ -239,7 +256,7 @@ def _run_orchestrator(
 
         Supports prompt-level lookups: if a field has a specific lookup assigned
         via prompt_lookup_map, only that lookup will enrich it. Fields without
-        specific lookups will use all project-level linked lookups.
+        specific lookups will be SKIPPED (no enrichment applied).
 
         Args:
             lookup_projects: List of LookupProject instances linked at project level
@@ -326,9 +343,9 @@ def _run_orchestrator(
 
             # Separate fields by their lookup assignment
             # Fields with specific lookups: only that lookup enriches them
-            # Fields without specific lookups: all project-level lookups apply
+            # Fields without specific lookups: SKIP enrichment (no lookup enabled)
             fields_with_specific_lookup: dict[str, dict[str, Any]] = {}
-            fields_without_specific_lookup: dict[str, Any] = {}
+            fields_skipped: list[str] = []
 
             for field_name, field_value in input_data.items():
                 if field_name in prompt_lookup_map:
@@ -337,7 +354,14 @@ def _run_orchestrator(
                         fields_with_specific_lookup[lookup_id] = {}
                     fields_with_specific_lookup[lookup_id][field_name] = field_value
                 else:
-                    fields_without_specific_lookup[field_name] = field_value
+                    # Field has no lookup assigned - skip enrichment entirely
+                    fields_skipped.append(field_name)
+
+            if fields_skipped:
+                logger.info(
+                    f"Skipping enrichment for fields without lookup assigned: "
+                    f"{fields_skipped}"
+                )
 
             all_enrichment: dict[str, Any] = {}
             all_enrichments: list[dict[str, Any]] = []  # Collect all enrichment results
@@ -372,25 +396,6 @@ def _run_orchestrator(
                         f"for fields: {list(fields.keys())}"
                     )
 
-            # Execute all project-level lookups for remaining fields
-            if fields_without_specific_lookup:
-                logger.info(
-                    f"Executing project-level lookups for fields: "
-                    f"{list(fields_without_specific_lookup.keys())}"
-                )
-                result = orchestrator.execute_lookups(
-                    input_data=fields_without_specific_lookup,
-                    lookup_projects=lookup_projects,
-                    execution_id=execution_id,
-                    prompt_studio_project_id=prompt_studio_project_id,
-                )
-                all_enrichment.update(result.get("lookup_enrichment", {}))
-                metadata = result.get("_lookup_metadata", {})
-                total_executed += metadata.get("lookups_executed", 0)
-                total_successful += metadata.get("lookups_successful", 0)
-                # Collect enrichment details for error checking
-                all_enrichments.extend(metadata.get("enrichments", []))
-
             return {
                 "lookup_enrichment": all_enrichment,
                 "_lookup_metadata": {
@@ -398,7 +403,7 @@ def _run_orchestrator(
                     "lookups_executed": total_executed,
                     "lookups_successful": total_successful,
                     "prompt_level_lookups": len(fields_with_specific_lookup),
-                    "project_level_fields": len(fields_without_specific_lookup),
+                    "fields_skipped": len(fields_skipped),
                     "enrichments": all_enrichments,  # Include for error checking
                 },
             }
diff --git a/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py b/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
index d9d03ab314..d244a015f3 100644
--- a/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
+++ b/backend/prompt_studio/prompt_studio_output_manager_v2/output_manager_helper.py
@@ -32,17 +32,33 @@ def _build_prompt_lookup_map(
 ) -> dict[str, str]:
     """Build mapping of prompt_key to lookup_project_id for prompts with lookups.
 
+    This function determines which prompts have lookup enrichment enabled.
+    Lookup is enabled for a prompt when `lookup_project` is assigned.
+    Prompts without `lookup_project` will be skipped (no enrichment).
+
     Args:
         prompts: List of ToolStudioPrompt instances
 
     Returns:
         Dict mapping prompt_key to lookup_project_id (as string) for prompts
-        that have a lookup_project assigned.
+        that have a lookup_project assigned (lookup enabled).
     """
     prompt_lookup_map: dict[str, str] = {}
+    skipped_prompts: list[str] = []
+
     for prompt in prompts:
         if prompt.lookup_project_id:
             prompt_lookup_map[prompt.prompt_key] = str(prompt.lookup_project_id)
+        else:
+            skipped_prompts.append(prompt.prompt_key)
+
+    if skipped_prompts:
+        logger.debug(
+            f"Prompts without lookup enabled (no lookup_project): {skipped_prompts}"
+        )
+    if prompt_lookup_map:
+        logger.info(f"Prompts with lookup enabled: {list(prompt_lookup_map.keys())}")
+
     return prompt_lookup_map
 
 
@@ -79,7 +95,7 @@ def _try_lookup_enrichment(
 
     Supports prompt-level lookups: if a field has a specific lookup assigned
     via prompt_lookup_map, only that lookup will enrich it. Fields without
-    specific lookups will use all project-level linked lookups.
+    specific lookups will be SKIPPED (no enrichment applied).
 
     Args:
         tool_id: Prompt Studio project (CustomTool) UUID
@@ -185,6 +201,17 @@ def handle_prompt_output_update(
         """Handles updating prompt outputs in the database and returns
         serialized data.
 
+        This method processes extraction outputs, saves them to the database,
+        and applies lookup enrichment as a post-processing step.
+
+        Lookup Enrichment Behavior:
+            - Lookups run as POST-PROCESSING after extraction completes
+            - Only prompts with `lookup_project` assigned will be enriched
+            - Prompts without `lookup_project` are skipped (no enrichment)
+            - Each prompt can have a different lookup project assigned
+            - Response includes `_lookup_status` for each prompt indicating
+              whether lookup was enabled and if enrichment was applied
+
         Args:
             run_id (str): ID of the run.
             prompts (list[ToolStudioPrompt]): List of prompts to update.
@@ -192,11 +219,15 @@ def handle_prompt_output_update(
             document_id (str): ID of the document.
             profile_manager_id (Optional[str]): UUID of the profile manager.
             is_single_pass_extract (bool): Flag indicating if single pass
-            extract is active.
+                extract is active.
             metadata (dict[str, Any]): Metadata for the update.
 
         Returns:
             list[dict[str, Any]]: List of serialized prompt output data.
+                Each item includes `_lookup_status` with:
+                - enabled: Whether lookup was configured for this prompt
+                - lookup_project_id: The assigned lookup project UUID (or None)
+                - was_enriched: Whether the output was actually enriched
         """
 
         def update_or_create_prompt_output(
@@ -360,6 +391,9 @@ def update_or_create_prompt_output(
 
         logger.info(f"extracted_data_for_lookup: {extracted_data_for_lookup}")
 
+        # Initialize lookup_result for later status tracking
+        lookup_result: dict[str, Any] = {}
+
         # Execute Lookup enrichment if linked projects exist
         if extracted_data_for_lookup:
             tool_id_str = str(tool.tool_id)
@@ -434,6 +468,26 @@ def update_or_create_prompt_output(
                     # Add metadata for tracking
                     item["_lookup_metadata"] = lookup_metadata
 
+        # Add lookup status to each serialized item for debugging/UI
+        # This indicates whether lookup was enabled and if enrichment was applied
+        prompt_by_key = {p.prompt_key: p for p in prompts}
+        lookup_enrichment_keys = set(lookup_result.get("lookup_enrichment", {}).keys())
+        for item in serialized_data:
+            prompt_key = item.get("prompt_key")
+            prompt = prompt_by_key.get(prompt_key)
+            if prompt:
+                lookup_enabled = prompt.lookup_project_id is not None
+                was_enriched = prompt_key in lookup_enrichment_keys
+                item["_lookup_status"] = {
+                    "enabled": lookup_enabled,
+                    "lookup_project_id": (
+                        str(prompt.lookup_project_id)
+                        if prompt.lookup_project_id
+                        else None
+                    ),
+                    "was_enriched": was_enriched,
+                }
+
         return serialized_data
 
     @staticmethod
diff --git a/frontend/src/hooks/useAxiosPrivate.js b/frontend/src/hooks/useAxiosPrivate.js
index b7c940e7ee..2937462a26 100644
--- a/frontend/src/hooks/useAxiosPrivate.js
+++ b/frontend/src/hooks/useAxiosPrivate.js
@@ -4,8 +4,8 @@ import { useEffect, useMemo } from "react";
 import useLogout from "./useLogout";
 
 function useAxiosPrivate() {
-  const axiosPrivate = useMemo(() => axios.create(), []);
   const logout = useLogout();
+  const axiosPrivate = useMemo(() => axios.create(), []);
 
   useEffect(() => {
     const responseInterceptor = axiosPrivate.interceptors.response.use(

From 37b9f768ae1a50b4d008c8f6b67237602a93341e Mon Sep 17 00:00:00 2001
From: gayathrivijayakumar <gayathri@zipstack.com>
Date: Wed, 28 Jan 2026 13:25:01 +0530
Subject: [PATCH 14/22] Improve Debug

---
 .../lookups/project-detail/LookUpProjectDetail.jsx     | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/frontend/src/components/lookups/project-detail/LookUpProjectDetail.jsx b/frontend/src/components/lookups/project-detail/LookUpProjectDetail.jsx
index 2d68472fc0..f373b1663c 100644
--- a/frontend/src/components/lookups/project-detail/LookUpProjectDetail.jsx
+++ b/frontend/src/components/lookups/project-detail/LookUpProjectDetail.jsx
@@ -177,6 +177,11 @@ export function LookUpProjectDetail() {
       label: "Template",
       children: <TemplateTab project={project} onUpdate={fetchProject} />,
     },
+    {
+      key: "debug",
+      label: "Debug",
+      children: <DebugTab project={project} />,
+    },
     {
       key: "profiles",
       label: "Profiles",
@@ -192,11 +197,6 @@ export function LookUpProjectDetail() {
       label: "Execution History",
       children: <ExecutionHistoryTab project={project} />,
     },
-    {
-      key: "debug",
-      label: "Debug",
-      children: <DebugTab project={project} />,
-    },
   ];
 
   return (

From 9c0d68af2dc576d94093b95c2cb9c8887fe007e3 Mon Sep 17 00:00:00 2001
From: gayathrivijayakumar <gayathri@zipstack.com>
Date: Wed, 28 Jan 2026 15:57:44 +0530
Subject: [PATCH 15/22] Improve helper prompts

---
 .../components/lookups/debug-tab/DebugTab.jsx | 300 +++++++++++++++++-
 .../lookups/template-tab/TemplateTab.jsx      |  45 ++-
 .../navigations/side-nav-bar/SideNavBar.jsx   |  18 +-
 3 files changed, 324 insertions(+), 39 deletions(-)

diff --git a/frontend/src/components/lookups/debug-tab/DebugTab.jsx b/frontend/src/components/lookups/debug-tab/DebugTab.jsx
index 3fe212e04b..58e650cdec 100644
--- a/frontend/src/components/lookups/debug-tab/DebugTab.jsx
+++ b/frontend/src/components/lookups/debug-tab/DebugTab.jsx
@@ -1,4 +1,4 @@
-import { useState } from "react";
+import { useState, useEffect, useCallback } from "react";
 import {
   Button,
   Card,
@@ -8,12 +8,14 @@ import {
   Divider,
   Spin,
   Progress,
+  Tooltip,
 } from "antd";
 import {
   PlayCircleOutlined,
   BugOutlined,
   ClearOutlined,
   WarningOutlined,
+  SyncOutlined,
 } from "@ant-design/icons";
 import PropTypes from "prop-types";
 import CodeMirror from "@uiw/react-codemirror";
@@ -27,10 +29,134 @@ import "./DebugTab.css";
 
 const { Title, Text } = Typography;
 
+// Default sample JSON when no linked projects are found
+const DEFAULT_SAMPLE_JSON = {
+  vendor_name: "Acme Corporation",
+  product_id: "SKU-12345",
+  invoice_number: "INV-2024-001",
+  amount: 1250.0,
+  currency: "USD",
+};
+
+// Sample values for common prompt key patterns
+const SAMPLE_VALUES = {
+  vendor_name: "Acme Corporation",
+  vendor: "Acme Corp",
+  product_name: "Widget Pro X",
+  product_id: "SKU-12345",
+  product: "Widget",
+  invoice_number: "INV-2024-001",
+  invoice_id: "INV-001",
+  amount: 1250.0,
+  price: 99.99,
+  total: 1500.0,
+  currency: "USD",
+  date: "2024-01-15",
+  customer_name: "John Doe",
+  customer: "John Doe",
+  email: "customer@example.com",
+  phone: "+1-555-123-4567",
+  address: "123 Main St, City, State 12345",
+  description: "Sample product description",
+  quantity: 10,
+  category: "Electronics",
+  status: "pending",
+  order_id: "ORD-2024-001",
+  sku: "SKU-12345",
+  brand: "BrandName",
+  model: "Model-X",
+  serial_number: "SN-123456789",
+};
+
+/**
+ * Generates a sample value for a prompt key.
+ * @param {string} promptKey - The prompt key to generate a sample value for.
+ * @return {string|number} A sample value appropriate for the prompt key.
+ */
+const getSampleValue = (promptKey) => {
+  const lowerKey = promptKey.toLowerCase().replace(/[-_\s]/g, "_");
+
+  // Check for exact match
+  if (SAMPLE_VALUES[lowerKey]) {
+    return SAMPLE_VALUES[lowerKey];
+  }
+
+  // Check for partial matches
+  for (const [key, value] of Object.entries(SAMPLE_VALUES)) {
+    if (lowerKey.includes(key) || key.includes(lowerKey)) {
+      return value;
+    }
+  }
+
+  // Generate reasonable defaults based on key patterns
+  if (lowerKey.includes("id") || lowerKey.includes("number")) {
+    return "12345";
+  }
+  if (lowerKey.includes("date") || lowerKey.includes("time")) {
+    return "2024-01-15";
+  }
+  if (
+    lowerKey.includes("amount") ||
+    lowerKey.includes("price") ||
+    lowerKey.includes("total")
+  ) {
+    return 100.0;
+  }
+  if (lowerKey.includes("email")) {
+    return "example@email.com";
+  }
+  if (lowerKey.includes("name")) {
+    return "Sample Name";
+  }
+
+  // Default placeholder
+  return `sample_${promptKey}`;
+};
+
+/**
+ * Builds sample JSON from an array of prompt keys.
+ * @param {string[]} promptKeys - Array of prompt keys from the linked project.
+ * @return {Object} A sample JSON object with prompt keys as fields.
+ */
+const buildSampleJsonFromPromptKeys = (promptKeys) => {
+  if (!promptKeys || promptKeys.length === 0) {
+    return DEFAULT_SAMPLE_JSON;
+  }
+
+  const sample = {};
+  promptKeys.forEach((key) => {
+    sample[key] = getSampleValue(key);
+  });
+  return sample;
+};
+
+/**
+ * Merges original input data with lookup enrichment results.
+ * Enriched fields override original fields, and new enriched fields are added.
+ * @param {Object} originalInput - The original input JSON.
+ * @param {Object} enrichment - The lookup enrichment result.
+ * @return {Object} Merged result with original fields + enriched/replaced values.
+ */
+const mergeInputWithEnrichment = (originalInput, enrichment) => {
+  if (!enrichment) {
+    return originalInput;
+  }
+  // Merge: original input fields + enrichment fields (enrichment overrides)
+  return {
+    ...originalInput,
+    ...enrichment,
+  };
+};
+
 export function DebugTab({ project }) {
-  const [inputData, setInputData] = useState("{}");
+  const [inputData, setInputData] = useState(
+    JSON.stringify(DEFAULT_SAMPLE_JSON, null, 2)
+  );
+  const [loadingPromptKeys, setLoadingPromptKeys] = useState(false);
+  const [linkedProjectInfo, setLinkedProjectInfo] = useState(null);
   const [executing, setExecuting] = useState(false);
   const [result, setResult] = useState(null);
+  const [parsedInput, setParsedInput] = useState(null); // Store parsed input for merging
   const [error, setError] = useState(null);
   const [errorDetails, setErrorDetails] = useState(null);
 
@@ -38,27 +164,95 @@ export function DebugTab({ project }) {
   const { setAlertDetails } = useAlertStore();
   const { sessionDetails } = useSessionStore();
 
+  /**
+   * Fetches linked Prompt Studio projects and their prompt keys,
+   * then builds a sample JSON for the debug input.
+   */
+  const fetchLinkedProjectPromptKeys = useCallback(async () => {
+    if (!sessionDetails?.orgId || !project?.id) return;
+
+    setLoadingPromptKeys(true);
+    try {
+      // Step 1: Fetch linked Prompt Studio projects
+      const linksResponse = await axiosPrivate.get(
+        `/api/v1/unstract/${sessionDetails.orgId}/lookup/lookup-links/`,
+        { params: { lookup_project_id: project.id } }
+      );
+
+      const links = linksResponse.data.results || [];
+      if (links.length === 0) {
+        // No linked projects, use default sample
+        setInputData(JSON.stringify(DEFAULT_SAMPLE_JSON, null, 2));
+        setLinkedProjectInfo(null);
+        return;
+      }
+
+      // Step 2: Fetch the first linked Prompt Studio project details
+      const firstLink = links[0];
+      const psProjectId = firstLink.prompt_studio_project_id;
+
+      const psResponse = await axiosPrivate.get(
+        `/api/v1/unstract/${sessionDetails.orgId}/prompt-studio/${psProjectId}/`
+      );
+
+      const psProject = psResponse.data;
+      const prompts = psProject.prompts || [];
+
+      // Step 3: Extract prompt keys (excluding notes)
+      const promptKeys = prompts
+        .filter((p) => p.prompt_type === "PROMPT" || !p.prompt_type)
+        .map((p) => p.prompt_key)
+        .filter((key) => key && key !== "Enter key");
+
+      // Step 4: Build sample JSON
+      const sampleJson = buildSampleJsonFromPromptKeys(promptKeys);
+      setInputData(JSON.stringify(sampleJson, null, 2));
+
+      setLinkedProjectInfo({
+        projectName: psProject.tool_name || "Linked Project",
+        promptCount: promptKeys.length,
+        promptKeys: promptKeys,
+      });
+    } catch (error) {
+      console.error("Failed to fetch linked project prompt keys:", error);
+      // On error, fall back to default sample
+      setInputData(JSON.stringify(DEFAULT_SAMPLE_JSON, null, 2));
+      setLinkedProjectInfo(null);
+    } finally {
+      setLoadingPromptKeys(false);
+    }
+  }, [axiosPrivate, sessionDetails?.orgId, project?.id]);
+
+  // Fetch linked project prompt keys on mount
+  useEffect(() => {
+    fetchLinkedProjectPromptKeys();
+  }, [fetchLinkedProjectPromptKeys]);
+
   const handleExecute = async () => {
     setExecuting(true);
     setResult(null);
+    setParsedInput(null);
     setError(null);
     setErrorDetails(null);
 
     try {
       // Parse input JSON
-      let parsedInput;
+      let inputJson;
       try {
-        parsedInput = JSON.parse(inputData);
+        inputJson = JSON.parse(inputData);
       } catch (e) {
         setError("Invalid JSON input");
         setExecuting(false);
         return;
       }
 
+      // Store parsed input for later merging with results
+      setParsedInput(inputJson);
+
       const response = await axiosPrivate.post(
         `/api/v1/unstract/${sessionDetails?.orgId}/lookup/lookup-projects/${project.id}/execute/`,
         {
-          input_data: parsedInput,
+          input_data: inputJson,
           use_cache: false,
           timeout_seconds: 60,
         },
@@ -138,12 +332,24 @@ export function DebugTab({ project }) {
   };
 
   const handleClear = () => {
-    setInputData("{}");
+    // Reset to sample JSON based on linked project or default
+    if (linkedProjectInfo?.promptKeys?.length > 0) {
+      const sampleJson = buildSampleJsonFromPromptKeys(
+        linkedProjectInfo.promptKeys
+      );
+      setInputData(JSON.stringify(sampleJson, null, 2));
+    } else {
+      setInputData(JSON.stringify(DEFAULT_SAMPLE_JSON, null, 2));
+    }
     setResult(null);
     setError(null);
     setErrorDetails(null);
   };
 
+  const handleRefreshSample = () => {
+    fetchLinkedProjectPromptKeys();
+  };
+
   const renderContextWindowError = () => {
     if (!errorDetails || errorDetails.type !== "context_window_exceeded") {
       return null;
@@ -267,12 +473,48 @@ export function DebugTab({ project }) {
         style={{ marginBottom: 16 }}
       />
 
-      <Card title="Input Data" style={{ marginBottom: 16 }}>
+      <Card
+        title={
+          <Space>
+            <span>Input Data</span>
+            {loadingPromptKeys && <Spin size="small" />}
+          </Space>
+        }
+        extra={
+          <Tooltip title="Refresh sample data from linked Prompt Studio project">
+            <Button
+              icon={<SyncOutlined spin={loadingPromptKeys} />}
+              size="small"
+              onClick={handleRefreshSample}
+              disabled={loadingPromptKeys}
+            >
+              Refresh Sample
+            </Button>
+          </Tooltip>
+        }
+        style={{ marginBottom: 16 }}
+      >
         <Space direction="vertical" style={{ width: "100%" }}>
-          <Text>
-            Enter JSON data with variables that match your template
-            placeholders:
-          </Text>
+          {linkedProjectInfo ? (
+            <Alert
+              message={
+                <span>
+                  Sample data generated from{" "}
+                  <Text strong>{linkedProjectInfo.projectName}</Text> (
+                  {linkedProjectInfo.promptCount} prompt field
+                  {linkedProjectInfo.promptCount !== 1 ? "s" : ""})
+                </span>
+              }
+              type="success"
+              showIcon
+              style={{ marginBottom: 8 }}
+            />
+          ) : (
+            <Text type="secondary">
+              Enter JSON data with field values to test your Look-Up. Link a
+              Prompt Studio project to auto-populate sample fields.
+            </Text>
+          )}
           <CodeMirror
             value={inputData}
             height="200px"
@@ -285,9 +527,11 @@ export function DebugTab({ project }) {
             <Button onClick={formatJSON} size="small">
               Format JSON
             </Button>
-            <Text type="secondary">
-              Example: {`{ "vendor_name": "Acme Corp", "product_id": "123" }`}
-            </Text>
+            {linkedProjectInfo && (
+              <Text type="secondary">
+                Fields: {linkedProjectInfo.promptKeys.join(", ")}
+              </Text>
+            )}
           </Space>
         </Space>
       </Card>
@@ -343,16 +587,38 @@ export function DebugTab({ project }) {
       {result && (
         <Card title="Execution Result">
           <Space direction="vertical" style={{ width: "100%" }}>
-            {result.lookup_enrichment && (
+            {result.lookup_enrichment && parsedInput && (
               <>
-                <Title level={5}>Enrichment Data</Title>
+                <Title level={5}>Enriched Output</Title>
+                <Text type="secondary" style={{ marginBottom: 8 }}>
+                  Original input fields combined with lookup enrichment values
+                </Text>
                 <CodeMirror
-                  value={JSON.stringify(result.lookup_enrichment, null, 2)}
+                  value={JSON.stringify(
+                    mergeInputWithEnrichment(
+                      parsedInput,
+                      result.lookup_enrichment
+                    ),
+                    null,
+                    2
+                  )}
                   height="200px"
                   theme={oneDark}
                   extensions={[json()]}
                   editable={false}
                 />
+                <Divider />
+                <Title level={5}>Lookup Enrichment Only</Title>
+                <Text type="secondary" style={{ marginBottom: 8 }}>
+                  Fields that were enriched or added by the lookup
+                </Text>
+                <CodeMirror
+                  value={JSON.stringify(result.lookup_enrichment, null, 2)}
+                  height="150px"
+                  theme={oneDark}
+                  extensions={[json()]}
+                  editable={false}
+                />
               </>
             )}
 
diff --git a/frontend/src/components/lookups/template-tab/TemplateTab.jsx b/frontend/src/components/lookups/template-tab/TemplateTab.jsx
index c5a36321e3..6030f43960 100644
--- a/frontend/src/components/lookups/template-tab/TemplateTab.jsx
+++ b/frontend/src/components/lookups/template-tab/TemplateTab.jsx
@@ -27,6 +27,28 @@ import "./TemplateTab.css";
 const { Title, Text, Paragraph } = Typography;
 const { TextArea } = Input;
 
+// Default template that helps users get started
+const DEFAULT_TEMPLATE = `You are an expert at matching and canonicalizing data using reference information.
+
+INPUT DATA:
+Vendor Name: {{vendor_name}}
+
+REFERENCE DATA:
+{{reference_data}}
+
+INSTRUCTIONS:
+Based on the reference data above, find the canonical (standardized) version of the vendor name provided in the input.
+
+If a match is found, return the canonical name from the reference data.
+If no match is found, return the original vendor name.
+
+Return your response as JSON in the following format:
+{
+  "canonical_vendor_name": "<the standardized vendor name>",
+  "match_found": <true or false>,
+  "confidence": <0.0 to 1.0>
+}`;
+
 export function TemplateTab({ project, onUpdate }) {
   const [template, setTemplate] = useState(null);
   const [saving, setSaving] = useState(false);
@@ -48,6 +70,13 @@ export function TemplateTab({ project, onUpdate }) {
   useEffect(() => {
     if (project.template) {
       fetchTemplate();
+    } else {
+      // Set default template for new projects
+      form.setFieldsValue({
+        name: "",
+        template_text: DEFAULT_TEMPLATE,
+      });
+      extractVariables(DEFAULT_TEMPLATE);
     }
   }, [project.template]);
 
@@ -257,22 +286,10 @@ export function TemplateTab({ project, onUpdate }) {
               },
             },
           ]}
+          extra="Use {{variable_name}} syntax for input fields and {{reference_data}} for reference data. The default template above is a starting point - customize it for your use case."
         >
           <TextArea
-            rows={10}
-            placeholder={`Extract vendor information from the input:
-
-Vendor Name: {{vendor_name}}
-
-Reference Data:
-{{reference_data}}
-
-Please canonicalize the vendor name and provide the following:
-- Canonical vendor name
-- Vendor category
-- Confidence score (0-1)
-
-Return as JSON.`}
+            rows={12}
             onChange={(e) => extractVariables(e.target.value)}
           />
         </Form.Item>
diff --git a/frontend/src/components/navigations/side-nav-bar/SideNavBar.jsx b/frontend/src/components/navigations/side-nav-bar/SideNavBar.jsx
index 35b4f44b96..9ea85de906 100644
--- a/frontend/src/components/navigations/side-nav-bar/SideNavBar.jsx
+++ b/frontend/src/components/navigations/side-nav-bar/SideNavBar.jsx
@@ -191,6 +191,16 @@ const SideNavBar = ({ collapsed }) => {
           path: `/${orgName}/tools`,
           active: globalThis.location.pathname.startsWith(`/${orgName}/tools`),
         },
+        {
+          id: 1.2,
+          title: "Look-Ups",
+          description: "Enrich extracted data with reference lookups",
+          image: LookupsIcon,
+          path: `/${orgName}/lookups`,
+          active: globalThis.location.pathname.startsWith(
+            `/${orgName}/lookups`
+          ),
+        },
         {
           id: 1.3,
           title: "Workflows",
@@ -202,14 +212,6 @@ const SideNavBar = ({ collapsed }) => {
             `/${orgName}/workflows`
           ),
         },
-        {
-          id: 1.3,
-          title: "Look-Ups",
-          description: "Enrich extracted data with reference lookups",
-          image: LookupsIcon,
-          path: `/${orgName}/lookups`,
-          active: window.location.pathname.startsWith(`/${orgName}/lookups`),
-        },
       ],
     },
     {

From 2033bcf43d43c3b52ed661d499d5a33a9bc49163 Mon Sep 17 00:00:00 2001
From: gayathrivijayakumar <gayathri@zipstack.com>
Date: Mon, 2 Feb 2026 12:48:30 +0530
Subject: [PATCH 16/22] Lookup URL changes

---
 backend/backend/urls.py                       |   1 +
 frontend/package-lock.json                    | 419 ++++++++++++++++++
 frontend/package.json                         |   3 +
 .../unstract/prompt_service/core/index_v2.py  |   3 +-
 unstract/sdk1/src/unstract/sdk1/index.py      |   3 +-
 5 files changed, 427 insertions(+), 2 deletions(-)

diff --git a/backend/backend/urls.py b/backend/backend/urls.py
index 1dd4a6a692..6b66dd8991 100644
--- a/backend/backend/urls.py
+++ b/backend/backend/urls.py
@@ -35,6 +35,7 @@
     path("platform/", include("platform_settings.urls")),
     path("api/", include("api.urls")),
     path("usage/", include("usage.urls")),
+    path("lookup/", include("lookup.urls")),
     path(
         UrlPathConstants.PROMPT_STUDIO,
         include("prompt_studio.prompt_profile_manager.urls"),
diff --git a/frontend/package-lock.json b/frontend/package-lock.json
index 9954af83a7..0feb2e872a 100644
--- a/frontend/package-lock.json
+++ b/frontend/package-lock.json
@@ -9,6 +9,8 @@
       "version": "0.1.0",
       "dependencies": {
         "@ant-design/icons": "^5.1.4",
+        "@codemirror/lang-json": "^6.0.2",
+        "@codemirror/theme-one-dark": "^6.1.3",
         "@monaco-editor/react": "^4.7.0",
         "@react-awesome-query-builder/antd": "^6.6.10",
         "@react-pdf-viewer/core": "^3.12.0",
@@ -23,6 +25,7 @@
         "@testing-library/jest-dom": "^5.16.5",
         "@testing-library/react": "^13.4.0",
         "@testing-library/user-event": "^13.5.0",
+        "@uiw/react-codemirror": "^4.25.4",
         "antd": "^5.5.1",
         "axios": "^1.4.0",
         "cron-validator": "^1.3.1",
@@ -2143,6 +2146,109 @@
       "resolved": "https://registry.npmjs.org/@bcoe/v8-coverage/-/v8-coverage-0.2.3.tgz",
       "integrity": "sha512-0hYQ8SB4Db5zvZB4axdMHGwEaQjkZzFjQiN9LVYvIFB2nSUHW9tYpxWriPrWDASIxiaXax83REcLxuSdnGPZtw=="
     },
+    "node_modules/@codemirror/autocomplete": {
+      "version": "6.20.0",
+      "resolved": "https://registry.npmjs.org/@codemirror/autocomplete/-/autocomplete-6.20.0.tgz",
+      "integrity": "sha512-bOwvTOIJcG5FVo5gUUupiwYh8MioPLQ4UcqbcRf7UQ98X90tCa9E1kZ3Z7tqwpZxYyOvh1YTYbmZE9RTfTp5hg==",
+      "license": "MIT",
+      "dependencies": {
+        "@codemirror/language": "^6.0.0",
+        "@codemirror/state": "^6.0.0",
+        "@codemirror/view": "^6.17.0",
+        "@lezer/common": "^1.0.0"
+      }
+    },
+    "node_modules/@codemirror/commands": {
+      "version": "6.10.0",
+      "resolved": "https://registry.npmjs.org/@codemirror/commands/-/commands-6.10.0.tgz",
+      "integrity": "sha512-2xUIc5mHXQzT16JnyOFkh8PvfeXuIut3pslWGfsGOhxP/lpgRm9HOl/mpzLErgt5mXDovqA0d11P21gofRLb9w==",
+      "license": "MIT",
+      "dependencies": {
+        "@codemirror/language": "^6.0.0",
+        "@codemirror/state": "^6.4.0",
+        "@codemirror/view": "^6.27.0",
+        "@lezer/common": "^1.1.0"
+      }
+    },
+    "node_modules/@codemirror/lang-json": {
+      "version": "6.0.2",
+      "resolved": "https://registry.npmjs.org/@codemirror/lang-json/-/lang-json-6.0.2.tgz",
+      "integrity": "sha512-x2OtO+AvwEHrEwR0FyyPtfDUiloG3rnVTSZV1W8UteaLL8/MajQd8DpvUb2YVzC+/T18aSDv0H9mu+xw0EStoQ==",
+      "license": "MIT",
+      "dependencies": {
+        "@codemirror/language": "^6.0.0",
+        "@lezer/json": "^1.0.0"
+      }
+    },
+    "node_modules/@codemirror/language": {
+      "version": "6.11.3",
+      "resolved": "https://registry.npmjs.org/@codemirror/language/-/language-6.11.3.tgz",
+      "integrity": "sha512-9HBM2XnwDj7fnu0551HkGdrUrrqmYq/WC5iv6nbY2WdicXdGbhR/gfbZOH73Aqj4351alY1+aoG9rCNfiwS1RA==",
+      "license": "MIT",
+      "dependencies": {
+        "@codemirror/state": "^6.0.0",
+        "@codemirror/view": "^6.23.0",
+        "@lezer/common": "^1.1.0",
+        "@lezer/highlight": "^1.0.0",
+        "@lezer/lr": "^1.0.0",
+        "style-mod": "^4.0.0"
+      }
+    },
+    "node_modules/@codemirror/lint": {
+      "version": "6.9.2",
+      "resolved": "https://registry.npmjs.org/@codemirror/lint/-/lint-6.9.2.tgz",
+      "integrity": "sha512-sv3DylBiIyi+xKwRCJAAsBZZZWo82shJ/RTMymLabAdtbkV5cSKwWDeCgtUq3v8flTaXS2y1kKkICuRYtUswyQ==",
+      "license": "MIT",
+      "dependencies": {
+        "@codemirror/state": "^6.0.0",
+        "@codemirror/view": "^6.35.0",
+        "crelt": "^1.0.5"
+      }
+    },
+    "node_modules/@codemirror/search": {
+      "version": "6.5.11",
+      "resolved": "https://registry.npmjs.org/@codemirror/search/-/search-6.5.11.tgz",
+      "integrity": "sha512-KmWepDE6jUdL6n8cAAqIpRmLPBZ5ZKnicE8oGU/s3QrAVID+0VhLFrzUucVKHG5035/BSykhExDL/Xm7dHthiA==",
+      "license": "MIT",
+      "dependencies": {
+        "@codemirror/state": "^6.0.0",
+        "@codemirror/view": "^6.0.0",
+        "crelt": "^1.0.5"
+      }
+    },
+    "node_modules/@codemirror/state": {
+      "version": "6.5.2",
+      "resolved": "https://registry.npmjs.org/@codemirror/state/-/state-6.5.2.tgz",
+      "integrity": "sha512-FVqsPqtPWKVVL3dPSxy8wEF/ymIEuVzF1PK3VbUgrxXpJUSHQWWZz4JMToquRxnkw+36LTamCZG2iua2Ptq0fA==",
+      "license": "MIT",
+      "dependencies": {
+        "@marijn/find-cluster-break": "^1.0.0"
+      }
+    },
+    "node_modules/@codemirror/theme-one-dark": {
+      "version": "6.1.3",
+      "resolved": "https://registry.npmjs.org/@codemirror/theme-one-dark/-/theme-one-dark-6.1.3.tgz",
+      "integrity": "sha512-NzBdIvEJmx6fjeremiGp3t/okrLPYT0d9orIc7AFun8oZcRk58aejkqhv6spnz4MLAevrKNPMQYXEWMg4s+sKA==",
+      "license": "MIT",
+      "dependencies": {
+        "@codemirror/language": "^6.0.0",
+        "@codemirror/state": "^6.0.0",
+        "@codemirror/view": "^6.0.0",
+        "@lezer/highlight": "^1.0.0"
+      }
+    },
+    "node_modules/@codemirror/view": {
+      "version": "6.39.4",
+      "resolved": "https://registry.npmjs.org/@codemirror/view/-/view-6.39.4.tgz",
+      "integrity": "sha512-xMF6OfEAUVY5Waega4juo1QGACfNkNF+aJLqpd8oUJz96ms2zbfQ9Gh35/tI3y8akEV31FruKfj7hBnIU/nkqA==",
+      "license": "MIT",
+      "dependencies": {
+        "@codemirror/state": "^6.5.0",
+        "crelt": "^1.0.6",
+        "style-mod": "^4.1.0",
+        "w3c-keyname": "^2.2.4"
+      }
+    },
     "node_modules/@csstools/normalize.css": {
       "version": "12.0.0",
       "resolved": "https://registry.npmjs.org/@csstools/normalize.css/-/normalize.css-12.0.0.tgz",
@@ -3484,6 +3590,41 @@
       "resolved": "https://registry.npmjs.org/@leichtgewicht/ip-codec/-/ip-codec-2.0.4.tgz",
       "integrity": "sha512-Hcv+nVC0kZnQ3tD9GVu5xSMR4VVYOteQIr/hwFPVEvPdlXqgGEuRjiheChHgdM+JyqdgNcmzZOX/tnl0JOiI7A=="
     },
+    "node_modules/@lezer/common": {
+      "version": "1.4.0",
+      "resolved": "https://registry.npmjs.org/@lezer/common/-/common-1.4.0.tgz",
+      "integrity": "sha512-DVeMRoGrgn/k45oQNu189BoW4SZwgZFzJ1+1TV5j2NJ/KFC83oa/enRqZSGshyeMk5cPWMhsKs9nx+8o0unwGg==",
+      "license": "MIT"
+    },
+    "node_modules/@lezer/highlight": {
+      "version": "1.2.3",
+      "resolved": "https://registry.npmjs.org/@lezer/highlight/-/highlight-1.2.3.tgz",
+      "integrity": "sha512-qXdH7UqTvGfdVBINrgKhDsVTJTxactNNxLk7+UMwZhU13lMHaOBlJe9Vqp907ya56Y3+ed2tlqzys7jDkTmW0g==",
+      "license": "MIT",
+      "dependencies": {
+        "@lezer/common": "^1.3.0"
+      }
+    },
+    "node_modules/@lezer/json": {
+      "version": "1.0.3",
+      "resolved": "https://registry.npmjs.org/@lezer/json/-/json-1.0.3.tgz",
+      "integrity": "sha512-BP9KzdF9Y35PDpv04r0VeSTKDeox5vVr3efE7eBbx3r4s3oNLfunchejZhjArmeieBH+nVOpgIiBJpEAv8ilqQ==",
+      "license": "MIT",
+      "dependencies": {
+        "@lezer/common": "^1.2.0",
+        "@lezer/highlight": "^1.0.0",
+        "@lezer/lr": "^1.0.0"
+      }
+    },
+    "node_modules/@lezer/lr": {
+      "version": "1.4.5",
+      "resolved": "https://registry.npmjs.org/@lezer/lr/-/lr-1.4.5.tgz",
+      "integrity": "sha512-/YTRKP5yPPSo1xImYQk7AZZMAgap0kegzqCSYHjAL9x1AZ0ZQW+IpcEzMKagCsbTsLnVeWkxYrCNeXG8xEPrjg==",
+      "license": "MIT",
+      "dependencies": {
+        "@lezer/common": "^1.0.0"
+      }
+    },
     "node_modules/@mapbox/node-pre-gyp": {
       "version": "1.0.11",
       "resolved": "https://registry.npmjs.org/@mapbox/node-pre-gyp/-/node-pre-gyp-1.0.11.tgz",
@@ -3537,6 +3678,12 @@
       "integrity": "sha512-3wdGidZyq5PB084XLES5TpOSRA3wjXAlIWMhum2kRcv/41Sn2emQ0dycQW4uZXLejwKvg6EsvbdlVL+FYEct7A==",
       "optional": true
     },
+    "node_modules/@marijn/find-cluster-break": {
+      "version": "1.0.2",
+      "resolved": "https://registry.npmjs.org/@marijn/find-cluster-break/-/find-cluster-break-1.0.2.tgz",
+      "integrity": "sha512-l0h88YhZFyKdXIFNfSWpyjStDjGHwZ/U7iobcK1cQQD8sejsONdQtTVU+1wVN1PBw40PiiHB1vA5S7VTfQiP9g==",
+      "license": "MIT"
+    },
     "node_modules/@monaco-editor/loader": {
       "version": "1.5.0",
       "resolved": "https://registry.npmjs.org/@monaco-editor/loader/-/loader-1.5.0.tgz",
@@ -5510,6 +5657,59 @@
         "url": "https://opencollective.com/typescript-eslint"
       }
     },
+    "node_modules/@uiw/codemirror-extensions-basic-setup": {
+      "version": "4.25.4",
+      "resolved": "https://registry.npmjs.org/@uiw/codemirror-extensions-basic-setup/-/codemirror-extensions-basic-setup-4.25.4.tgz",
+      "integrity": "sha512-YzNwkm0AbPv1EXhCHYR5v0nqfemG2jEB0Z3Att4rBYqKrlG7AA9Rhjc3IyBaOzsBu18wtrp9/+uhTyu7TXSRng==",
+      "license": "MIT",
+      "dependencies": {
+        "@codemirror/autocomplete": "^6.0.0",
+        "@codemirror/commands": "^6.0.0",
+        "@codemirror/language": "^6.0.0",
+        "@codemirror/lint": "^6.0.0",
+        "@codemirror/search": "^6.0.0",
+        "@codemirror/state": "^6.0.0",
+        "@codemirror/view": "^6.0.0"
+      },
+      "funding": {
+        "url": "https://jaywcjlove.github.io/#/sponsor"
+      },
+      "peerDependencies": {
+        "@codemirror/autocomplete": ">=6.0.0",
+        "@codemirror/commands": ">=6.0.0",
+        "@codemirror/language": ">=6.0.0",
+        "@codemirror/lint": ">=6.0.0",
+        "@codemirror/search": ">=6.0.0",
+        "@codemirror/state": ">=6.0.0",
+        "@codemirror/view": ">=6.0.0"
+      }
+    },
+    "node_modules/@uiw/react-codemirror": {
+      "version": "4.25.4",
+      "resolved": "https://registry.npmjs.org/@uiw/react-codemirror/-/react-codemirror-4.25.4.tgz",
+      "integrity": "sha512-ipO067oyfUw+DVaXhQCxkB0ZD9b7RnY+ByrprSYSKCHaULvJ3sqWYC/Zen6zVQ8/XC4o5EPBfatGiX20kC7XGA==",
+      "license": "MIT",
+      "dependencies": {
+        "@babel/runtime": "^7.18.6",
+        "@codemirror/commands": "^6.1.0",
+        "@codemirror/state": "^6.1.1",
+        "@codemirror/theme-one-dark": "^6.0.0",
+        "@uiw/codemirror-extensions-basic-setup": "4.25.4",
+        "codemirror": "^6.0.0"
+      },
+      "funding": {
+        "url": "https://jaywcjlove.github.io/#/sponsor"
+      },
+      "peerDependencies": {
+        "@babel/runtime": ">=7.11.0",
+        "@codemirror/state": ">=6.0.0",
+        "@codemirror/theme-one-dark": ">=6.0.0",
+        "@codemirror/view": ">=6.0.0",
+        "codemirror": ">=6.0.0",
+        "react": ">=17.0.0",
+        "react-dom": ">=17.0.0"
+      }
+    },
     "node_modules/@webassemblyjs/ast": {
       "version": "1.14.1",
       "resolved": "https://registry.npmjs.org/@webassemblyjs/ast/-/ast-1.14.1.tgz",
@@ -7167,6 +7367,21 @@
         "node": ">=4"
       }
     },
+    "node_modules/codemirror": {
+      "version": "6.0.2",
+      "resolved": "https://registry.npmjs.org/codemirror/-/codemirror-6.0.2.tgz",
+      "integrity": "sha512-VhydHotNW5w1UGK0Qj96BwSk/Zqbp9WbnyK2W/eVMv4QyF41INRGpjUhFJY7/uDNuudSc33a/PKr4iDqRduvHw==",
+      "license": "MIT",
+      "dependencies": {
+        "@codemirror/autocomplete": "^6.0.0",
+        "@codemirror/commands": "^6.0.0",
+        "@codemirror/language": "^6.0.0",
+        "@codemirror/lint": "^6.0.0",
+        "@codemirror/search": "^6.0.0",
+        "@codemirror/state": "^6.0.0",
+        "@codemirror/view": "^6.0.0"
+      }
+    },
     "node_modules/collect-v8-coverage": {
       "version": "1.0.1",
       "resolved": "https://registry.npmjs.org/collect-v8-coverage/-/collect-v8-coverage-1.0.1.tgz",
@@ -7450,6 +7665,12 @@
         "node": ">=10"
       }
     },
+    "node_modules/crelt": {
+      "version": "1.0.6",
+      "resolved": "https://registry.npmjs.org/crelt/-/crelt-1.0.6.tgz",
+      "integrity": "sha512-VQ2MBenTq1fWZUH9DJNGti7kKv6EeAuYr3cLwxUWhIu1baTaXh4Ib5W2CqHVqib4/MqbYGJqiL3Zb8GJZr3l4g==",
+      "license": "MIT"
+    },
     "node_modules/cron-validator": {
       "version": "1.3.1",
       "resolved": "https://registry.npmjs.org/cron-validator/-/cron-validator-1.3.1.tgz",
@@ -19913,6 +20134,12 @@
         "webpack": "^5.0.0"
       }
     },
+    "node_modules/style-mod": {
+      "version": "4.1.3",
+      "resolved": "https://registry.npmjs.org/style-mod/-/style-mod-4.1.3.tgz",
+      "integrity": "sha512-i/n8VsZydrugj3Iuzll8+x/00GH2vnYsk1eomD8QiRrSAeW6ItbCQDtfXCeJHd0iwiNagqjQkvpvREEPtW3IoQ==",
+      "license": "MIT"
+    },
     "node_modules/style-to-object": {
       "version": "0.4.4",
       "resolved": "https://registry.npmjs.org/style-to-object/-/style-to-object-0.4.4.tgz",
@@ -21156,6 +21383,12 @@
         "browser-process-hrtime": "^1.0.0"
       }
     },
+    "node_modules/w3c-keyname": {
+      "version": "2.2.8",
+      "resolved": "https://registry.npmjs.org/w3c-keyname/-/w3c-keyname-2.2.8.tgz",
+      "integrity": "sha512-dpojBhNsCNN7T82Tm7k26A6G9ML3NkhDsnw9n/eoxSRlVBB4CEtIQ/KTCLI2Fwf3ataSXRhYFkQi3SlnFwPvPQ==",
+      "license": "MIT"
+    },
     "node_modules/w3c-xmlserializer": {
       "version": "2.0.0",
       "resolved": "https://registry.npmjs.org/w3c-xmlserializer/-/w3c-xmlserializer-2.0.0.tgz",
@@ -23423,6 +23656,100 @@
       "resolved": "https://registry.npmjs.org/@bcoe/v8-coverage/-/v8-coverage-0.2.3.tgz",
       "integrity": "sha512-0hYQ8SB4Db5zvZB4axdMHGwEaQjkZzFjQiN9LVYvIFB2nSUHW9tYpxWriPrWDASIxiaXax83REcLxuSdnGPZtw=="
     },
+    "@codemirror/autocomplete": {
+      "version": "6.20.0",
+      "resolved": "https://registry.npmjs.org/@codemirror/autocomplete/-/autocomplete-6.20.0.tgz",
+      "integrity": "sha512-bOwvTOIJcG5FVo5gUUupiwYh8MioPLQ4UcqbcRf7UQ98X90tCa9E1kZ3Z7tqwpZxYyOvh1YTYbmZE9RTfTp5hg==",
+      "requires": {
+        "@codemirror/language": "^6.0.0",
+        "@codemirror/state": "^6.0.0",
+        "@codemirror/view": "^6.17.0",
+        "@lezer/common": "^1.0.0"
+      }
+    },
+    "@codemirror/commands": {
+      "version": "6.10.0",
+      "resolved": "https://registry.npmjs.org/@codemirror/commands/-/commands-6.10.0.tgz",
+      "integrity": "sha512-2xUIc5mHXQzT16JnyOFkh8PvfeXuIut3pslWGfsGOhxP/lpgRm9HOl/mpzLErgt5mXDovqA0d11P21gofRLb9w==",
+      "requires": {
+        "@codemirror/language": "^6.0.0",
+        "@codemirror/state": "^6.4.0",
+        "@codemirror/view": "^6.27.0",
+        "@lezer/common": "^1.1.0"
+      }
+    },
+    "@codemirror/lang-json": {
+      "version": "6.0.2",
+      "resolved": "https://registry.npmjs.org/@codemirror/lang-json/-/lang-json-6.0.2.tgz",
+      "integrity": "sha512-x2OtO+AvwEHrEwR0FyyPtfDUiloG3rnVTSZV1W8UteaLL8/MajQd8DpvUb2YVzC+/T18aSDv0H9mu+xw0EStoQ==",
+      "requires": {
+        "@codemirror/language": "^6.0.0",
+        "@lezer/json": "^1.0.0"
+      }
+    },
+    "@codemirror/language": {
+      "version": "6.11.3",
+      "resolved": "https://registry.npmjs.org/@codemirror/language/-/language-6.11.3.tgz",
+      "integrity": "sha512-9HBM2XnwDj7fnu0551HkGdrUrrqmYq/WC5iv6nbY2WdicXdGbhR/gfbZOH73Aqj4351alY1+aoG9rCNfiwS1RA==",
+      "requires": {
+        "@codemirror/state": "^6.0.0",
+        "@codemirror/view": "^6.23.0",
+        "@lezer/common": "^1.1.0",
+        "@lezer/highlight": "^1.0.0",
+        "@lezer/lr": "^1.0.0",
+        "style-mod": "^4.0.0"
+      }
+    },
+    "@codemirror/lint": {
+      "version": "6.9.2",
+      "resolved": "https://registry.npmjs.org/@codemirror/lint/-/lint-6.9.2.tgz",
+      "integrity": "sha512-sv3DylBiIyi+xKwRCJAAsBZZZWo82shJ/RTMymLabAdtbkV5cSKwWDeCgtUq3v8flTaXS2y1kKkICuRYtUswyQ==",
+      "requires": {
+        "@codemirror/state": "^6.0.0",
+        "@codemirror/view": "^6.35.0",
+        "crelt": "^1.0.5"
+      }
+    },
+    "@codemirror/search": {
+      "version": "6.5.11",
+      "resolved": "https://registry.npmjs.org/@codemirror/search/-/search-6.5.11.tgz",
+      "integrity": "sha512-KmWepDE6jUdL6n8cAAqIpRmLPBZ5ZKnicE8oGU/s3QrAVID+0VhLFrzUucVKHG5035/BSykhExDL/Xm7dHthiA==",
+      "requires": {
+        "@codemirror/state": "^6.0.0",
+        "@codemirror/view": "^6.0.0",
+        "crelt": "^1.0.5"
+      }
+    },
+    "@codemirror/state": {
+      "version": "6.5.2",
+      "resolved": "https://registry.npmjs.org/@codemirror/state/-/state-6.5.2.tgz",
+      "integrity": "sha512-FVqsPqtPWKVVL3dPSxy8wEF/ymIEuVzF1PK3VbUgrxXpJUSHQWWZz4JMToquRxnkw+36LTamCZG2iua2Ptq0fA==",
+      "requires": {
+        "@marijn/find-cluster-break": "^1.0.0"
+      }
+    },
+    "@codemirror/theme-one-dark": {
+      "version": "6.1.3",
+      "resolved": "https://registry.npmjs.org/@codemirror/theme-one-dark/-/theme-one-dark-6.1.3.tgz",
+      "integrity": "sha512-NzBdIvEJmx6fjeremiGp3t/okrLPYT0d9orIc7AFun8oZcRk58aejkqhv6spnz4MLAevrKNPMQYXEWMg4s+sKA==",
+      "requires": {
+        "@codemirror/language": "^6.0.0",
+        "@codemirror/state": "^6.0.0",
+        "@codemirror/view": "^6.0.0",
+        "@lezer/highlight": "^1.0.0"
+      }
+    },
+    "@codemirror/view": {
+      "version": "6.39.4",
+      "resolved": "https://registry.npmjs.org/@codemirror/view/-/view-6.39.4.tgz",
+      "integrity": "sha512-xMF6OfEAUVY5Waega4juo1QGACfNkNF+aJLqpd8oUJz96ms2zbfQ9Gh35/tI3y8akEV31FruKfj7hBnIU/nkqA==",
+      "requires": {
+        "@codemirror/state": "^6.5.0",
+        "crelt": "^1.0.6",
+        "style-mod": "^4.1.0",
+        "w3c-keyname": "^2.2.4"
+      }
+    },
     "@csstools/normalize.css": {
       "version": "12.0.0",
       "resolved": "https://registry.npmjs.org/@csstools/normalize.css/-/normalize.css-12.0.0.tgz",
@@ -24429,6 +24756,37 @@
       "resolved": "https://registry.npmjs.org/@leichtgewicht/ip-codec/-/ip-codec-2.0.4.tgz",
       "integrity": "sha512-Hcv+nVC0kZnQ3tD9GVu5xSMR4VVYOteQIr/hwFPVEvPdlXqgGEuRjiheChHgdM+JyqdgNcmzZOX/tnl0JOiI7A=="
     },
+    "@lezer/common": {
+      "version": "1.4.0",
+      "resolved": "https://registry.npmjs.org/@lezer/common/-/common-1.4.0.tgz",
+      "integrity": "sha512-DVeMRoGrgn/k45oQNu189BoW4SZwgZFzJ1+1TV5j2NJ/KFC83oa/enRqZSGshyeMk5cPWMhsKs9nx+8o0unwGg=="
+    },
+    "@lezer/highlight": {
+      "version": "1.2.3",
+      "resolved": "https://registry.npmjs.org/@lezer/highlight/-/highlight-1.2.3.tgz",
+      "integrity": "sha512-qXdH7UqTvGfdVBINrgKhDsVTJTxactNNxLk7+UMwZhU13lMHaOBlJe9Vqp907ya56Y3+ed2tlqzys7jDkTmW0g==",
+      "requires": {
+        "@lezer/common": "^1.3.0"
+      }
+    },
+    "@lezer/json": {
+      "version": "1.0.3",
+      "resolved": "https://registry.npmjs.org/@lezer/json/-/json-1.0.3.tgz",
+      "integrity": "sha512-BP9KzdF9Y35PDpv04r0VeSTKDeox5vVr3efE7eBbx3r4s3oNLfunchejZhjArmeieBH+nVOpgIiBJpEAv8ilqQ==",
+      "requires": {
+        "@lezer/common": "^1.2.0",
+        "@lezer/highlight": "^1.0.0",
+        "@lezer/lr": "^1.0.0"
+      }
+    },
+    "@lezer/lr": {
+      "version": "1.4.5",
+      "resolved": "https://registry.npmjs.org/@lezer/lr/-/lr-1.4.5.tgz",
+      "integrity": "sha512-/YTRKP5yPPSo1xImYQk7AZZMAgap0kegzqCSYHjAL9x1AZ0ZQW+IpcEzMKagCsbTsLnVeWkxYrCNeXG8xEPrjg==",
+      "requires": {
+        "@lezer/common": "^1.0.0"
+      }
+    },
     "@mapbox/node-pre-gyp": {
       "version": "1.0.11",
       "resolved": "https://registry.npmjs.org/@mapbox/node-pre-gyp/-/node-pre-gyp-1.0.11.tgz",
@@ -24472,6 +24830,11 @@
         }
       }
     },
+    "@marijn/find-cluster-break": {
+      "version": "1.0.2",
+      "resolved": "https://registry.npmjs.org/@marijn/find-cluster-break/-/find-cluster-break-1.0.2.tgz",
+      "integrity": "sha512-l0h88YhZFyKdXIFNfSWpyjStDjGHwZ/U7iobcK1cQQD8sejsONdQtTVU+1wVN1PBw40PiiHB1vA5S7VTfQiP9g=="
+    },
     "@monaco-editor/loader": {
       "version": "1.5.0",
       "resolved": "https://registry.npmjs.org/@monaco-editor/loader/-/loader-1.5.0.tgz",
@@ -25869,6 +26232,33 @@
         "eslint-visitor-keys": "^3.3.0"
       }
     },
+    "@uiw/codemirror-extensions-basic-setup": {
+      "version": "4.25.4",
+      "resolved": "https://registry.npmjs.org/@uiw/codemirror-extensions-basic-setup/-/codemirror-extensions-basic-setup-4.25.4.tgz",
+      "integrity": "sha512-YzNwkm0AbPv1EXhCHYR5v0nqfemG2jEB0Z3Att4rBYqKrlG7AA9Rhjc3IyBaOzsBu18wtrp9/+uhTyu7TXSRng==",
+      "requires": {
+        "@codemirror/autocomplete": "^6.0.0",
+        "@codemirror/commands": "^6.0.0",
+        "@codemirror/language": "^6.0.0",
+        "@codemirror/lint": "^6.0.0",
+        "@codemirror/search": "^6.0.0",
+        "@codemirror/state": "^6.0.0",
+        "@codemirror/view": "^6.0.0"
+      }
+    },
+    "@uiw/react-codemirror": {
+      "version": "4.25.4",
+      "resolved": "https://registry.npmjs.org/@uiw/react-codemirror/-/react-codemirror-4.25.4.tgz",
+      "integrity": "sha512-ipO067oyfUw+DVaXhQCxkB0ZD9b7RnY+ByrprSYSKCHaULvJ3sqWYC/Zen6zVQ8/XC4o5EPBfatGiX20kC7XGA==",
+      "requires": {
+        "@babel/runtime": "^7.18.6",
+        "@codemirror/commands": "^6.1.0",
+        "@codemirror/state": "^6.1.1",
+        "@codemirror/theme-one-dark": "^6.0.0",
+        "@uiw/codemirror-extensions-basic-setup": "4.25.4",
+        "codemirror": "^6.0.0"
+      }
+    },
     "@webassemblyjs/ast": {
       "version": "1.14.1",
       "resolved": "https://registry.npmjs.org/@webassemblyjs/ast/-/ast-1.14.1.tgz",
@@ -27074,6 +27464,20 @@
         }
       }
     },
+    "codemirror": {
+      "version": "6.0.2",
+      "resolved": "https://registry.npmjs.org/codemirror/-/codemirror-6.0.2.tgz",
+      "integrity": "sha512-VhydHotNW5w1UGK0Qj96BwSk/Zqbp9WbnyK2W/eVMv4QyF41INRGpjUhFJY7/uDNuudSc33a/PKr4iDqRduvHw==",
+      "requires": {
+        "@codemirror/autocomplete": "^6.0.0",
+        "@codemirror/commands": "^6.0.0",
+        "@codemirror/language": "^6.0.0",
+        "@codemirror/lint": "^6.0.0",
+        "@codemirror/search": "^6.0.0",
+        "@codemirror/state": "^6.0.0",
+        "@codemirror/view": "^6.0.0"
+      }
+    },
     "collect-v8-coverage": {
       "version": "1.0.1",
       "resolved": "https://registry.npmjs.org/collect-v8-coverage/-/collect-v8-coverage-1.0.1.tgz",
@@ -27296,6 +27700,11 @@
         "yaml": "^1.10.0"
       }
     },
+    "crelt": {
+      "version": "1.0.6",
+      "resolved": "https://registry.npmjs.org/crelt/-/crelt-1.0.6.tgz",
+      "integrity": "sha512-VQ2MBenTq1fWZUH9DJNGti7kKv6EeAuYr3cLwxUWhIu1baTaXh4Ib5W2CqHVqib4/MqbYGJqiL3Zb8GJZr3l4g=="
+    },
     "cron-validator": {
       "version": "1.3.1",
       "resolved": "https://registry.npmjs.org/cron-validator/-/cron-validator-1.3.1.tgz",
@@ -36010,6 +36419,11 @@
       "integrity": "sha512-53BiGLXAcll9maCYtZi2RCQZKa8NQQai5C4horqKyRmHj9H7QmcUyucrH+4KW/gBQbXM2AsB0axoEcFZPlfPcw==",
       "requires": {}
     },
+    "style-mod": {
+      "version": "4.1.3",
+      "resolved": "https://registry.npmjs.org/style-mod/-/style-mod-4.1.3.tgz",
+      "integrity": "sha512-i/n8VsZydrugj3Iuzll8+x/00GH2vnYsk1eomD8QiRrSAeW6ItbCQDtfXCeJHd0iwiNagqjQkvpvREEPtW3IoQ=="
+    },
     "style-to-object": {
       "version": "0.4.4",
       "resolved": "https://registry.npmjs.org/style-to-object/-/style-to-object-0.4.4.tgz",
@@ -36917,6 +37331,11 @@
         "browser-process-hrtime": "^1.0.0"
       }
     },
+    "w3c-keyname": {
+      "version": "2.2.8",
+      "resolved": "https://registry.npmjs.org/w3c-keyname/-/w3c-keyname-2.2.8.tgz",
+      "integrity": "sha512-dpojBhNsCNN7T82Tm7k26A6G9ML3NkhDsnw9n/eoxSRlVBB4CEtIQ/KTCLI2Fwf3ataSXRhYFkQi3SlnFwPvPQ=="
+    },
     "w3c-xmlserializer": {
       "version": "2.0.0",
       "resolved": "https://registry.npmjs.org/w3c-xmlserializer/-/w3c-xmlserializer-2.0.0.tgz",
diff --git a/frontend/package.json b/frontend/package.json
index d8bd36af34..0abab9ba85 100644
--- a/frontend/package.json
+++ b/frontend/package.json
@@ -4,6 +4,8 @@
   "private": true,
   "dependencies": {
     "@ant-design/icons": "^5.1.4",
+    "@codemirror/lang-json": "^6.0.2",
+    "@codemirror/theme-one-dark": "^6.1.3",
     "@monaco-editor/react": "^4.7.0",
     "@react-awesome-query-builder/antd": "^6.6.10",
     "@react-pdf-viewer/core": "^3.12.0",
@@ -18,6 +20,7 @@
     "@testing-library/jest-dom": "^5.16.5",
     "@testing-library/react": "^13.4.0",
     "@testing-library/user-event": "^13.5.0",
+    "@uiw/react-codemirror": "^4.25.4",
     "antd": "^5.5.1",
     "axios": "^1.4.0",
     "cron-validator": "^1.3.1",
diff --git a/prompt-service/src/unstract/prompt_service/core/index_v2.py b/prompt-service/src/unstract/prompt_service/core/index_v2.py
index 6e621d6ec9..97a5ce24ee 100644
--- a/prompt-service/src/unstract/prompt_service/core/index_v2.py
+++ b/prompt-service/src/unstract/prompt_service/core/index_v2.py
@@ -220,7 +220,8 @@ def _prepare_documents(self, doc_id: str, full_text: Any) -> list:
                 document = Document(
                     text=text,
                     doc_id=doc_id,
-                    metadata={"section": item["section"]},
+                    # Include doc_id in metadata for retrieval filtering
+                    metadata={"section": item["section"], "doc_id": doc_id},
                 )
                 document.id_ = doc_id
                 documents.append(document)
diff --git a/unstract/sdk1/src/unstract/sdk1/index.py b/unstract/sdk1/src/unstract/sdk1/index.py
index ed48679638..a0581595d4 100644
--- a/unstract/sdk1/src/unstract/sdk1/index.py
+++ b/unstract/sdk1/src/unstract/sdk1/index.py
@@ -399,7 +399,8 @@ def index_to_vector_db(
             document = Document(
                 text=text,
                 doc_id=doc_id,
-                metadata={"section": item["section"]},
+                # Include doc_id in metadata for retrieval filtering
+                metadata={"section": item["section"], "doc_id": doc_id},
             )
             document.id_ = doc_id
             documents.append(document)

From 1adbfc7c8b784b9b0d71298b292b7e6d05e90900 Mon Sep 17 00:00:00 2001
From: Gayathri <142381512+gaya3-zipstack@users.noreply.github.com>
Date: Wed, 4 Feb 2026 13:52:39 +0530
Subject: [PATCH 17/22] Update urls_v2.py

Signed-off-by: Gayathri <142381512+gaya3-zipstack@users.noreply.github.com>
---
 backend/backend/urls_v2.py | 1 +
 1 file changed, 1 insertion(+)

diff --git a/backend/backend/urls_v2.py b/backend/backend/urls_v2.py
index 988183abfb..8b25436674 100644
--- a/backend/backend/urls_v2.py
+++ b/backend/backend/urls_v2.py
@@ -35,6 +35,7 @@
     path("usage/", include("usage_v2.urls")),
     path("notifications/", include("notification_v2.urls")),
     path("logs/", include("logs_helper.urls")),
+    path("lookup/", include("lookup.urls")),
     path(
         UrlPathConstants.PROMPT_STUDIO,
         include("prompt_studio.prompt_profile_manager_v2.urls"),

From c27a2a849597d5080f82f91abf7af67707adc9ed Mon Sep 17 00:00:00 2001
From: Gayathri <142381512+gaya3-zipstack@users.noreply.github.com>
Date: Wed, 4 Feb 2026 13:54:43 +0530
Subject: [PATCH 18/22] Add 'lookup' to SHARED_APPS in base.py

Signed-off-by: Gayathri <142381512+gaya3-zipstack@users.noreply.github.com>
---
 backend/backend/settings/base.py | 1 +
 1 file changed, 1 insertion(+)

diff --git a/backend/backend/settings/base.py b/backend/backend/settings/base.py
index 94cb55b3ae..9b02634737 100644
--- a/backend/backend/settings/base.py
+++ b/backend/backend/settings/base.py
@@ -342,6 +342,7 @@ def filter(self, record):
     "prompt_studio.prompt_studio_index_manager_v2",
     "tags",
     "configuration",
+    "lookup",
 )
 TENANT_APPS = []
 

From f36b2a0c9a757b05dba3598d7c54d32a21bdc83a Mon Sep 17 00:00:00 2001
From: Gayathri <142381512+gaya3-zipstack@users.noreply.github.com>
Date: Wed, 4 Feb 2026 13:56:50 +0530
Subject: [PATCH 19/22] Update base.py

Signed-off-by: Gayathri <142381512+gaya3-zipstack@users.noreply.github.com>
---
 backend/backend/settings/base.py | 8 ++++++++
 1 file changed, 8 insertions(+)

diff --git a/backend/backend/settings/base.py b/backend/backend/settings/base.py
index 9b02634737..eb708936fb 100644
--- a/backend/backend/settings/base.py
+++ b/backend/backend/settings/base.py
@@ -600,3 +600,11 @@ def filter(self, record):
     raise ValueError(ERROR_MESSAGE)
 
 ENABLE_HIGHLIGHT_API_DEPLOYMENT = os.environ.get("ENABLE_HIGHLIGHT_API_DEPLOYMENT", False)
+
+# Lookup Integration Settings
+# Enable/disable automatic Lookup enrichment after Prompt Studio extraction
+LOOKUP_AUTO_ENRICH_ENABLED = CommonUtils.str_to_bool(
+    os.environ.get("LOOKUP_AUTO_ENRICH_ENABLED", "True")
+)
+# Maximum time (in seconds) to wait for Lookup enrichment before returning
+LOOKUP_ENRICHMENT_TIMEOUT = int(os.environ.get("LOOKUP_ENRICHMENT_TIMEOUT", "30"))

From 29b9adb5ec7fdfb20e14f108f66764643c798d63 Mon Sep 17 00:00:00 2001
From: gayathrivijayakumar <gayathri@zipstack.com>
Date: Thu, 5 Feb 2026 10:59:46 +0530
Subject: [PATCH 20/22] Lookup architecture

---
 docs/lookup_architecture_final.md | 773 ++++++++++++++++++++++++++++++
 1 file changed, 773 insertions(+)
 create mode 100644 docs/lookup_architecture_final.md

diff --git a/docs/lookup_architecture_final.md b/docs/lookup_architecture_final.md
new file mode 100644
index 0000000000..37e64da495
--- /dev/null
+++ b/docs/lookup_architecture_final.md
@@ -0,0 +1,773 @@
+# Lookup System - Final Architecture
+## Profile-Based Adapter System (Aligned with Prompt Studio)
+
+**Date**: 2025-12-26
+**Status**: Current Architecture Specification
+**Based On**: Prompt Studio's ProfileManager pattern
+
+---
+
+## Executive Summary
+
+The Lookup system uses a **profile-based architecture** identical to Prompt Studio's approach:
+
+1. **LookupProfileManager** - Separate entity storing adapter configurations
+2. **Profile Linking** - Each LookupProject links to multiple profiles (one default)
+3. **Adapter Selection** - Users choose adapters via dropdowns (like Templates screen)
+4. **Profile Screen** - Separate UI for managing profiles per project
+5. **Unified Pattern** - Same adapter system (X2Text, Embedding, VectorDB, LLM)
+
+---
+
+## Architecture Alignment with Prompt Studio
+
+### Prompt Studio Pattern (Reference)
+
+```python
+class ProfileManager(BaseModel):
+    profile_id = UUIDField(primary_key=True)
+    profile_name = TextField(blank=False)
+
+    # FK to Project/Tool
+    prompt_studio_tool = FK(CustomTool, on_delete=CASCADE)
+
+    # Required Adapters
+    vector_store = FK(AdapterInstance, blank=False, null=False)
+    embedding_model = FK(AdapterInstance, blank=False, null=False)
+    llm = FK(AdapterInstance, blank=False, null=False)
+    x2text = FK(AdapterInstance, blank=False, null=False)
+
+    # Configuration
+    chunk_size = IntegerField(null=True, blank=True)
+    chunk_overlap = IntegerField(null=True, blank=True)
+    retrieval_strategy = TextField(choices=...)
+    similarity_top_k = IntegerField(blank=True, null=True)
+
+    # Flags
+    is_default = BooleanField(default=False)
+    reindex = BooleanField(default=False)
+
+    # Unique constraint
+    class Meta:
+        constraints = [
+            UniqueConstraint(
+                fields=["prompt_studio_tool", "profile_name"],
+                name="unique_prompt_studio_tool_profile_name_index"
+            )
+        ]
+```
+
+### Lookup System Pattern (New)
+
+```python
+class LookupProfileManager(BaseModel):
+    """Profile manager for Lookup projects - mirrors Prompt Studio's ProfileManager."""
+
+    profile_id = models.UUIDField(
+        primary_key=True,
+        default=uuid.uuid4,
+        editable=False
+    )
+
+    profile_name = models.TextField(
+        blank=False,
+        null=False,
+        db_comment="Name of the lookup profile"
+    )
+
+    # FK to Lookup Project (mirrors prompt_studio_tool)
+    lookup_project = models.ForeignKey(
+        LookupProject,
+        on_delete=models.CASCADE,
+        related_name="profiles",
+        db_comment="Lookup project this profile belongs to"
+    )
+
+    # Required Adapters (same as Prompt Studio)
+    vector_store = models.ForeignKey(
+        AdapterInstance,
+        on_delete=models.PROTECT,
+        blank=False,
+        null=False,
+        related_name="lookup_profiles_vector_store",
+        db_comment="Vector DB adapter for indexing reference data"
+    )
+
+    embedding_model = models.ForeignKey(
+        AdapterInstance,
+        on_delete=models.PROTECT,
+        blank=False,
+        null=False,
+        related_name="lookup_profiles_embedding",
+        db_comment="Embedding adapter for generating vectors"
+    )
+
+    llm = models.ForeignKey(
+        AdapterInstance,
+        on_delete=models.PROTECT,
+        blank=False,
+        null=False,
+        related_name="lookup_profiles_llm",
+        db_comment="LLM adapter for semantic matching"
+    )
+
+    x2text = models.ForeignKey(
+        AdapterInstance,
+        on_delete=models.PROTECT,
+        blank=False,
+        null=False,
+        related_name="lookup_profiles_x2text",
+        db_comment="Text extraction adapter for reference data"
+    )
+
+    # Vector DB Configuration
+    chunk_size = models.IntegerField(
+        null=True,
+        blank=True,
+        default=1000,
+        db_comment="Text chunk size for vector indexing"
+    )
+
+    chunk_overlap = models.IntegerField(
+        null=True,
+        blank=True,
+        default=200,
+        db_comment="Overlap between chunks"
+    )
+
+    similarity_top_k = models.IntegerField(
+        null=True,
+        blank=True,
+        default=5,
+        db_comment="Number of top similar results to retrieve"
+    )
+
+    # Flags
+    is_default = models.BooleanField(
+        default=False,
+        db_comment="Default profile for this lookup project"
+    )
+
+    reindex = models.BooleanField(
+        default=False,
+        db_comment="Flag to trigger reindexing of reference data"
+    )
+
+    # Audit fields
+    created_by = models.ForeignKey(
+        User,
+        on_delete=models.SET_NULL,
+        related_name="lookup_profiles_created",
+        null=True,
+        blank=True,
+        editable=False
+    )
+
+    modified_by = models.ForeignKey(
+        User,
+        on_delete=models.SET_NULL,
+        related_name="lookup_profiles_modified",
+        null=True,
+        blank=True,
+        editable=False
+    )
+
+    class Meta:
+        verbose_name = "Lookup Profile Manager"
+        verbose_name_plural = "Lookup Profile Managers"
+        db_table = "lookup_profile_manager"
+        constraints = [
+            models.UniqueConstraint(
+                fields=["lookup_project", "profile_name"],
+                name="unique_lookup_project_profile_name_index"
+            )
+        ]
+
+    @staticmethod
+    def get_default_profile(project: LookupProject) -> "LookupProfileManager":
+        """Get default profile for a lookup project."""
+        try:
+            return LookupProfileManager.objects.get(
+                lookup_project=project,
+                is_default=True
+            )
+        except LookupProfileManager.DoesNotExist:
+            raise DefaultProfileError("No default profile found for lookup project")
+```
+
+---
+
+## Lookup Index Manager
+
+The IndexManager tracks which reference data versions have been indexed in Vector DB:
+
+```python
+class LookupIndexManager(BaseModel):
+    """Tracks indexed reference data in Vector DB - mirrors Prompt Studio's IndexManager."""
+
+    index_id = models.UUIDField(
+        primary_key=True,
+        default=uuid.uuid4,
+        editable=False
+    )
+
+    # FK to Data Source
+    data_source = models.ForeignKey(
+        LookupDataSource,
+        on_delete=models.CASCADE,
+        related_name="index_managers",
+        db_comment="Reference data source that was indexed"
+    )
+
+    # FK to Profile (determines which adapters were used)
+    profile = models.ForeignKey(
+        LookupProfileManager,
+        on_delete=models.CASCADE,
+        related_name="index_managers",
+        db_comment="Profile used for indexing (contains adapter config)"
+    )
+
+    # Vector DB index IDs
+    vector_db_index_id = models.CharField(
+        max_length=255,
+        blank=False,
+        null=False,
+        db_comment="Index ID in the vector database"
+    )
+
+    # Track indexing history
+    index_ids_history = models.JSONField(
+        default=list,
+        db_comment="Historical index IDs for cleanup"
+    )
+
+    # Indexing status
+    indexing_status = models.CharField(
+        max_length=50,
+        choices=[
+            ('pending', 'Pending'),
+            ('processing', 'Processing'),
+            ('completed', 'Completed'),
+            ('failed', 'Failed')
+        ],
+        default='pending',
+        db_comment="Status of indexing operation"
+    )
+
+    # Metadata
+    chunk_count = models.IntegerField(
+        null=True,
+        blank=True,
+        db_comment="Number of chunks created during indexing"
+    )
+
+    indexed_at = models.DateTimeField(
+        auto_now_add=True,
+        db_comment="Timestamp when indexing completed"
+    )
+
+    class Meta:
+        verbose_name = "Lookup Index Manager"
+        verbose_name_plural = "Lookup Index Managers"
+        db_table = "lookup_index_manager"
+        constraints = [
+            models.UniqueConstraint(
+                fields=["data_source", "profile"],
+                name="unique_data_source_profile_index"
+            )
+        ]
+```
+
+---
+
+## System Workflow
+
+### 1. Profile Creation Workflow
+
+```
+User Action: Create New Profile
+    ↓
+Frontend: Profile Creation Modal
+    - Profile Name: "High Accuracy Profile"
+    - X2Text Adapter: [Dropdown] → Select LLMWhisperer V2
+    - Embedding Adapter: [Dropdown] → Select OpenAI Ada-002
+    - Vector DB Adapter: [Dropdown] → Select Qdrant
+    - LLM Adapter: [Dropdown] → Select GPT-4
+    - Chunk Size: 1000
+    - Similarity Top K: 5
+    - [x] Set as Default
+    ↓
+API: POST /api/v1/unstract/{org_id}/lookup/profile-manager/
+    {
+        "profile_name": "High Accuracy Profile",
+        "lookup_project": "project-uuid",
+        "x2text": "adapter-instance-uuid-1",
+        "embedding_model": "adapter-instance-uuid-2",
+        "vector_store": "adapter-instance-uuid-3",
+        "llm": "adapter-instance-uuid-4",
+        "chunk_size": 1000,
+        "chunk_overlap": 200,
+        "similarity_top_k": 5,
+        "is_default": true
+    }
+    ↓
+Backend: Create LookupProfileManager instance
+    ↓
+Response: Profile created successfully
+```
+
+### 2. Reference Data Indexing Workflow
+
+```
+User Action: Upload Reference Data File
+    ↓
+Frontend: Reference Data Tab
+    - Upload vendors.csv
+    ↓
+API: POST /api/v1/unstract/{org_id}/lookup/data-source/
+    - Creates LookupDataSource with extraction_status='pending'
+    ↓
+Backend: Celery Task - Extract and Index
+    ↓
+Step 1: Get Default Profile
+    profile = LookupProfileManager.get_default_profile(project)
+    ↓
+Step 2: Extract Text using Profile's X2Text Adapter
+    x2text = X2Text(
+        tool=util,
+        adapter_instance_id=profile.x2text.id
+    )
+    extracted_text = x2text.process(file_content)
+    ↓
+Step 3: Store Extracted Text in Object Storage
+    storage.upload(
+        path=f"lookup/{project_id}/{filename}.txt",
+        content=extracted_text
+    )
+    ↓
+Step 4: Chunk Text
+    chunks = create_chunks(
+        text=extracted_text,
+        chunk_size=profile.chunk_size,
+        overlap=profile.chunk_overlap
+    )
+    ↓
+Step 5: Generate Embeddings using Profile's Embedding Adapter
+    embedding = Embedding(
+        tool=util,
+        adapter_instance_id=profile.embedding_model.id
+    )
+    vectors = [embedding.embed(chunk) for chunk in chunks]
+    ↓
+Step 6: Store in Vector DB using Profile's Vector DB Adapter
+    vector_db = VectorDB(
+        tool=util,
+        adapter_instance_id=profile.vector_store.id
+    )
+    index_id = vector_db.index(
+        documents=chunks,
+        embeddings=vectors,
+        metadata={...}
+    )
+    ↓
+Step 7: Create Index Manager Entry
+    LookupIndexManager.objects.create(
+        data_source=data_source,
+        profile=profile,
+        vector_db_index_id=index_id,
+        indexing_status='completed',
+        chunk_count=len(chunks)
+    )
+    ↓
+Step 8: Update Data Source Status
+    data_source.extraction_status = 'completed'
+    data_source.save()
+```
+
+### 3. Lookup Execution Workflow
+
+```
+Prompt Studio Project Executes with Lookup
+    ↓
+Input Variable: {{vendor_name}} = "Micro soft"  # Typo intentional
+    ↓
+Backend: Lookup Execution Service
+    ↓
+Step 1: Get Linked Lookup Project
+    lookup_project = get_linked_lookup_project(ps_project)
+    ↓
+Step 2: Get Default Profile
+    profile = LookupProfileManager.get_default_profile(lookup_project)
+    ↓
+Step 3: Generate Query Embedding using Profile's Embedding Adapter
+    embedding = Embedding(
+        tool=util,
+        adapter_instance_id=profile.embedding_model.id
+    )
+    query_vector = embedding.embed("Micro soft")
+    ↓
+Step 4: Search Vector DB using Profile's Vector DB Adapter
+    vector_db = VectorDB(
+        tool=util,
+        adapter_instance_id=profile.vector_store.id
+    )
+    results = vector_db.search(
+        query=query_vector,
+        top_k=profile.similarity_top_k,
+        filters={...}
+    )
+    ↓
+Step 5: Format Results
+    matches = [
+        {
+            "text": "Microsoft",
+            "score": 0.92,
+            "metadata": {...}
+        },
+        {
+            "text": "Micro Software Inc",
+            "score": 0.78,
+            "metadata": {...}
+        }
+    ]
+    ↓
+Step 6: LLM Selection (Optional) using Profile's LLM Adapter
+    llm = LLM(
+        tool=util,
+        adapter_instance_id=profile.llm.id
+    )
+    best_match = llm.select_best_match(
+        query="Micro soft",
+        candidates=matches
+    )
+    ↓
+Return: "Microsoft" (standardized form)
+```
+
+---
+
+## API Endpoints
+
+### Profile Management
+
+```
+# List profiles for a project
+GET /api/v1/unstract/{org_id}/lookup/profile-manager/?lookup_project={project_id}
+
+# Create new profile
+POST /api/v1/unstract/{org_id}/lookup/profile-manager/
+{
+    "profile_name": "Profile Name",
+    "lookup_project": "uuid",
+    "x2text": "adapter-instance-uuid",
+    "embedding_model": "adapter-instance-uuid",
+    "vector_store": "adapter-instance-uuid",
+    "llm": "adapter-instance-uuid",
+    "chunk_size": 1000,
+    "chunk_overlap": 200,
+    "similarity_top_k": 5,
+    "is_default": true
+}
+
+# Get profile details
+GET /api/v1/unstract/{org_id}/lookup/profile-manager/{profile_id}/
+
+# Update profile
+PUT /api/v1/unstract/{org_id}/lookup/profile-manager/{profile_id}/
+
+# Delete profile
+DELETE /api/v1/unstract/{org_id}/lookup/profile-manager/{profile_id}/
+
+# Set profile as default
+POST /api/v1/unstract/{org_id}/lookup/profile-manager/{profile_id}/set-default/
+```
+
+### Index Management
+
+```
+# List indexes for a project
+GET /api/v1/unstract/{org_id}/lookup/index-manager/?lookup_project={project_id}
+
+# Get index details
+GET /api/v1/unstract/{org_id}/lookup/index-manager/{index_id}/
+
+# Trigger reindexing
+POST /api/v1/unstract/{org_id}/lookup/index-manager/reindex/
+{
+    "lookup_project": "uuid",
+    "profile": "uuid"  # Optional, uses default if not specified
+}
+```
+
+---
+
+## Frontend UI Structure
+
+### Project Detail Page - Profile Tab
+
+```jsx
+<LookupProjectDetail projectId={projectId}>
+  <Tabs>
+    <Tab label="Reference Data">
+      {/* File uploads */}
+    </Tab>
+
+    <Tab label="Templates">
+      {/* Lookup templates */}
+    </Tab>
+
+    <Tab label="Profiles">  {/* NEW TAB */}
+      <ProfileManagementTab projectId={projectId}>
+
+        {/* Profile List */}
+        <Table>
+          <Row>
+            <Column>Profile Name</Column>
+            <Column>X2Text</Column>
+            <Column>Embedding</Column>
+            <Column>Vector DB</Column>
+            <Column>LLM</Column>
+            <Column>Default</Column>
+            <Column>Actions</Column>
+          </Row>
+          {profiles.map(profile => (
+            <Row key={profile.id}>
+              <Cell>{profile.profile_name}</Cell>
+              <Cell>{profile.x2text.adapter_name}</Cell>
+              <Cell>{profile.embedding_model.adapter_name}</Cell>
+              <Cell>{profile.vector_store.adapter_name}</Cell>
+              <Cell>{profile.llm.adapter_name}</Cell>
+              <Cell>
+                {profile.is_default ?
+                  <Tag color="green">Default</Tag> :
+                  <Button onClick={() => setAsDefault(profile.id)}>
+                    Set as Default
+                  </Button>
+                }
+              </Cell>
+              <Cell>
+                <Button onClick={() => editProfile(profile)}>Edit</Button>
+                <Button onClick={() => deleteProfile(profile.id)}>Delete</Button>
+              </Cell>
+            </Row>
+          ))}
+        </Table>
+
+        {/* Create Profile Button */}
+        <Button onClick={() => setShowCreateModal(true)}>
+          Create New Profile
+        </Button>
+
+      </ProfileManagementTab>
+    </Tab>
+
+    <Tab label="Linked Projects">
+      {/* Prompt Studio project links */}
+    </Tab>
+
+    <Tab label="Execution History">
+      {/* Audit logs */}
+    </Tab>
+
+    <Tab label="Debug">
+      {/* Test execution */}
+    </Tab>
+  </Tabs>
+</LookupProjectDetail>
+```
+
+### Profile Creation/Edit Modal
+
+```jsx
+<Modal
+  title={isEdit ? "Edit Profile" : "Create New Profile"}
+  visible={showModal}
+  onCancel={() => setShowModal(false)}
+  onOk={handleSubmit}
+>
+  <Form>
+    {/* Profile Name */}
+    <FormItem label="Profile Name" required>
+      <Input
+        value={formData.profile_name}
+        onChange={e => setFormData({...formData, profile_name: e.target.value})}
+        placeholder="e.g., High Accuracy Profile"
+      />
+    </FormItem>
+
+    {/* X2Text Adapter Selection */}
+    <FormItem label="Text Extraction Adapter" required>
+      <Select
+        value={formData.x2text}
+        onChange={value => setFormData({...formData, x2text: value})}
+        showSearch
+        filterOption={(input, option) =>
+          option.children.toLowerCase().includes(input.toLowerCase())
+        }
+      >
+        {x2textAdapters.map(adapter => (
+          <Option key={adapter.id} value={adapter.id}>
+            {adapter.adapter_name} ({adapter.adapter_type})
+          </Option>
+        ))}
+      </Select>
+    </FormItem>
+
+    {/* Embedding Adapter Selection */}
+    <FormItem label="Embedding Adapter" required>
+      <Select
+        value={formData.embedding_model}
+        onChange={value => setFormData({...formData, embedding_model: value})}
+        showSearch
+      >
+        {embeddingAdapters.map(adapter => (
+          <Option key={adapter.id} value={adapter.id}>
+            {adapter.adapter_name} ({adapter.adapter_type})
+          </Option>
+        ))}
+      </Select>
+    </FormItem>
+
+    {/* Vector DB Adapter Selection */}
+    <FormItem label="Vector Database Adapter" required>
+      <Select
+        value={formData.vector_store}
+        onChange={value => setFormData({...formData, vector_store: value})}
+        showSearch
+      >
+        {vectorDBAdapters.map(adapter => (
+          <Option key={adapter.id} value={adapter.id}>
+            {adapter.adapter_name} ({adapter.adapter_type})
+          </Option>
+        ))}
+      </Select>
+    </FormItem>
+
+    {/* LLM Adapter Selection */}
+    <FormItem label="LLM Adapter" required>
+      <Select
+        value={formData.llm}
+        onChange={value => setFormData({...formData, llm: value})}
+        showSearch
+      >
+        {llmAdapters.map(adapter => (
+          <Option key={adapter.id} value={adapter.id}>
+            {adapter.adapter_name} ({adapter.model_name})
+          </Option>
+        ))}
+      </Select>
+    </FormItem>
+
+    {/* Configuration Parameters */}
+    <Divider>Vector DB Configuration</Divider>
+
+    <FormItem label="Chunk Size" help="Number of characters per text chunk">
+      <InputNumber
+        value={formData.chunk_size}
+        onChange={value => setFormData({...formData, chunk_size: value})}
+        min={100}
+        max={5000}
+        step={100}
+      />
+    </FormItem>
+
+    <FormItem label="Chunk Overlap" help="Overlap between consecutive chunks">
+      <InputNumber
+        value={formData.chunk_overlap}
+        onChange={value => setFormData({...formData, chunk_overlap: value})}
+        min={0}
+        max={1000}
+        step={50}
+      />
+    </FormItem>
+
+    <FormItem label="Similarity Top K" help="Number of top results to retrieve">
+      <InputNumber
+        value={formData.similarity_top_k}
+        onChange={value => setFormData({...formData, similarity_top_k: value})}
+        min={1}
+        max={20}
+      />
+    </FormItem>
+
+    {/* Default Profile Checkbox */}
+    <FormItem>
+      <Checkbox
+        checked={formData.is_default}
+        onChange={e => setFormData({...formData, is_default: e.target.checked})}
+      >
+        Set as default profile for this project
+      </Checkbox>
+    </FormItem>
+  </Form>
+</Modal>
+```
+
+---
+
+## Key Design Principles
+
+### 1. **Consistency with Prompt Studio**
+- Same model structure (FK to project, unique constraint on name)
+- Same adapter fields (x2text, embedding_model, vector_store, llm)
+- Same naming conventions (ProfileManager, is_default, reindex)
+- Same API patterns (ViewSet, Serializer, permissions)
+
+### 2. **Profile Ownership**
+- Profiles belong to projects (not standalone)
+- Each project can have multiple profiles
+- One profile is marked as default
+- Unique profile names within a project
+
+### 3. **Adapter Flexibility**
+- All 4 adapter types required for completeness
+- Users select from configured adapters via dropdowns
+- No hardcoded adapter choices
+- Adapters protected from deletion if in use (PROTECT)
+
+### 4. **Separation of Concerns**
+- **LookupProfileManager**: Adapter configuration storage
+- **LookupIndexManager**: Indexing state tracking
+- **LookupDataSource**: Reference data file metadata
+- **LookupExecutor**: Runtime execution logic
+
+### 5. **Audit Trail**
+- created_by, modified_by for all changes
+- Index history tracking
+- Timestamped operations
+- Status tracking at every stage
+
+---
+
+## Migration from Old Design
+
+### What Changed
+
+**Old Design (V2)**:
+- ProfileManager as optional
+- Adapters could be null/blank
+- Profile embedded in project creation
+
+**New Design (V3)**:
+- ProfileManager required for all operations
+- All adapters mandatory
+- Profile as separate tab with full CRUD
+- Matches Prompt Studio exactly
+
+### Migration Steps
+
+1. **Create default profiles** for all existing lookup projects
+2. **Link existing data sources** to profiles via IndexManager
+3. **Update UI** to add Profile tab
+4. **Add adapter dropdowns** matching Templates screen pattern
+5. **Test full workflow** with all adapter types
+
+---
+
+## Next Steps
+
+See [lookup_implementation_plan_v3.md](lookup_implementation_plan_v3.md) for detailed implementation phases.
+
+---
+
+**END OF ARCHITECTURE DOCUMENT**

From d8ea98517bd8fb7878c384524b3f84afdefa5a41 Mon Sep 17 00:00:00 2001
From: gayathrivijayakumar <gayathri@zipstack.com>
Date: Thu, 5 Feb 2026 11:02:54 +0530
Subject: [PATCH 21/22] Lookup architecture

---
 docs/LOOKUP_ARCHITECTURE.md       | 650 +++++++++++++++++++++++++
 docs/lookup_architecture_final.md | 773 ------------------------------
 2 files changed, 650 insertions(+), 773 deletions(-)
 create mode 100644 docs/LOOKUP_ARCHITECTURE.md
 delete mode 100644 docs/lookup_architecture_final.md

diff --git a/docs/LOOKUP_ARCHITECTURE.md b/docs/LOOKUP_ARCHITECTURE.md
new file mode 100644
index 0000000000..711f5e61fe
--- /dev/null
+++ b/docs/LOOKUP_ARCHITECTURE.md
@@ -0,0 +1,650 @@
+# Lookup System - Architecture Documentation
+
+## Profile-Based Adapter System (Aligned with Prompt Studio)
+
+**Last Updated**: 2025-02-05
+**Status**: Implemented
+**Based On**: Prompt Studio's ProfileManager pattern
+
+---
+
+## Executive Summary
+
+The Lookup system enables **reference data enrichment** in document extraction workflows. Users upload reference data (CSV, JSON, PDF), which is indexed into a vector database. During prompt execution, extracted values are matched against reference data to provide standardized/enriched values.
+
+### Key Features
+
+1. **LookupProject** - Container for lookup configurations and reference data
+2. **LookupProfileManager** - Adapter configurations (X2Text, Embedding, VectorDB, LLM)
+3. **LookupDataSource** - Reference data file storage with version management
+4. **LookupIndexManager** - Vector DB index tracking with reindex capabilities
+5. **PromptStudioLookupLink** - Links Prompt Studio prompts to Lookup projects
+6. **LookupExecutionAudit** - Comprehensive execution logging
+
+---
+
+## Data Models
+
+### LookupProject
+
+Container for a lookup configuration with LLM settings and organization association.
+
+```python
+class LookupProject(DefaultOrganizationMixin, BaseModel):
+    """Represents a Look-Up project for static data-based enrichment."""
+
+    LOOKUP_TYPE_CHOICES = [("static_data", "Static Data")]
+    LLM_PROVIDER_CHOICES = [
+        ("openai", "OpenAI"),
+        ("anthropic", "Anthropic"),
+        ("azure", "Azure OpenAI"),
+        ("custom", "Custom Provider"),
+    ]
+
+    id = UUIDField(primary_key=True)
+    name = CharField(max_length=255)
+    description = TextField(blank=True, null=True)
+    lookup_type = CharField(choices=LOOKUP_TYPE_CHOICES, default="static_data")
+
+    # Template and status
+    template = ForeignKey("LookupPromptTemplate", SET_NULL, null=True)
+    is_active = BooleanField(default=True)
+    metadata = JSONField(default=dict)
+
+    # LLM Configuration
+    llm_provider = CharField(choices=LLM_PROVIDER_CHOICES, null=True)
+    llm_model = CharField(max_length=100, null=True)
+    llm_config = JSONField(default=dict)
+
+    # Ownership
+    created_by = ForeignKey(User, RESTRICT)
+
+    class Meta:
+        db_table = "lookup_projects"
+
+    @property
+    def is_ready(self) -> bool:
+        """Check if project has completed reference data."""
+        ...
+```
+
+### LookupProfileManager
+
+Profile manager for adapter configurations - mirrors Prompt Studio's ProfileManager.
+
+```python
+class LookupProfileManager(BaseModel):
+    """Model to store adapter configuration profiles for Look-Up projects."""
+
+    profile_id = UUIDField(primary_key=True)
+    profile_name = TextField(blank=False, null=False)
+
+    # Foreign key to LookupProject
+    lookup_project = ForeignKey("LookupProject", CASCADE, related_name="profiles")
+
+    # Required Adapters - All must be configured
+    vector_store = ForeignKey(AdapterInstance, PROTECT, related_name="lookup_profiles_vector_store")
+    embedding_model = ForeignKey(AdapterInstance, PROTECT, related_name="lookup_profiles_embedding_model")
+    llm = ForeignKey(AdapterInstance, PROTECT, related_name="lookup_profiles_llm")
+    x2text = ForeignKey(AdapterInstance, PROTECT, related_name="lookup_profiles_x2text")
+
+    # Configuration fields
+    chunk_size = IntegerField(default=1000)
+    chunk_overlap = IntegerField(default=200)
+    similarity_top_k = IntegerField(default=5)
+
+    # Flags
+    is_default = BooleanField(default=False)
+    reindex = BooleanField(default=False)
+
+    # Audit
+    created_by = ForeignKey(User, SET_NULL, null=True)
+    modified_by = ForeignKey(User, SET_NULL, null=True)
+
+    class Meta:
+        db_table = "lookup_profile_manager"
+        constraints = [
+            UniqueConstraint(fields=["lookup_project", "profile_name"])
+        ]
+
+    @staticmethod
+    def get_default_profile(project) -> "LookupProfileManager":
+        """Get default profile for a Look-Up project."""
+        ...
+```
+
+### LookupDataSource
+
+Reference data file storage with automatic version management.
+
+```python
+class LookupDataSource(BaseModel):
+    """Represents a reference data source with version management."""
+
+    EXTRACTION_STATUS_CHOICES = [
+        ("pending", "Pending"),
+        ("processing", "Processing"),
+        ("completed", "Completed"),
+        ("failed", "Failed"),
+    ]
+    FILE_TYPE_CHOICES = [
+        ("pdf", "PDF"), ("xlsx", "Excel"), ("csv", "CSV"),
+        ("docx", "Word"), ("txt", "Text"), ("json", "JSON"),
+    ]
+
+    id = UUIDField(primary_key=True)
+    project = ForeignKey("LookupProject", CASCADE, related_name="data_sources")
+
+    # File Information
+    file_name = CharField(max_length=255)
+    file_path = TextField()  # Path in object storage (MinIO)
+    file_size = BigIntegerField()
+    file_type = CharField(choices=FILE_TYPE_CHOICES)
+
+    # Extracted Content
+    extracted_content_path = TextField(blank=True, null=True)
+    extraction_status = CharField(choices=EXTRACTION_STATUS_CHOICES, default="pending")
+    extraction_error = TextField(blank=True, null=True)
+
+    # Version Management (auto-managed via signals)
+    version_number = IntegerField(default=1)
+    is_latest = BooleanField(default=True)
+
+    # Upload Information
+    uploaded_by = ForeignKey(User, RESTRICT)
+
+    class Meta:
+        db_table = "lookup_data_sources"
+        unique_together = [["project", "version_number"]]
+```
+
+**Version Management Signals:**
+- `pre_save`: Auto-increments version number, marks previous versions as not latest
+- `post_delete`: Promotes previous version to latest when current latest is deleted
+
+### LookupIndexManager
+
+Tracks indexed reference data in Vector DB.
+
+```python
+class LookupIndexManager(BaseModel):
+    """Model to store indexing details for Look-Up reference data."""
+
+    index_manager_id = UUIDField(primary_key=True)
+
+    # References
+    data_source = ForeignKey("LookupDataSource", CASCADE, related_name="index_managers")
+    profile_manager = ForeignKey("LookupProfileManager", SET_NULL, null=True, related_name="index_managers")
+
+    # Vector DB index ID
+    raw_index_id = CharField(max_length=255, null=True)
+    index_ids_history = JSONField(default=list)  # For cleanup on deletion
+
+    # Status tracking
+    extraction_status = JSONField(default=dict)  # Per X2Text config
+    status = JSONField(default=dict)  # Legacy: {extracted, indexed, error}
+    reindex_required = BooleanField(default=False)
+
+    # Audit
+    created_by = ForeignKey(User, SET_NULL, null=True)
+    modified_by = ForeignKey(User, SET_NULL, null=True)
+
+    class Meta:
+        db_table = "lookup_index_manager"
+        constraints = [
+            UniqueConstraint(fields=["data_source", "profile_manager"])
+        ]
+```
+
+**Cleanup Signal:**
+- `pre_delete`: Cleans up vector DB entries when index manager is deleted
+
+### PromptStudioLookupLink
+
+Many-to-many relationship between Prompt Studio projects and Look-Up projects.
+
+```python
+class PromptStudioLookupLink(Model):
+    """Links Prompt Studio projects with Look-Up projects."""
+
+    id = UUIDField(primary_key=True)
+    prompt_studio_project_id = UUIDField()  # PS project reference
+    lookup_project = ForeignKey("LookupProject", CASCADE, related_name="ps_links")
+    execution_order = PositiveIntegerField(default=0)
+    created_at = DateTimeField(auto_now_add=True)
+
+    class Meta:
+        db_table = "prompt_studio_lookup_links"
+        unique_together = [["prompt_studio_project_id", "lookup_project"]]
+```
+
+### LookupPromptTemplate
+
+Prompt template with variable detection and validation.
+
+```python
+class LookupPromptTemplate(BaseModel):
+    """Represents a prompt template with {{variable}} placeholders."""
+
+    VARIABLE_PATTERN = r"\{\{([^}]+)\}\}"
+
+    id = UUIDField(primary_key=True)
+    project = OneToOneField("LookupProject", CASCADE, related_name="prompt_template_link")
+
+    name = CharField(max_length=255)
+    template_text = TextField()  # Contains {{variable}} placeholders
+    llm_config = JSONField(default=dict)
+    is_active = BooleanField(default=True)
+    created_by = ForeignKey(User, RESTRICT)
+    variable_mappings = JSONField(default=dict)
+
+    class Meta:
+        db_table = "lookup_prompt_templates"
+
+    def detect_variables(self) -> list[str]:
+        """Extract all {{variable}} references from template."""
+        ...
+
+    def validate_syntax(self) -> bool:
+        """Validate matching braces and no nested placeholders."""
+        ...
+```
+
+### LookupExecutionAudit
+
+Comprehensive audit log for Look-Up executions.
+
+```python
+class LookupExecutionAudit(Model):
+    """Audit log for Look-Up executions."""
+
+    STATUS_CHOICES = [
+        ("success", "Success"),
+        ("partial", "Partial Success"),
+        ("failed", "Failed"),
+    ]
+
+    id = UUIDField(primary_key=True)
+
+    # Execution Context
+    lookup_project = ForeignKey("LookupProject", CASCADE, related_name="execution_audits")
+    prompt_studio_project_id = UUIDField(null=True)
+    execution_id = UUIDField()  # Groups all Look-Ups in a batch
+    file_execution_id = UUIDField(null=True)  # Workflow tracking for API/ETL
+
+    # Input/Output
+    input_data = JSONField()
+    reference_data_version = IntegerField()
+    enriched_output = JSONField(null=True)
+
+    # LLM Details
+    llm_provider = CharField(max_length=50)
+    llm_model = CharField(max_length=100)
+    llm_prompt = TextField()
+    llm_response = TextField(null=True)
+    llm_response_cached = BooleanField(default=False)
+
+    # Performance Metrics
+    execution_time_ms = IntegerField(null=True)
+    llm_call_time_ms = IntegerField(null=True)
+
+    # Status & Errors
+    status = CharField(choices=STATUS_CHOICES)
+    error_message = TextField(null=True)
+    confidence_score = DecimalField(max_digits=3, decimal_places=2, null=True)
+
+    executed_at = DateTimeField(auto_now_add=True)
+
+    class Meta:
+        db_table = "lookup_execution_audit"
+```
+
+---
+
+## Service Layer
+
+### Core Services
+
+| Service | Purpose |
+|---------|---------|
+| `IndexingService` | Document indexing with chunking and vector embeddings |
+| `LookUpExecutor` | Executes lookups using RAG retrieval |
+| `LookUpOrchestrator` | Coordinates lookup workflow orchestration |
+| `LookupRetrievalService` | Vector DB search and retrieval |
+| `VectorDBCleanupService` | Manages vector DB lifecycle and cleanup |
+
+### Supporting Services
+
+| Service | Purpose |
+|---------|---------|
+| `AuditLogger` | Execution logging and audit trail |
+| `LLMResponseCache` | Caches LLM responses for performance |
+| `ReferenceDataLoader` | Loads and parses reference data files |
+| `VariableResolver` | Resolves template variables with actual values |
+| `EnrichmentMerger` | Merges lookup results into extraction output |
+| `LookupIndexHelper` | Helper functions for index operations |
+| `LogEmitter` | Emits logs for execution tracking |
+
+### Integration Services
+
+| Service | Purpose |
+|---------|---------|
+| `LookupDocumentIndexingService` | High-level document indexing orchestration |
+| `LookupIntegrationService` | Integration with external systems |
+| `WorkflowIntegration` | Integration with workflow execution |
+
+---
+
+## API Endpoints
+
+Base URL: `/api/v2/unstract/{org_id}/lookup/`
+
+### Project Management
+
+```
+GET    /lookup-projects/                 # List all projects
+POST   /lookup-projects/                 # Create new project
+GET    /lookup-projects/{id}/            # Get project details
+PUT    /lookup-projects/{id}/            # Update project
+DELETE /lookup-projects/{id}/            # Delete project
+```
+
+### Profile Management
+
+```
+GET    /lookup-profiles/                 # List profiles
+POST   /lookup-profiles/                 # Create profile
+GET    /lookup-profiles/{id}/            # Get profile details
+PUT    /lookup-profiles/{id}/            # Update profile
+DELETE /lookup-profiles/{id}/            # Delete profile
+POST   /lookup-profiles/{id}/set-default/ # Set as default profile
+```
+
+### Data Source Management
+
+```
+GET    /data-sources/                    # List data sources
+POST   /data-sources/                    # Upload new reference data
+GET    /data-sources/{id}/               # Get data source details
+DELETE /data-sources/{id}/               # Delete data source
+POST   /data-sources/{id}/reindex/       # Trigger reindexing
+```
+
+### Template Management
+
+```
+GET    /lookup-templates/                # List templates
+POST   /lookup-templates/                # Create template
+GET    /lookup-templates/{id}/           # Get template details
+PUT    /lookup-templates/{id}/           # Update template
+DELETE /lookup-templates/{id}/           # Delete template
+```
+
+### Linking & Execution
+
+```
+GET    /lookup-links/                    # List PS project links
+POST   /lookup-links/                    # Create link
+DELETE /lookup-links/{id}/               # Remove link
+
+GET    /execution-audits/                # List execution history
+GET    /execution-audits/{id}/           # Get execution details
+
+POST   /lookup-debug/test/               # Test lookup execution
+```
+
+---
+
+## Frontend Components
+
+### Page Structure
+
+```
+/lookups                          → LookUpProjectList
+/lookups/:projectId               → LookUpProjectDetail
+    ├── Reference Data Tab        → ReferenceDataTab
+    ├── Templates Tab             → TemplateTab
+    ├── Profiles Tab              → ProfileManagementTab
+    │   └── Profile Modal         → ProfileFormModal
+    ├── Linked Projects Tab       → LinkedProjectsTab
+    ├── Execution History Tab     → ExecutionHistoryTab
+    └── Debug Tab                 → DebugTab
+```
+
+### Component Descriptions
+
+| Component | Purpose |
+|-----------|---------|
+| `LookUpProjectList` | Lists all lookup projects with create/delete actions |
+| `LookUpProjectDetail` | Project detail view with tabbed navigation |
+| `CreateProjectModal` | Modal for creating new lookup projects |
+| `ReferenceDataTab` | Upload and manage reference data files |
+| `TemplateTab` | Configure prompt templates with variables |
+| `ProfileManagementTab` | Manage adapter profiles |
+| `ProfileFormModal` | Create/edit profiles with adapter dropdowns |
+| `LinkedProjectsTab` | Link/unlink Prompt Studio projects |
+| `ExecutionHistoryTab` | View execution audit logs |
+| `DebugTab` | Test lookup execution manually |
+
+---
+
+## System Workflows
+
+### 1. Reference Data Indexing Workflow
+
+```
+User uploads reference file (CSV/JSON/PDF)
+    ↓
+Create LookupDataSource (version auto-incremented)
+    ↓
+Get default LookupProfileManager for project
+    ↓
+Extract text using profile.x2text adapter
+    ↓
+Store extracted text in MinIO
+    ↓
+Chunk text (profile.chunk_size, profile.chunk_overlap)
+    ↓
+Generate embeddings using profile.embedding_model
+    ↓
+Store vectors in VectorDB using profile.vector_store
+    ↓
+Create/update LookupIndexManager entry
+    ↓
+Update data source status to 'completed'
+```
+
+### 2. Lookup Execution Workflow
+
+```
+Prompt Studio executes with lookup variable
+    ↓
+Get linked LookupProject via PromptStudioLookupLink
+    ↓
+Get default profile (LookupProfileManager.get_default_profile)
+    ↓
+Generate query embedding using profile.embedding_model
+    ↓
+Search VectorDB using profile.vector_store
+    (returns top_k similar results based on profile.similarity_top_k)
+    ↓
+Optional: Use profile.llm for best match selection
+    ↓
+Create LookupExecutionAudit record
+    ↓
+Return standardized value to Prompt Studio
+```
+
+### 3. Profile Change & Reindexing Workflow
+
+```
+User updates profile settings (chunk_size, adapters, etc.)
+    ↓
+Set reindex_required=True on associated LookupIndexManager entries
+    ↓
+User triggers reindex (or automatic reindex on next execution)
+    ↓
+Delete old vector DB indexes (using index_ids_history)
+    ↓
+Re-run indexing workflow with new profile settings
+    ↓
+Update LookupIndexManager with new index IDs
+    ↓
+Set reindex_required=False
+```
+
+### 4. Cleanup Workflows
+
+**On LookupDataSource deletion:**
+```
+Cascade delete LookupIndexManager entries
+    ↓
+pre_delete signal on LookupIndexManager
+    ↓
+VectorDBCleanupService.cleanup_index_ids()
+    ↓
+Remove vectors from VectorDB
+```
+
+**On LookupProfileManager deletion:**
+```
+pre_delete signal on LookupProfileManager
+    ↓
+For each associated LookupIndexManager:
+    ↓
+VectorDBCleanupService.cleanup_index_ids()
+    ↓
+Remove all vectors indexed with this profile
+```
+
+---
+
+## Integration with Prompt Studio
+
+### Prompt-Level Lookup Configuration
+
+The `ToolStudioPrompt` model has been extended with a `lookup_project` field:
+
+```python
+class ToolStudioPrompt(BaseModel):
+    # ... existing fields ...
+
+    lookup_project = ForeignKey(
+        "lookup.LookupProject",
+        on_delete=SET_NULL,
+        null=True,
+        blank=True,
+        related_name="linked_prompts",
+    )
+```
+
+### Frontend Integration
+
+- **Lookup Replacement Indicator**: Visual indicator on prompts with lookup configured
+- **Prompt Card Header**: Shows lookup project linkage
+- **Output Display**: Shows lookup-enriched values in combined output
+
+---
+
+## Database Tables
+
+| Table | Description |
+|-------|-------------|
+| `lookup_projects` | Lookup project configurations |
+| `lookup_data_sources` | Reference data file metadata |
+| `lookup_profile_manager` | Adapter profile configurations |
+| `lookup_index_manager` | Vector DB index tracking |
+| `lookup_prompt_templates` | Prompt templates with variables |
+| `prompt_studio_lookup_links` | PS-to-Lookup project links |
+| `lookup_execution_audit` | Execution history and metrics |
+
+---
+
+## Key Design Principles
+
+### 1. Consistency with Prompt Studio
+- Same model structure (FK to project, unique constraint on name)
+- Same adapter fields (x2text, embedding_model, vector_store, llm)
+- Same naming conventions (ProfileManager, is_default, reindex)
+- Same API patterns (ViewSet, Serializer, permissions)
+
+### 2. Profile Ownership
+- Profiles belong to projects (not standalone)
+- Each project can have multiple profiles
+- One profile must be marked as default
+- Unique profile names within a project
+
+### 3. Adapter Protection
+- All 4 adapter types required for completeness
+- Adapters protected from deletion if in use (PROTECT)
+- Users select from configured adapters via dropdowns
+
+### 4. Separation of Concerns
+- **LookupProfileManager**: Adapter configuration storage
+- **LookupIndexManager**: Indexing state tracking
+- **LookupDataSource**: Reference data file metadata
+- **LookUpExecutor**: Runtime execution logic
+
+### 5. Automatic Cleanup
+- Vector DB cleanup on index/profile deletion via signals
+- Index history tracking for complete cleanup
+- Version promotion on data source deletion
+
+### 6. Comprehensive Auditing
+- LookupExecutionAudit captures all execution details
+- file_execution_id for workflow tracking in API/ETL
+- LLM prompts, responses, and performance metrics logged
+
+---
+
+## Environment Configuration
+
+The lookup system uses existing adapter configurations. No new environment variables required.
+
+**Used Configuration:**
+- MinIO/S3 for file storage (via existing filesystem configuration)
+- Redis for caching (via existing Redis configuration)
+- Existing adapter instances for X2Text, Embedding, VectorDB, LLM
+
+---
+
+## Testing
+
+### Unit Tests Location
+
+```
+backend/lookup/tests/
+├── test_api/
+│   ├── test_execution_api.py
+│   ├── test_linking_api.py
+│   ├── test_profile_manager_api.py
+│   ├── test_project_api.py
+│   └── test_template_api.py
+├── test_integrations/
+│   ├── test_llm_integration.py
+│   ├── test_llmwhisperer_integration.py
+│   ├── test_redis_cache_integration.py
+│   └── test_storage_integration.py
+├── test_services/
+│   ├── test_audit_logger.py
+│   ├── test_enrichment_merger.py
+│   ├── test_llm_cache.py
+│   ├── test_lookup_executor.py
+│   ├── test_lookup_orchestrator.py
+│   └── test_reference_data_loader.py
+├── test_migrations.py
+└── test_variable_resolver.py
+```
+
+### Test Coverage Areas
+- Model CRUD operations
+- API endpoint functionality
+- Service layer logic
+- Integration with adapters
+- Vector DB cleanup signals
+- Version management
+- Cache operations
+
+---
+
+**END OF ARCHITECTURE DOCUMENT**
diff --git a/docs/lookup_architecture_final.md b/docs/lookup_architecture_final.md
deleted file mode 100644
index 37e64da495..0000000000
--- a/docs/lookup_architecture_final.md
+++ /dev/null
@@ -1,773 +0,0 @@
-# Lookup System - Final Architecture
-## Profile-Based Adapter System (Aligned with Prompt Studio)
-
-**Date**: 2025-12-26
-**Status**: Current Architecture Specification
-**Based On**: Prompt Studio's ProfileManager pattern
-
----
-
-## Executive Summary
-
-The Lookup system uses a **profile-based architecture** identical to Prompt Studio's approach:
-
-1. **LookupProfileManager** - Separate entity storing adapter configurations
-2. **Profile Linking** - Each LookupProject links to multiple profiles (one default)
-3. **Adapter Selection** - Users choose adapters via dropdowns (like Templates screen)
-4. **Profile Screen** - Separate UI for managing profiles per project
-5. **Unified Pattern** - Same adapter system (X2Text, Embedding, VectorDB, LLM)
-
----
-
-## Architecture Alignment with Prompt Studio
-
-### Prompt Studio Pattern (Reference)
-
-```python
-class ProfileManager(BaseModel):
-    profile_id = UUIDField(primary_key=True)
-    profile_name = TextField(blank=False)
-
-    # FK to Project/Tool
-    prompt_studio_tool = FK(CustomTool, on_delete=CASCADE)
-
-    # Required Adapters
-    vector_store = FK(AdapterInstance, blank=False, null=False)
-    embedding_model = FK(AdapterInstance, blank=False, null=False)
-    llm = FK(AdapterInstance, blank=False, null=False)
-    x2text = FK(AdapterInstance, blank=False, null=False)
-
-    # Configuration
-    chunk_size = IntegerField(null=True, blank=True)
-    chunk_overlap = IntegerField(null=True, blank=True)
-    retrieval_strategy = TextField(choices=...)
-    similarity_top_k = IntegerField(blank=True, null=True)
-
-    # Flags
-    is_default = BooleanField(default=False)
-    reindex = BooleanField(default=False)
-
-    # Unique constraint
-    class Meta:
-        constraints = [
-            UniqueConstraint(
-                fields=["prompt_studio_tool", "profile_name"],
-                name="unique_prompt_studio_tool_profile_name_index"
-            )
-        ]
-```
-
-### Lookup System Pattern (New)
-
-```python
-class LookupProfileManager(BaseModel):
-    """Profile manager for Lookup projects - mirrors Prompt Studio's ProfileManager."""
-
-    profile_id = models.UUIDField(
-        primary_key=True,
-        default=uuid.uuid4,
-        editable=False
-    )
-
-    profile_name = models.TextField(
-        blank=False,
-        null=False,
-        db_comment="Name of the lookup profile"
-    )
-
-    # FK to Lookup Project (mirrors prompt_studio_tool)
-    lookup_project = models.ForeignKey(
-        LookupProject,
-        on_delete=models.CASCADE,
-        related_name="profiles",
-        db_comment="Lookup project this profile belongs to"
-    )
-
-    # Required Adapters (same as Prompt Studio)
-    vector_store = models.ForeignKey(
-        AdapterInstance,
-        on_delete=models.PROTECT,
-        blank=False,
-        null=False,
-        related_name="lookup_profiles_vector_store",
-        db_comment="Vector DB adapter for indexing reference data"
-    )
-
-    embedding_model = models.ForeignKey(
-        AdapterInstance,
-        on_delete=models.PROTECT,
-        blank=False,
-        null=False,
-        related_name="lookup_profiles_embedding",
-        db_comment="Embedding adapter for generating vectors"
-    )
-
-    llm = models.ForeignKey(
-        AdapterInstance,
-        on_delete=models.PROTECT,
-        blank=False,
-        null=False,
-        related_name="lookup_profiles_llm",
-        db_comment="LLM adapter for semantic matching"
-    )
-
-    x2text = models.ForeignKey(
-        AdapterInstance,
-        on_delete=models.PROTECT,
-        blank=False,
-        null=False,
-        related_name="lookup_profiles_x2text",
-        db_comment="Text extraction adapter for reference data"
-    )
-
-    # Vector DB Configuration
-    chunk_size = models.IntegerField(
-        null=True,
-        blank=True,
-        default=1000,
-        db_comment="Text chunk size for vector indexing"
-    )
-
-    chunk_overlap = models.IntegerField(
-        null=True,
-        blank=True,
-        default=200,
-        db_comment="Overlap between chunks"
-    )
-
-    similarity_top_k = models.IntegerField(
-        null=True,
-        blank=True,
-        default=5,
-        db_comment="Number of top similar results to retrieve"
-    )
-
-    # Flags
-    is_default = models.BooleanField(
-        default=False,
-        db_comment="Default profile for this lookup project"
-    )
-
-    reindex = models.BooleanField(
-        default=False,
-        db_comment="Flag to trigger reindexing of reference data"
-    )
-
-    # Audit fields
-    created_by = models.ForeignKey(
-        User,
-        on_delete=models.SET_NULL,
-        related_name="lookup_profiles_created",
-        null=True,
-        blank=True,
-        editable=False
-    )
-
-    modified_by = models.ForeignKey(
-        User,
-        on_delete=models.SET_NULL,
-        related_name="lookup_profiles_modified",
-        null=True,
-        blank=True,
-        editable=False
-    )
-
-    class Meta:
-        verbose_name = "Lookup Profile Manager"
-        verbose_name_plural = "Lookup Profile Managers"
-        db_table = "lookup_profile_manager"
-        constraints = [
-            models.UniqueConstraint(
-                fields=["lookup_project", "profile_name"],
-                name="unique_lookup_project_profile_name_index"
-            )
-        ]
-
-    @staticmethod
-    def get_default_profile(project: LookupProject) -> "LookupProfileManager":
-        """Get default profile for a lookup project."""
-        try:
-            return LookupProfileManager.objects.get(
-                lookup_project=project,
-                is_default=True
-            )
-        except LookupProfileManager.DoesNotExist:
-            raise DefaultProfileError("No default profile found for lookup project")
-```
-
----
-
-## Lookup Index Manager
-
-The IndexManager tracks which reference data versions have been indexed in Vector DB:
-
-```python
-class LookupIndexManager(BaseModel):
-    """Tracks indexed reference data in Vector DB - mirrors Prompt Studio's IndexManager."""
-
-    index_id = models.UUIDField(
-        primary_key=True,
-        default=uuid.uuid4,
-        editable=False
-    )
-
-    # FK to Data Source
-    data_source = models.ForeignKey(
-        LookupDataSource,
-        on_delete=models.CASCADE,
-        related_name="index_managers",
-        db_comment="Reference data source that was indexed"
-    )
-
-    # FK to Profile (determines which adapters were used)
-    profile = models.ForeignKey(
-        LookupProfileManager,
-        on_delete=models.CASCADE,
-        related_name="index_managers",
-        db_comment="Profile used for indexing (contains adapter config)"
-    )
-
-    # Vector DB index IDs
-    vector_db_index_id = models.CharField(
-        max_length=255,
-        blank=False,
-        null=False,
-        db_comment="Index ID in the vector database"
-    )
-
-    # Track indexing history
-    index_ids_history = models.JSONField(
-        default=list,
-        db_comment="Historical index IDs for cleanup"
-    )
-
-    # Indexing status
-    indexing_status = models.CharField(
-        max_length=50,
-        choices=[
-            ('pending', 'Pending'),
-            ('processing', 'Processing'),
-            ('completed', 'Completed'),
-            ('failed', 'Failed')
-        ],
-        default='pending',
-        db_comment="Status of indexing operation"
-    )
-
-    # Metadata
-    chunk_count = models.IntegerField(
-        null=True,
-        blank=True,
-        db_comment="Number of chunks created during indexing"
-    )
-
-    indexed_at = models.DateTimeField(
-        auto_now_add=True,
-        db_comment="Timestamp when indexing completed"
-    )
-
-    class Meta:
-        verbose_name = "Lookup Index Manager"
-        verbose_name_plural = "Lookup Index Managers"
-        db_table = "lookup_index_manager"
-        constraints = [
-            models.UniqueConstraint(
-                fields=["data_source", "profile"],
-                name="unique_data_source_profile_index"
-            )
-        ]
-```
-
----
-
-## System Workflow
-
-### 1. Profile Creation Workflow
-
-```
-User Action: Create New Profile
-    ↓
-Frontend: Profile Creation Modal
-    - Profile Name: "High Accuracy Profile"
-    - X2Text Adapter: [Dropdown] → Select LLMWhisperer V2
-    - Embedding Adapter: [Dropdown] → Select OpenAI Ada-002
-    - Vector DB Adapter: [Dropdown] → Select Qdrant
-    - LLM Adapter: [Dropdown] → Select GPT-4
-    - Chunk Size: 1000
-    - Similarity Top K: 5
-    - [x] Set as Default
-    ↓
-API: POST /api/v1/unstract/{org_id}/lookup/profile-manager/
-    {
-        "profile_name": "High Accuracy Profile",
-        "lookup_project": "project-uuid",
-        "x2text": "adapter-instance-uuid-1",
-        "embedding_model": "adapter-instance-uuid-2",
-        "vector_store": "adapter-instance-uuid-3",
-        "llm": "adapter-instance-uuid-4",
-        "chunk_size": 1000,
-        "chunk_overlap": 200,
-        "similarity_top_k": 5,
-        "is_default": true
-    }
-    ↓
-Backend: Create LookupProfileManager instance
-    ↓
-Response: Profile created successfully
-```
-
-### 2. Reference Data Indexing Workflow
-
-```
-User Action: Upload Reference Data File
-    ↓
-Frontend: Reference Data Tab
-    - Upload vendors.csv
-    ↓
-API: POST /api/v1/unstract/{org_id}/lookup/data-source/
-    - Creates LookupDataSource with extraction_status='pending'
-    ↓
-Backend: Celery Task - Extract and Index
-    ↓
-Step 1: Get Default Profile
-    profile = LookupProfileManager.get_default_profile(project)
-    ↓
-Step 2: Extract Text using Profile's X2Text Adapter
-    x2text = X2Text(
-        tool=util,
-        adapter_instance_id=profile.x2text.id
-    )
-    extracted_text = x2text.process(file_content)
-    ↓
-Step 3: Store Extracted Text in Object Storage
-    storage.upload(
-        path=f"lookup/{project_id}/{filename}.txt",
-        content=extracted_text
-    )
-    ↓
-Step 4: Chunk Text
-    chunks = create_chunks(
-        text=extracted_text,
-        chunk_size=profile.chunk_size,
-        overlap=profile.chunk_overlap
-    )
-    ↓
-Step 5: Generate Embeddings using Profile's Embedding Adapter
-    embedding = Embedding(
-        tool=util,
-        adapter_instance_id=profile.embedding_model.id
-    )
-    vectors = [embedding.embed(chunk) for chunk in chunks]
-    ↓
-Step 6: Store in Vector DB using Profile's Vector DB Adapter
-    vector_db = VectorDB(
-        tool=util,
-        adapter_instance_id=profile.vector_store.id
-    )
-    index_id = vector_db.index(
-        documents=chunks,
-        embeddings=vectors,
-        metadata={...}
-    )
-    ↓
-Step 7: Create Index Manager Entry
-    LookupIndexManager.objects.create(
-        data_source=data_source,
-        profile=profile,
-        vector_db_index_id=index_id,
-        indexing_status='completed',
-        chunk_count=len(chunks)
-    )
-    ↓
-Step 8: Update Data Source Status
-    data_source.extraction_status = 'completed'
-    data_source.save()
-```
-
-### 3. Lookup Execution Workflow
-
-```
-Prompt Studio Project Executes with Lookup
-    ↓
-Input Variable: {{vendor_name}} = "Micro soft"  # Typo intentional
-    ↓
-Backend: Lookup Execution Service
-    ↓
-Step 1: Get Linked Lookup Project
-    lookup_project = get_linked_lookup_project(ps_project)
-    ↓
-Step 2: Get Default Profile
-    profile = LookupProfileManager.get_default_profile(lookup_project)
-    ↓
-Step 3: Generate Query Embedding using Profile's Embedding Adapter
-    embedding = Embedding(
-        tool=util,
-        adapter_instance_id=profile.embedding_model.id
-    )
-    query_vector = embedding.embed("Micro soft")
-    ↓
-Step 4: Search Vector DB using Profile's Vector DB Adapter
-    vector_db = VectorDB(
-        tool=util,
-        adapter_instance_id=profile.vector_store.id
-    )
-    results = vector_db.search(
-        query=query_vector,
-        top_k=profile.similarity_top_k,
-        filters={...}
-    )
-    ↓
-Step 5: Format Results
-    matches = [
-        {
-            "text": "Microsoft",
-            "score": 0.92,
-            "metadata": {...}
-        },
-        {
-            "text": "Micro Software Inc",
-            "score": 0.78,
-            "metadata": {...}
-        }
-    ]
-    ↓
-Step 6: LLM Selection (Optional) using Profile's LLM Adapter
-    llm = LLM(
-        tool=util,
-        adapter_instance_id=profile.llm.id
-    )
-    best_match = llm.select_best_match(
-        query="Micro soft",
-        candidates=matches
-    )
-    ↓
-Return: "Microsoft" (standardized form)
-```
-
----
-
-## API Endpoints
-
-### Profile Management
-
-```
-# List profiles for a project
-GET /api/v1/unstract/{org_id}/lookup/profile-manager/?lookup_project={project_id}
-
-# Create new profile
-POST /api/v1/unstract/{org_id}/lookup/profile-manager/
-{
-    "profile_name": "Profile Name",
-    "lookup_project": "uuid",
-    "x2text": "adapter-instance-uuid",
-    "embedding_model": "adapter-instance-uuid",
-    "vector_store": "adapter-instance-uuid",
-    "llm": "adapter-instance-uuid",
-    "chunk_size": 1000,
-    "chunk_overlap": 200,
-    "similarity_top_k": 5,
-    "is_default": true
-}
-
-# Get profile details
-GET /api/v1/unstract/{org_id}/lookup/profile-manager/{profile_id}/
-
-# Update profile
-PUT /api/v1/unstract/{org_id}/lookup/profile-manager/{profile_id}/
-
-# Delete profile
-DELETE /api/v1/unstract/{org_id}/lookup/profile-manager/{profile_id}/
-
-# Set profile as default
-POST /api/v1/unstract/{org_id}/lookup/profile-manager/{profile_id}/set-default/
-```
-
-### Index Management
-
-```
-# List indexes for a project
-GET /api/v1/unstract/{org_id}/lookup/index-manager/?lookup_project={project_id}
-
-# Get index details
-GET /api/v1/unstract/{org_id}/lookup/index-manager/{index_id}/
-
-# Trigger reindexing
-POST /api/v1/unstract/{org_id}/lookup/index-manager/reindex/
-{
-    "lookup_project": "uuid",
-    "profile": "uuid"  # Optional, uses default if not specified
-}
-```
-
----
-
-## Frontend UI Structure
-
-### Project Detail Page - Profile Tab
-
-```jsx
-<LookupProjectDetail projectId={projectId}>
-  <Tabs>
-    <Tab label="Reference Data">
-      {/* File uploads */}
-    </Tab>
-
-    <Tab label="Templates">
-      {/* Lookup templates */}
-    </Tab>
-
-    <Tab label="Profiles">  {/* NEW TAB */}
-      <ProfileManagementTab projectId={projectId}>
-
-        {/* Profile List */}
-        <Table>
-          <Row>
-            <Column>Profile Name</Column>
-            <Column>X2Text</Column>
-            <Column>Embedding</Column>
-            <Column>Vector DB</Column>
-            <Column>LLM</Column>
-            <Column>Default</Column>
-            <Column>Actions</Column>
-          </Row>
-          {profiles.map(profile => (
-            <Row key={profile.id}>
-              <Cell>{profile.profile_name}</Cell>
-              <Cell>{profile.x2text.adapter_name}</Cell>
-              <Cell>{profile.embedding_model.adapter_name}</Cell>
-              <Cell>{profile.vector_store.adapter_name}</Cell>
-              <Cell>{profile.llm.adapter_name}</Cell>
-              <Cell>
-                {profile.is_default ?
-                  <Tag color="green">Default</Tag> :
-                  <Button onClick={() => setAsDefault(profile.id)}>
-                    Set as Default
-                  </Button>
-                }
-              </Cell>
-              <Cell>
-                <Button onClick={() => editProfile(profile)}>Edit</Button>
-                <Button onClick={() => deleteProfile(profile.id)}>Delete</Button>
-              </Cell>
-            </Row>
-          ))}
-        </Table>
-
-        {/* Create Profile Button */}
-        <Button onClick={() => setShowCreateModal(true)}>
-          Create New Profile
-        </Button>
-
-      </ProfileManagementTab>
-    </Tab>
-
-    <Tab label="Linked Projects">
-      {/* Prompt Studio project links */}
-    </Tab>
-
-    <Tab label="Execution History">
-      {/* Audit logs */}
-    </Tab>
-
-    <Tab label="Debug">
-      {/* Test execution */}
-    </Tab>
-  </Tabs>
-</LookupProjectDetail>
-```
-
-### Profile Creation/Edit Modal
-
-```jsx
-<Modal
-  title={isEdit ? "Edit Profile" : "Create New Profile"}
-  visible={showModal}
-  onCancel={() => setShowModal(false)}
-  onOk={handleSubmit}
->
-  <Form>
-    {/* Profile Name */}
-    <FormItem label="Profile Name" required>
-      <Input
-        value={formData.profile_name}
-        onChange={e => setFormData({...formData, profile_name: e.target.value})}
-        placeholder="e.g., High Accuracy Profile"
-      />
-    </FormItem>
-
-    {/* X2Text Adapter Selection */}
-    <FormItem label="Text Extraction Adapter" required>
-      <Select
-        value={formData.x2text}
-        onChange={value => setFormData({...formData, x2text: value})}
-        showSearch
-        filterOption={(input, option) =>
-          option.children.toLowerCase().includes(input.toLowerCase())
-        }
-      >
-        {x2textAdapters.map(adapter => (
-          <Option key={adapter.id} value={adapter.id}>
-            {adapter.adapter_name} ({adapter.adapter_type})
-          </Option>
-        ))}
-      </Select>
-    </FormItem>
-
-    {/* Embedding Adapter Selection */}
-    <FormItem label="Embedding Adapter" required>
-      <Select
-        value={formData.embedding_model}
-        onChange={value => setFormData({...formData, embedding_model: value})}
-        showSearch
-      >
-        {embeddingAdapters.map(adapter => (
-          <Option key={adapter.id} value={adapter.id}>
-            {adapter.adapter_name} ({adapter.adapter_type})
-          </Option>
-        ))}
-      </Select>
-    </FormItem>
-
-    {/* Vector DB Adapter Selection */}
-    <FormItem label="Vector Database Adapter" required>
-      <Select
-        value={formData.vector_store}
-        onChange={value => setFormData({...formData, vector_store: value})}
-        showSearch
-      >
-        {vectorDBAdapters.map(adapter => (
-          <Option key={adapter.id} value={adapter.id}>
-            {adapter.adapter_name} ({adapter.adapter_type})
-          </Option>
-        ))}
-      </Select>
-    </FormItem>
-
-    {/* LLM Adapter Selection */}
-    <FormItem label="LLM Adapter" required>
-      <Select
-        value={formData.llm}
-        onChange={value => setFormData({...formData, llm: value})}
-        showSearch
-      >
-        {llmAdapters.map(adapter => (
-          <Option key={adapter.id} value={adapter.id}>
-            {adapter.adapter_name} ({adapter.model_name})
-          </Option>
-        ))}
-      </Select>
-    </FormItem>
-
-    {/* Configuration Parameters */}
-    <Divider>Vector DB Configuration</Divider>
-
-    <FormItem label="Chunk Size" help="Number of characters per text chunk">
-      <InputNumber
-        value={formData.chunk_size}
-        onChange={value => setFormData({...formData, chunk_size: value})}
-        min={100}
-        max={5000}
-        step={100}
-      />
-    </FormItem>
-
-    <FormItem label="Chunk Overlap" help="Overlap between consecutive chunks">
-      <InputNumber
-        value={formData.chunk_overlap}
-        onChange={value => setFormData({...formData, chunk_overlap: value})}
-        min={0}
-        max={1000}
-        step={50}
-      />
-    </FormItem>
-
-    <FormItem label="Similarity Top K" help="Number of top results to retrieve">
-      <InputNumber
-        value={formData.similarity_top_k}
-        onChange={value => setFormData({...formData, similarity_top_k: value})}
-        min={1}
-        max={20}
-      />
-    </FormItem>
-
-    {/* Default Profile Checkbox */}
-    <FormItem>
-      <Checkbox
-        checked={formData.is_default}
-        onChange={e => setFormData({...formData, is_default: e.target.checked})}
-      >
-        Set as default profile for this project
-      </Checkbox>
-    </FormItem>
-  </Form>
-</Modal>
-```
-
----
-
-## Key Design Principles
-
-### 1. **Consistency with Prompt Studio**
-- Same model structure (FK to project, unique constraint on name)
-- Same adapter fields (x2text, embedding_model, vector_store, llm)
-- Same naming conventions (ProfileManager, is_default, reindex)
-- Same API patterns (ViewSet, Serializer, permissions)
-
-### 2. **Profile Ownership**
-- Profiles belong to projects (not standalone)
-- Each project can have multiple profiles
-- One profile is marked as default
-- Unique profile names within a project
-
-### 3. **Adapter Flexibility**
-- All 4 adapter types required for completeness
-- Users select from configured adapters via dropdowns
-- No hardcoded adapter choices
-- Adapters protected from deletion if in use (PROTECT)
-
-### 4. **Separation of Concerns**
-- **LookupProfileManager**: Adapter configuration storage
-- **LookupIndexManager**: Indexing state tracking
-- **LookupDataSource**: Reference data file metadata
-- **LookupExecutor**: Runtime execution logic
-
-### 5. **Audit Trail**
-- created_by, modified_by for all changes
-- Index history tracking
-- Timestamped operations
-- Status tracking at every stage
-
----
-
-## Migration from Old Design
-
-### What Changed
-
-**Old Design (V2)**:
-- ProfileManager as optional
-- Adapters could be null/blank
-- Profile embedded in project creation
-
-**New Design (V3)**:
-- ProfileManager required for all operations
-- All adapters mandatory
-- Profile as separate tab with full CRUD
-- Matches Prompt Studio exactly
-
-### Migration Steps
-
-1. **Create default profiles** for all existing lookup projects
-2. **Link existing data sources** to profiles via IndexManager
-3. **Update UI** to add Profile tab
-4. **Add adapter dropdowns** matching Templates screen pattern
-5. **Test full workflow** with all adapter types
-
----
-
-## Next Steps
-
-See [lookup_implementation_plan_v3.md](lookup_implementation_plan_v3.md) for detailed implementation phases.
-
----
-
-**END OF ARCHITECTURE DOCUMENT**

From 7d33a2582293e2bd3f0452dd7e2e0b7608f432ab Mon Sep 17 00:00:00 2001
From: gayathrivijayakumar <gayathri@zipstack.com>
Date: Fri, 6 Feb 2026 11:51:11 +0530
Subject: [PATCH 22/22] Fix build errors

---
 frontend/src/components/logging/log-modal/LogModal.jsx | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/frontend/src/components/logging/log-modal/LogModal.jsx b/frontend/src/components/logging/log-modal/LogModal.jsx
index 7c920ff80b..261685d7ce 100644
--- a/frontend/src/components/logging/log-modal/LogModal.jsx
+++ b/frontend/src/components/logging/log-modal/LogModal.jsx
@@ -1,7 +1,7 @@
-import { Button, Modal, Table, Tooltip } from "antd";
+import { Button, Modal, Table, Tag, Tooltip } from "antd";
 import { useEffect, useState } from "react";
 import PropTypes from "prop-types";
-import { CopyOutlined } from "@ant-design/icons";
+import { CopyOutlined, SearchOutlined } from "@ant-design/icons";
 
 import "./LogModal.css";
 import { useExceptionHandler } from "../../../hooks/useExceptionHandler";