MedicalGraphRAGSystem/settings.py at main · codewriterYang/MedicalGraphRAGSystem · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
#!/usr/bin/env python3
# coding: utf-8
"""
MedicalGraphRAGSystem 统一配置

所有共享设置（Neo4j、LLM、路径等）的唯一来源。
通过环境变量或 .env 文件配置，模块特有配置保留在各模块的 config.py 中。
"""
from __future__ import annotations

import logging
import os
from pathlib import Path
from typing import Any

_log = logging.getLogger(__name__)

# ---------------------------------------------------------------------------
# 加载 .env（python-dotenv 可选，未安装时跳过）
# ---------------------------------------------------------------------------
try:
    from dotenv import load_dotenv
    load_dotenv(Path(__file__).resolve().parent / ".env")
except ImportError:
    pass

# ---------------------------------------------------------------------------
# 项目路径
# ---------------------------------------------------------------------------
PROJECT_DIR = Path(__file__).resolve().parent
DICT_DIR = PROJECT_DIR / "dict"
DATA_DIR = PROJECT_DIR / "data"

# ---------------------------------------------------------------------------
# Neo4j
# ---------------------------------------------------------------------------
NEO4J_URI: str = os.environ.get("NEO4J_URI", "bolt://127.0.0.1:7687")
NEO4J_USER: str = os.environ.get("NEO4J_USER", "neo4j")
NEO4J_PASSWORD: str = os.environ.get("NEO4J_PASSWORD", "")

# ---------------------------------------------------------------------------
# LLM 配置
# ---------------------------------------------------------------------------
LLM_PROVIDER: str = os.environ.get("LLM_PROVIDER", "ollama")  # ollama | openai | anthropic
LLM_MODEL: str = os.environ.get("LLM_MODEL", "deepseek-ai/DeepSeek-V4-Pro")
LLM_BASE_URL: str = os.environ.get("LLM_BASE_URL", "http://localhost:11434")

try:
    LLM_TEMPERATURE: float = float(os.environ.get("LLM_TEMPERATURE", "0"))
except ValueError:
    LLM_TEMPERATURE: float = 0.0

try:
    LLM_MAX_TOKENS: int = int(os.environ.get("LLM_MAX_TOKENS", "1024"))
except ValueError:
    LLM_MAX_TOKENS: int = 512

# 商业 API 密钥（仅 openai / anthropic 时需要）
OPENAI_API_KEY: str = os.environ.get("OPENAI_API_KEY", "")
OPENAI_BASE_URL: str = os.environ.get("OPENAI_BASE_URL", "")
ANTHROPIC_API_KEY: str = os.environ.get("ANTHROPIC_API_KEY", "")

# ---------------------------------------------------------------------------
# 实体词典路径
# ---------------------------------------------------------------------------
ENTITY_DICTS: dict[str, Path] = {
    "disease":    DICT_DIR / "disease.txt",
    "symptom":    DICT_DIR / "symptom.txt",
    "drug":       DICT_DIR / "drug.txt",
    "check":      DICT_DIR / "check.txt",
    "food":       DICT_DIR / "food.txt",
    "producer":   DICT_DIR / "producer.txt",
    "department": DICT_DIR / "department.txt",
}
DENY_DICT_PATH = DICT_DIR / "deny.txt"

# 模糊匹配阈值（0-100，rapidfuzz ratio 分数）
FUZZY_MATCH_THRESHOLD = int(os.environ.get("FUZZY_MATCH_THRESHOLD", "80"))

# ---------------------------------------------------------------------------
# 通用回答设置
# ---------------------------------------------------------------------------
ANSWER_NUM_LIMIT = 20
DEFAULT_ANSWER = "您好，我是医药智能助理。暂时无法回答您的问题，请尝试换一种方式提问。"


# ---------------------------------------------------------------------------
# LLM 工厂函数
# ---------------------------------------------------------------------------
def create_llm(
    provider: str | None = None,
    model: str | None = None,
    base_url: str | None = None,
    temperature: float | None = None,
    max_tokens: int | None = None,
    **kwargs: Any,
) -> Any | None:
    """
    创建 LangChain BaseChatModel 实例。

    参数优先级: 函数参数 > 环境变量 > 默认值。
    依赖包未安装时返回 None。
    """
    _provider = provider or LLM_PROVIDER
    _model = model or LLM_MODEL
    _base_url = base_url or LLM_BASE_URL
    _temp = temperature if temperature is not None else LLM_TEMPERATURE
    _max_tokens = max_tokens or LLM_MAX_TOKENS

    if _provider == "ollama":
        try:
            from langchain_ollama import ChatOllama
            return ChatOllama(
                model=_model,
                base_url=_base_url,
                temperature=_temp,
                num_predict=_max_tokens,
                **kwargs,
            )
        except ImportError:
            _log.warning("langchain-ollama 未安装，无法创建 Ollama LLM 实例")
            return None

    elif _provider == "openai":
        try:
            from langchain_openai import ChatOpenAI
            api_key = kwargs.pop("api_key", None) or OPENAI_API_KEY
            oai_base = kwargs.pop("openai_base_url", None) or OPENAI_BASE_URL or None
            return ChatOpenAI(
                model=_model,
                api_key=api_key,
                base_url=oai_base,
                temperature=_temp,
                max_tokens=_max_tokens,
                **kwargs,
            )
        except ImportError:
            _log.warning("langchain-openai 未安装，无法创建 OpenAI 兼容 LLM 实例")
            return None

    elif _provider == "anthropic":
        try:
            from langchain_anthropic import ChatAnthropic
            api_key = kwargs.pop("api_key", None) or ANTHROPIC_API_KEY
            return ChatAnthropic(
                model=_model,
                api_key=api_key,
                temperature=_temp,
                max_tokens=_max_tokens,
                **kwargs,
            )
        except ImportError:
            _log.warning("langchain-anthropic 未安装，无法创建 Anthropic LLM 实例")
            return None

    else:
        raise ValueError(f"不支持的 LLM 提供商: {_provider}。可选: ollama, openai, anthropic")