OpenPipe · bradhilton · Jan 23, 2026 · Jan 21, 2026
diff --git a/src/art/dev/openai_server.py b/src/art/dev/openai_server.py
@@ -18,26 +18,27 @@ def get_openai_server_config(
         config = OpenAIServerConfig()
     log_file = config.get("log_file", log_file)
 
-    # Extract step from lora_path for multi-checkpoint support
-    # lora_path format is: {output_dir}/checkpoints/{step:04d}
-    lora_name = model_name
+    # Build LoRA modules list for multi-checkpoint support
+    # Register under both model_name (for "current" model) and model_name@step (for specific checkpoint)
+    lora_modules: list[str] | None = None
     if lora_path:
         step = int(os.path.basename(lora_path))
-        lora_name = f"{model_name}@{step}"
+        lora_modules = [
+            f'{{"name": "{model_name}", "path": "{lora_path}"}}',
+            f'{{"name": "{model_name}@{step}", "path": "{lora_path}"}}',
+        ]
 
     server_args = ServerArgs(
         api_key="default",
-        lora_modules=(
-            [f'{{"name": "{lora_name}", "path": "{lora_path}"}}'] if lora_path else None
-        ),
+        lora_modules=lora_modules,
         return_tokens_as_token_ids=True,
         enable_auto_tool_choice=True,
         tool_call_parser="hermes",
     )
     server_args.update(config.get("server_args", {}))
     engine_args = EngineArgs(
         model=base_model,
-        served_model_name=base_model if lora_path else model_name,
+        served_model_name=model_name,
         generation_config="vllm",
     )
     engine_args.update(config.get("engine_args", {}))