feat: add SGLang support (#8838)

* add sglang support * add tests * normalize base url * cleanup * chore: regenerate autogenerated API files for sglang support
2026-01-20 10:15:13 -08:00
parent 5f58819bbf
commit dfa6ee0c23
10 changed files with 47435 additions and 1 deletions
--- a/letta/server/server.py
+++ b/letta/server/server.py
@@ -72,6 +72,7 @@ from letta.schemas.providers import (
    OpenAIProvider,
    OpenRouterProvider,
    Provider,
+    SGLangProvider,
    TogetherProvider,
    VLLMProvider,
    XAIProvider,
@@ -283,15 +284,37 @@ class SyncServer(object):
            # NOTE: to use the /chat/completions endpoint, you need to specify extra flags on vLLM startup
            # see: https://docs.vllm.ai/en/stable/features/tool_calling.html
            # e.g. "... --enable-auto-tool-choice --tool-call-parser hermes"
+            # Auto-append /v1 to the base URL
+            vllm_url = (
+                model_settings.vllm_api_base
+                if model_settings.vllm_api_base.endswith("/v1")
+                else model_settings.vllm_api_base + "/v1"
+            )
            self._enabled_providers.append(
                VLLMProvider(
                    name="vllm",
-                    base_url=model_settings.vllm_api_base,
+                    base_url=vllm_url,
                    default_prompt_formatter=model_settings.default_prompt_formatter,
                    handle_base=model_settings.vllm_handle_base,
                )
            )

+        if model_settings.sglang_api_base:
+            # Auto-append /v1 to the base URL
+            sglang_url = (
+                model_settings.sglang_api_base
+                if model_settings.sglang_api_base.endswith("/v1")
+                else model_settings.sglang_api_base + "/v1"
+            )
+            self._enabled_providers.append(
+                SGLangProvider(
+                    name="sglang",
+                    base_url=sglang_url,
+                    default_prompt_formatter=model_settings.default_prompt_formatter,
+                    handle_base=model_settings.sglang_handle_base,
+                )
+            )
+
        if model_settings.aws_access_key_id and model_settings.aws_secret_access_key and model_settings.aws_default_region:
            self._enabled_providers.append(
                BedrockProvider(