letta-server/tests/model_settings at 7cc1cd3dc07e855d4c64139c6601dcc39de1e36f - letta-server - WIUF Gitea: Waiting is - Until Fullness

Fimeg/letta-server

Files

History

Kian Jones 7cc1cd3dc0 feat(ci): self-hosted provider test for lmstudio (#9404 )

* add gpu runners and prod memory_repos

* add lmstudio and vllm in model_settings

* fix llm_configs and change variable name in reusable workflow and change perms for memory_repos to admin in tf

* fix: update self-hosted provider tests to use SDK 1.0 and v2 tests

- Update letta-client from ==0.1.324 to >=1.0.0
- Switch ollama/vllm/lmstudio tests to integration_test_send_message_v2.py

🤖 Generated with [Letta Code](https://letta.com)

Co-Authored-By: Letta <noreply@letta.com>

* fix: use openai provider_type for self-hosted model settings

ollama/vllm/lmstudio are not valid provider_type values in the SDK
model_settings schema - they use openai-compatible APIs so provider_type
should be openai. The provider routing is determined by the handle prefix.

🤖 Generated with [Letta Code](https://letta.com)

Co-Authored-By: Letta <noreply@letta.com>

* fix: enable redis for ollama/vllm/lmstudio tests

Background streaming tests require Redis. Add use-redis: true to
self-hosted provider test workflows.

🤖 Generated with [Letta Code](https://letta.com)

Co-Authored-By: Letta <noreply@letta.com>

* prep for lmstudio and vllm

* used lmstudio_openai client

* change tool call parser from hermes to qwen3_xml

* qwen3_xmlk -> qwen3_coder

* revert to hermes (incompatible with parallel tool calls?) and skipping vllm tests on parallel tool calls

* install uv redis extra

* remove lmstudio

* create lmstudio test

* qwen3-14b on lmstudio

* try with qwen3-4b

* actually update the model config json to use qwen3-4b

* add test_providers::test_lmstudio

* bump timeout from 60 to 120 for slow lmstudio on cpu model

* misc vllm changes

---------

Co-authored-by: Letta <noreply@letta.com>

2026-02-24 10:52:07 -08:00

..

azure-gpt-4o-mini.json

feat: set default temperature to 1.0 [LET-6920] (#8618 )

2026-01-19 15:54:43 -08:00

bedrock-claude-4-5-opus.json

feat: enable bedrock for anthropic models (#8847 )

2026-01-19 15:54:44 -08:00

bedrock-claude-4-sonnet.json

feat: set default temperature to 1.0 [LET-6920] (#8618 )

2026-01-19 15:54:43 -08:00

claude-3-5-sonnet.json

feat: cutover repo to 1.0 sdk client LET-6256 (#6361 )

2025-11-24 19:11:18 -08:00

claude-3-7-sonnet-extended.json

feat: cutover repo to 1.0 sdk client LET-6256 (#6361 )

2025-11-24 19:11:18 -08:00

claude-3-7-sonnet.json

feat: cutover repo to 1.0 sdk client LET-6256 (#6361 )

2025-11-24 19:11:18 -08:00

claude-4-5-sonnet.json

feat: cutover repo to 1.0 sdk client LET-6256 (#6361 )

2025-11-24 19:11:18 -08:00

claude-4-sonnet-extended.json

feat: cutover repo to 1.0 sdk client LET-6256 (#6361 )

2025-11-24 19:11:18 -08:00

claude-4-sonnet.json

feat: cutover repo to 1.0 sdk client LET-6256 (#6361 )

2025-11-24 19:11:18 -08:00

gemini-2.5-flash-vertex.json

feat: set default temperature to 1.0 [LET-6920] (#8618 )

2026-01-19 15:54:43 -08:00

gemini-2.5-pro-vertex.json

feat: set default temperature to 1.0 [LET-6920] (#8618 )

2026-01-19 15:54:43 -08:00

gemini-2.5-pro.json

feat: set default temperature to 1.0 [LET-6920] (#8618 )

2026-01-19 15:54:43 -08:00

groq.json

feat: set default temperature to 1.0 [LET-6920] (#8618 )

2026-01-19 15:54:43 -08:00

lmstudio.json

feat(ci): self-hosted provider test for lmstudio (#9404 )

2026-02-24 10:52:07 -08:00

minimax-m2.1-lightning.json

feat: add MiniMax provider support (#9095 )

2026-01-29 12:44:04 -08:00

ollama.json

feat(tf): gpu runners and prod memory_repos (#9283 )

2026-02-24 10:52:07 -08:00

openai-gpt-4.1.json

feat: set default temperature to 1.0 [LET-6920] (#8618 )

2026-01-19 15:54:43 -08:00

openai-gpt-4o-mini.json

feat: set default temperature to 1.0 [LET-6920] (#8618 )

2026-01-19 15:54:43 -08:00

openai-gpt-5.json

feat: cutover repo to 1.0 sdk client LET-6256 (#6361 )

2025-11-24 19:11:18 -08:00

openai-o1.json

feat: set default temperature to 1.0 [LET-6920] (#8618 )

2026-01-19 15:54:43 -08:00

openai-o3.json

feat: set default temperature to 1.0 [LET-6920] (#8618 )

2026-01-19 15:54:43 -08:00

openai-o4-mini.json

feat: set default temperature to 1.0 [LET-6920] (#8618 )

2026-01-19 15:54:43 -08:00

together-qwen-2.5-72b-instruct.json

feat: set default temperature to 1.0 [LET-6920] (#8618 )

2026-01-19 15:54:43 -08:00

vllm.json

feat(tf): gpu runners and prod memory_repos (#9283 )

2026-02-24 10:52:07 -08:00

zai-glm-4.6.json

feat: add reasoning zai openrouter (#9189 )

2026-02-24 10:52:06 -08:00