letta-server/tests/sdk/search_test.py

"""
End-to-end tests for passage and message search endpoints using the SDK client.

These tests verify that the /v1/passages/search and /v1/messages/search endpoints work correctly
with Turbopuffer integration, including vector search, FTS, hybrid search, filtering, and pagination.
"""

import time
import uuid
from datetime import datetime, timedelta, timezone
from typing import Any

import pytest
from letta_client import Letta
from letta_client.types import CreateBlockParam, MessageCreateParam

from letta.config import LettaConfig
from letta.server.rest_api.routers.v1.passages import PassageSearchResult
from letta.server.server import SyncServer
from letta.settings import settings


def cleanup_agent_with_messages(client: Letta, agent_id: str):
    """
    Helper function to properly clean up an agent by first deleting all its messages
    from Turbopuffer before deleting the agent itself.

    Args:
        client: Letta SDK client
        agent_id: ID of the agent to clean up
    """
    try:
        # First, delete all messages for this agent from Turbopuffer
        # This ensures no orphaned messages remain in Turbopuffer
        try:
            import asyncio

            from letta.helpers.tpuf_client import TurbopufferClient, should_use_tpuf_for_messages

            if should_use_tpuf_for_messages():
                tpuf_client = TurbopufferClient()
                # Delete all messages for this agent from Turbopuffer
                asyncio.run(tpuf_client.delete_all_messages(agent_id))
        except Exception as e:
            print(f"Warning: Failed to clean up Turbopuffer messages for agent {agent_id}: {e}")

        # Now delete the agent itself (which will delete SQL messages via cascade)
        client.agents.delete(agent_id=agent_id)
    except Exception as e:
        print(f"Warning: Failed to clean up agent {agent_id}: {e}")


@pytest.fixture(scope="module")
def server():
    """Server fixture for testing"""
    config = LettaConfig.load()
    config.save()
    server = SyncServer(init_with_default_org_and_user=False)
    return server


@pytest.fixture
def enable_turbopuffer():
    """Temporarily enable Turbopuffer for testing"""
    original_use_tpuf = settings.use_tpuf
    original_api_key = settings.tpuf_api_key
    original_environment = settings.environment

    # Enable Turbopuffer with test key
    settings.use_tpuf = True
    if not settings.tpuf_api_key:
        settings.tpuf_api_key = original_api_key
    settings.environment = "DEV"

    yield

    # Restore original values
    settings.use_tpuf = original_use_tpuf
    settings.tpuf_api_key = original_api_key
    settings.environment = original_environment


@pytest.fixture
def enable_message_embedding():
    """Enable both Turbopuffer and message embedding"""
    original_use_tpuf = settings.use_tpuf
    original_api_key = settings.tpuf_api_key
    original_embed_messages = settings.embed_all_messages
    original_environment = settings.environment

    settings.use_tpuf = True
    settings.tpuf_api_key = settings.tpuf_api_key or "test-key"
    settings.embed_all_messages = True
    settings.environment = "DEV"

    yield

    settings.use_tpuf = original_use_tpuf
    settings.tpuf_api_key = original_api_key
    settings.embed_all_messages = original_embed_messages
    settings.environment = original_environment


@pytest.fixture
def disable_turbopuffer():
    """Ensure Turbopuffer is disabled for testing"""
    original_use_tpuf = settings.use_tpuf
    original_embed_messages = settings.embed_all_messages

    settings.use_tpuf = False
    settings.embed_all_messages = False

    yield

    settings.use_tpuf = original_use_tpuf
    settings.embed_all_messages = original_embed_messages


@pytest.mark.skipif(not settings.tpuf_api_key, reason="Turbopuffer API key not configured")
def test_passage_search_basic(client: Letta, enable_turbopuffer):
    """Test basic passage search functionality through the SDK"""
    # Create an agent
    agent = client.agents.create(
        name=f"test_passage_search_{uuid.uuid4()}",
        memory_blocks=[CreateBlockParam(label="persona", value="test assistant")],
        model="openai/gpt-4o-mini",
        embedding="openai/text-embedding-3-small",
    )

    try:
        # Create an archive and attach to agent
        archive = client.archives.create(name=f"test_archive_{uuid.uuid4()}", embedding="openai/text-embedding-3-small")

        try:
            # Attach archive to agent
            client.agents.archives.attach(agent_id=agent.id, archive_id=archive.id)

            # Insert some passages
            test_passages = [
                "Python is a popular programming language for data science and machine learning.",
                "JavaScript is widely used for web development and frontend applications.",
                "Turbopuffer is a vector database optimized for performance and scalability.",
            ]

            for passage_text in test_passages:
                client.archives.passages.create(archive_id=archive.id, text=passage_text)

            # Wait for indexing
            time.sleep(2)

            # Test search by agent_id
            results = client.post(
                "/v1/passages/search",
                cast_to=list[PassageSearchResult],
                body={
                    "query": "python programming",
                    "agent_id": agent.id,
                    "limit": 10,
                },
            )

            assert len(results) > 0, "Should find at least one passage"
            assert any("Python" in result.passage.text for result in results), "Should find Python-related passage"

            # Verify result structure
            for result in results:
                assert hasattr(result, "passage"), "Result should have passage field"
                assert hasattr(result, "score"), "Result should have score field"
                assert hasattr(result, "metadata"), "Result should have metadata field"
                assert isinstance(result.score, float), "Score should be a float"

            # Test search by archive_id
            archive_results = client.post(
                "/v1/passages/search",
                cast_to=list[PassageSearchResult],
                body={
                    "query": "vector database",
                    "archive_id": archive.id,
                    "limit": 10,
                },
            )

            assert len(archive_results) > 0, "Should find passages in archive"
            assert any("Turbopuffer" in result.passage.text or "vector" in result.passage.text for result in archive_results), (
                "Should find vector-related passage"
            )

        finally:
            # Clean up archive
            try:
                client.archives.delete(archive_id=archive.id)
            except:
                pass

    finally:
        # Clean up agent
        cleanup_agent_with_messages(client, agent.id)


@pytest.mark.skipif(not settings.tpuf_api_key, reason="Turbopuffer API key not configured")
def test_passage_search_with_tags(client: Letta, enable_turbopuffer):
    """Test passage search with tag filtering"""
    # Create an agent
    agent = client.agents.create(
        name=f"test_passage_tags_{uuid.uuid4()}",
        memory_blocks=[CreateBlockParam(label="persona", value="test assistant")],
        model="openai/gpt-4o-mini",
        embedding="openai/text-embedding-3-small",
    )

    try:
        # Create an archive
        archive = client.archives.create(name=f"test_archive_tags_{uuid.uuid4()}", embedding="openai/text-embedding-3-small")

        try:
            # Attach archive to agent
            client.agents.archives.attach(agent_id=agent.id, archive_id=archive.id)

            # Insert passages with tags (if supported)
            # Note: Tag support may depend on the SDK version
            test_passages = [
                "Python tutorial for beginners",
                "Advanced Python techniques",
                "JavaScript basics",
            ]

            for passage_text in test_passages:
                client.archives.passages.create(archive_id=archive.id, text=passage_text)

            # Wait for indexing
            time.sleep(2)

            # Test basic search without tags first
            results = client.post(
                "/v1/passages/search",
                cast_to=list[PassageSearchResult],
                body={
                    "query": "programming tutorial",
                    "agent_id": agent.id,
                    "limit": 10,
                },
            )

            assert len(results) > 0, "Should find passages"

            # Test with tag filtering if supported
            # Note: The SDK may not expose tag parameters directly, so this test verifies basic functionality
            # The backend will handle tag filtering when available

        finally:
            # Clean up archive
            try:
                client.archives.delete(archive_id=archive.id)
            except:
                pass

    finally:
        # Clean up agent
        cleanup_agent_with_messages(client, agent.id)


@pytest.mark.skipif(not settings.tpuf_api_key, reason="Turbopuffer API key not configured")
def test_passage_search_with_date_filters(client: Letta, enable_turbopuffer):
    """Test passage search with date range filtering"""
    # Create an agent
    agent = client.agents.create(
        name=f"test_passage_dates_{uuid.uuid4()}",
        memory_blocks=[CreateBlockParam(label="persona", value="test assistant")],
        model="openai/gpt-4o-mini",
        embedding="openai/text-embedding-3-small",
    )

    try:
        # Create an archive
        archive = client.archives.create(name=f"test_archive_dates_{uuid.uuid4()}", embedding="openai/text-embedding-3-small")

        try:
            # Attach archive to agent
            client.agents.archives.attach(agent_id=agent.id, archive_id=archive.id)

            # Insert passages at different times
            client.archives.passages.create(archive_id=archive.id, text="Recent passage about AI trends")

            # Wait a bit before creating another
            time.sleep(1)

            client.archives.passages.create(archive_id=archive.id, text="Another passage about machine learning")

            # Wait for indexing
            time.sleep(2)

            # Test search with date range
            now = datetime.now(timezone.utc)
            start_date = now - timedelta(hours=1)

            results = client.post(
                "/v1/passages/search",
                cast_to=list[PassageSearchResult],
                body={
                    "query": "AI machine learning",
                    "agent_id": agent.id,
                    "limit": 10,
                    "start_date": start_date.isoformat(),
                },
            )

            assert len(results) > 0, "Should find recent passages"

            # Verify all results are within date range
            for result in results:
                passage_date = result.passage.created_at
                if passage_date:
                    # Convert to datetime if it's a string
                    if isinstance(passage_date, str):
                        passage_date = datetime.fromisoformat(passage_date.replace("Z", "+00:00"))
                    assert passage_date >= start_date, "Passage should be after start_date"

        finally:
            # Clean up archive
            try:
                client.archives.delete(archive_id=archive.id)
            except:
                pass

    finally:
        # Clean up agent
        cleanup_agent_with_messages(client, agent.id)


@pytest.mark.skipif(not settings.tpuf_api_key, reason="Turbopuffer API key not configured")
def test_message_search_basic(client: Letta, enable_message_embedding):
    """Test basic message search functionality through the SDK"""
    # Create an agent
    agent = client.agents.create(
        name=f"test_message_search_{uuid.uuid4()}",
        memory_blocks=[CreateBlockParam(label="persona", value="helpful assistant")],
        model="openai/gpt-4o-mini",
        embedding="openai/text-embedding-3-small",
    )

    try:
        # Send messages to the agent
        test_messages = [
            "What is the capital of Mozambique?",
        ]

        for msg_text in test_messages:
            client.agents.messages.create(agent_id=agent.id, messages=[MessageCreateParam(role="user", content=msg_text)])

        # Wait for messages to be indexed and database transactions to complete
        # Extra time needed for async embedding and database commits
        time.sleep(6)

        # Test FTS search for messages
        results = client.messages.search(query="capital of Mozambique", search_mode="fts", limit=10)

        assert len(results) > 0, "Should find at least one message"

    finally:
        # Clean up agent
        cleanup_agent_with_messages(client, agent.id)


@pytest.mark.skipif(not settings.tpuf_api_key, reason="Turbopuffer API key not configured")
def test_passage_search_pagination(client: Letta, enable_turbopuffer):
    """Test passage search pagination"""
    # Create an agent
    agent = client.agents.create(
        name=f"test_passage_pagination_{uuid.uuid4()}",
        memory_blocks=[CreateBlockParam(label="persona", value="test assistant")],
        model="openai/gpt-4o-mini",
        embedding="openai/text-embedding-3-small",
    )

    try:
        # Create an archive
        archive = client.archives.create(name=f"test_archive_pagination_{uuid.uuid4()}", embedding="openai/text-embedding-3-small")

        try:
            # Attach archive to agent
            client.agents.archives.attach(agent_id=agent.id, archive_id=archive.id)

            # Insert many passages
            for i in range(10):
                client.archives.passages.create(archive_id=archive.id, text=f"Test passage number {i} about programming")

            # Wait for indexing
            time.sleep(2)

            # Test with different limit values
            results_limit_3 = client.post(
                "/v1/passages/search",
                cast_to=list[PassageSearchResult],
                body={
                    "query": "programming",
                    "agent_id": agent.id,
                    "limit": 3,
                },
            )

            assert len(results_limit_3) == 3, "Should respect limit parameter"

            results_limit_5 = client.post(
                "/v1/passages/search",
                cast_to=list[PassageSearchResult],
                body={
                    "query": "programming",
                    "agent_id": agent.id,
                    "limit": 5,
                },
            )

            assert len(results_limit_5) == 5, "Should return 5 results"

            results_all = client.post(
                "/v1/passages/search",
                cast_to=list[PassageSearchResult],
                body={
                    "query": "programming",
                    "agent_id": agent.id,
                    "limit": 20,
                },
            )

            assert len(results_all) >= 10, "Should return all matching passages"

        finally:
            # Clean up archive
            try:
                client.archives.delete(archive_id=archive.id)
            except:
                pass

    finally:
        # Clean up agent
        cleanup_agent_with_messages(client, agent.id)


@pytest.mark.skipif(not settings.tpuf_api_key, reason="Turbopuffer API key not configured")
def test_passage_search_org_wide(client: Letta, enable_turbopuffer):
    """Test organization-wide passage search (without agent_id or archive_id)"""
    # Create multiple agents with archives
    agent1 = client.agents.create(
        name=f"test_org_search_agent1_{uuid.uuid4()}",
        memory_blocks=[CreateBlockParam(label="persona", value="test assistant 1")],
        model="openai/gpt-4o-mini",
        embedding="openai/text-embedding-3-small",
    )

    agent2 = client.agents.create(
        name=f"test_org_search_agent2_{uuid.uuid4()}",
        memory_blocks=[CreateBlockParam(label="persona", value="test assistant 2")],
        model="openai/gpt-4o-mini",
        embedding="openai/text-embedding-3-small",
    )

    try:
        # Create archives for both agents
        archive1 = client.archives.create(name=f"test_archive_org1_{uuid.uuid4()}", embedding="openai/text-embedding-3-small")
        archive2 = client.archives.create(name=f"test_archive_org2_{uuid.uuid4()}", embedding="openai/text-embedding-3-small")

        try:
            # Attach archives
            client.agents.archives.attach(agent_id=agent1.id, archive_id=archive1.id)
            client.agents.archives.attach(agent_id=agent2.id, archive_id=archive2.id)

            # Insert passages in both archives
            client.archives.passages.create(archive_id=archive1.id, text="Unique passage in agent1 about quantum computing")

            client.archives.passages.create(archive_id=archive2.id, text="Unique passage in agent2 about blockchain technology")

            # Wait for indexing
            time.sleep(2)

            # Test org-wide search (no agent_id or archive_id)
            results = client.post(
                "/v1/passages/search",
                cast_to=list[PassageSearchResult],
                body={
                    "query": "unique passage",
                    "limit": 20,
                },
            )

            # Should find passages from both agents
            assert len(results) >= 2, "Should find passages from multiple agents"

            found_texts = [result.passage.text for result in results]
            assert any("quantum computing" in text for text in found_texts), "Should find agent1 passage"
            assert any("blockchain" in text for text in found_texts), "Should find agent2 passage"

        finally:
            # Clean up archives
            try:
                client.archives.delete(archive_id=archive1.id)
            except:
                pass
            try:
                client.archives.delete(archive_id=archive2.id)
            except:
                pass

    finally:
        # Clean up agents
        cleanup_agent_with_messages(client, agent1.id)
        cleanup_agent_with_messages(client, agent2.id)