test: Add archival insert test to GPT-4 and make tests failure sensitive (#1930)

2024-10-24 15:54:29 -07:00
parent f93dc8250b
commit 9acdaacc7c
3 changed files with 45 additions and 39 deletions
--- a/.github/workflows/test_openai.yml
+++ b/.github/workflows/test_openai.yml
@@ -30,8 +30,6 @@ jobs:
        OPENAI_API_KEY: ${{ secrets.OPENAI_API_KEY }}
      run: |
        poetry run pytest -s -vv tests/test_endpoints.py::test_openai_gpt_4_returns_valid_first_message
-        echo "TEST_FIRST_MESSAGE_EXIT_CODE=$?" >> $GITHUB_ENV
-      continue-on-error: true

    - name: Test model sends message with keyword
      id: test_keyword_message
@@ -39,8 +37,6 @@ jobs:
        OPENAI_API_KEY: ${{ secrets.OPENAI_API_KEY }}
      run: |
        poetry run pytest -s -vv tests/test_endpoints.py::test_openai_gpt_4_returns_keyword
-        echo "TEST_KEYWORD_MESSAGE_EXIT_CODE=$?" >> $GITHUB_ENV
-      continue-on-error: true

    - name: Test model uses external tool correctly
      id: test_external_tool
@@ -48,8 +44,6 @@ jobs:
        OPENAI_API_KEY: ${{ secrets.OPENAI_API_KEY }}
      run: |
        poetry run pytest -s -vv tests/test_endpoints.py::test_openai_gpt_4_uses_external_tool
-        echo "TEST_EXTERNAL_TOOL_EXIT_CODE=$?" >> $GITHUB_ENV
-      continue-on-error: true

    - name: Test model recalls chat memory
      id: test_chat_memory
@@ -57,17 +51,20 @@ jobs:
        OPENAI_API_KEY: ${{ secrets.OPENAI_API_KEY }}
      run: |
        poetry run pytest -s -vv tests/test_endpoints.py::test_openai_gpt_4_recall_chat_memory
-        echo "TEST_CHAT_MEMORY_EXIT_CODE=$?" >> $GITHUB_ENV
-      continue-on-error: true

    - name: Test model uses 'archival_memory_search' to find secret
-      id: test_archival_memory
+      id: test_archival_memory_search
      env:
        OPENAI_API_KEY: ${{ secrets.OPENAI_API_KEY }}
      run: |
        poetry run pytest -s -vv tests/test_endpoints.py::test_openai_gpt_4_archival_memory_retrieval
-        echo "TEST_ARCHIVAL_MEMORY_EXIT_CODE=$?" >> $GITHUB_ENV
-      continue-on-error: true
+
+    - name: Test model uses 'archival_memory_insert' to insert archival memories
+      id: test_archival_memory_insert
+      env:
+        OPENAI_API_KEY: ${{ secrets.OPENAI_API_KEY }}
+      run: |
+        poetry run pytest -s -vv tests/test_endpoints.py::test_openai_gpt_4_archival_memory_insert

    - name: Test model can edit core memories
      id: test_core_memory
@@ -75,8 +72,6 @@ jobs:
        OPENAI_API_KEY: ${{ secrets.OPENAI_API_KEY }}
      run: |
        poetry run pytest -s -vv tests/test_endpoints.py::test_openai_gpt_4_edit_core_memory
-        echo "TEST_CORE_MEMORY_EXIT_CODE=$?" >> $GITHUB_ENV
-      continue-on-error: true

    - name: Test embedding endpoint
      id: test_embedding_endpoint
@@ -84,29 +79,3 @@ jobs:
        OPENAI_API_KEY: ${{ secrets.OPENAI_API_KEY }}
      run: |
        poetry run pytest -s -vv tests/test_endpoints.py::test_embedding_endpoint_openai
-        echo "TEST_EMBEDDING_ENDPOINT_EXIT_CODE=$?" >> $GITHUB_ENV
-      continue-on-error: true
-
-    - name: Summarize test results
-      if: always()
-      run: |
-        echo "Test Results Summary:"
-        echo "Test first message: $([[ $TEST_FIRST_MESSAGE_EXIT_CODE -eq 0 ]] && echo ✅ || echo ❌)"
-        echo "Test model sends message with keyword: $([[ $TEST_KEYWORD_MESSAGE_EXIT_CODE -eq 0 ]] && echo ✅ || echo ❌)"
-        echo "Test model uses external tool: $([[ $TEST_EXTERNAL_TOOL_EXIT_CODE -eq 0 ]] && echo ✅ || echo ❌)"
-        echo "Test model recalls chat memory: $([[ $TEST_CHAT_MEMORY_EXIT_CODE -eq 0 ]] && echo ✅ || echo ❌)"
-        echo "Test model uses 'archival_memory_search' to find secret: $([[ $TEST_ARCHIVAL_MEMORY_EXIT_CODE -eq 0 ]] && echo ✅ || echo ❌)"
-        echo "Test model can edit core memories: $([[ $TEST_CORE_MEMORY_EXIT_CODE -eq 0 ]] && echo ✅ || echo ❌)"
-        echo "Test embedding endpoint: $([[ $TEST_EMBEDDING_ENDPOINT_EXIT_CODE -eq 0 ]] && echo ✅ || echo ❌)"
-
-        # Check if any test failed
-        if [[ $TEST_FIRST_MESSAGE_EXIT_CODE -ne 0 || \
-              $TEST_KEYWORD_MESSAGE_EXIT_CODE -ne 0 || \
-              $TEST_EXTERNAL_TOOL_EXIT_CODE -ne 0 || \
-              $TEST_CHAT_MEMORY_EXIT_CODE -ne 0 || \
-              $TEST_ARCHIVAL_MEMORY_EXIT_CODE -ne 0 || \
-              $TEST_CORE_MEMORY_EXIT_CODE -ne 0 || \
-              $TEST_EMBEDDING_ENDPOINT_EXIT_CODE -ne 0 ]]; then
-          echo "Some tests failed."
-          exit 78
-        fi