deep-searcher/tests/agent/test_chain_of_rag.py


								from unittest.mock import MagicMock, patch


								from deepsearcher.agent import ChainOfRAG

								from deepsearcher.vector_db.base import RetrievalResult

								from deepsearcher.llm.base import ChatResponse


								from tests.agent.test_base import BaseAgentTest


								class TestChainOfRAG(BaseAgentTest):

								    """Test class for ChainOfRAG agent."""


								    def setUp(self):

								        """Set up test fixtures for ChainOfRAG tests."""

								        super().setUp()


								        # Set up predefined responses for the LLM for exact prompt substrings

								        self.llm.predefined_responses = {

								            "previous queries and answers, generate a new simple follow-up question": "What is the significance of deep learning?",

								            "Given the following documents, generate an appropriate answer": "Deep learning is a subset of machine learning that uses neural networks with multiple layers.",

								            "given the following intermediate queries and answers, judge whether you have enough information": "Yes",

								            "Given a list of agent indexes and corresponding descriptions": "1",

								            "Given the following documents, select the ones that are support the Q-A pair": "[0, 1]",

								            "Given the following intermediate queries and answers, generate a final answer": "Deep learning is an advanced subset of machine learning that uses neural networks with multiple layers."

								        }


								        self.chain_of_rag = ChainOfRAG(

								            llm=self.llm,

								            embedding_model=self.embedding_model,

								            vector_db=self.vector_db,

								            max_iter=3,

								            early_stopping=True,

								            route_collection=True,

								            text_window_splitter=True

								        )


								    def test_init(self):

								        """Test the initialization of ChainOfRAG."""

								        self.assertEqual(self.chain_of_rag.llm, self.llm)

								        self.assertEqual(self.chain_of_rag.embedding_model, self.embedding_model)

								        self.assertEqual(self.chain_of_rag.vector_db, self.vector_db)

								        self.assertEqual(self.chain_of_rag.max_iter, 3)

								        self.assertEqual(self.chain_of_rag.early_stopping, True)

								        self.assertEqual(self.chain_of_rag.route_collection, True)

								        self.assertEqual(self.chain_of_rag.text_window_splitter, True)


								    def test_reflect_get_subquery(self):

								        """Test the _reflect_get_subquery method."""

								        query = "What is deep learning?"

								        intermediate_context = ["Previous query: What is AI?", "Previous answer: AI is artificial intelligence."]


								        # Direct mock for this specific method

								        self.llm.chat = MagicMock(return_value=ChatResponse(

								            content="What is the significance of deep learning?",

								            total_tokens=10

								        ))


								        subquery, tokens = self.chain_of_rag._reflect_get_subquery(query, intermediate_context)


								        self.assertEqual(subquery, "What is the significance of deep learning?")

								        self.assertEqual(tokens, 10)

								        self.assertTrue(self.llm.chat.called)


								    def test_retrieve_and_answer(self):

								        """Test the _retrieve_and_answer method."""

								        query = "What is deep learning?"


								        # Mock the collection_router.invoke method

								        self.chain_of_rag.collection_router.invoke = MagicMock(return_value=(["test_collection"], 5))


								        # Direct mock for this specific method

								        self.llm.chat = MagicMock(return_value=ChatResponse(

								            content="Deep learning is a subset of machine learning that uses neural networks with multiple layers.",

								            total_tokens=10

								        ))


								        answer, results, tokens = self.chain_of_rag._retrieve_and_answer(query)


								        # Check if correct methods were called

								        self.chain_of_rag.collection_router.invoke.assert_called_once()

								        self.assertTrue(self.vector_db.search_called)


								        # Check the results

								        self.assertEqual(answer, "Deep learning is a subset of machine learning that uses neural networks with multiple layers.")

								        self.assertEqual(tokens, 15)  # 5 from collection_router + 10 from LLM


								    def test_get_supported_docs(self):

								        """Test the _get_supported_docs method."""

								        results = [

								            RetrievalResult(

								                embedding=[0.1] * 8,

								                text=f"Test result {i}",

								                reference="test_reference",

								                metadata={"a": i}

								            )

								            for i in range(3)

								        ]


								        query = "What is deep learning?"

								        answer = "Deep learning is a subset of machine learning that uses neural networks with multiple layers."


								        # Mock the literal_eval method to return indices as integers

								        self.llm.literal_eval = MagicMock(return_value=[0, 1])


								        supported_docs, tokens = self.chain_of_rag._get_supported_docs(results, query, answer)


								        self.assertEqual(len(supported_docs), 2)  # Based on our mock response of [0, 1]

								        self.assertEqual(tokens, 10)


								    def test_check_has_enough_info(self):

								        """Test the _check_has_enough_info method."""

								        query = "What is deep learning?"

								        intermediate_contexts = [

								            "Intermediate query1: What is deep learning?",

								            "Intermediate answer1: Deep learning is a subset of machine learning that uses neural networks with multiple layers."

								        ]


								        # Direct mock for this specific method

								        self.llm.chat = MagicMock(return_value=ChatResponse(

								            content="Yes",

								            total_tokens=10

								        ))


								        has_enough, tokens = self.chain_of_rag._check_has_enough_info(query, intermediate_contexts)


								        self.assertTrue(has_enough)  # Based on our mock response of "Yes"

								        self.assertEqual(tokens, 10)


								    def test_retrieve(self):

								        """Test the retrieve method."""

								        query = "What is deep learning?"


								        # Mock all the methods that retrieve calls

								        self.chain_of_rag._reflect_get_subquery = MagicMock(return_value=("What is the significance of deep learning?", 5))

								        self.chain_of_rag._retrieve_and_answer = MagicMock(

								            return_value=("Deep learning is important in AI", [RetrievalResult(

								                embedding=[0.1] * 8,

								                text="Test result",

								                reference="test_reference",

								                metadata={"a": 1}

								            )], 10)

								        )

								        self.chain_of_rag._get_supported_docs = MagicMock(return_value=([RetrievalResult(

								            embedding=[0.1] * 8,

								            text="Test result",

								            reference="test_reference",

								            metadata={"a": 1}

								        )], 5))

								        self.chain_of_rag._check_has_enough_info = MagicMock(return_value=(True, 5))


								        results, tokens, metadata = self.chain_of_rag.retrieve(query)


								        # Check if methods were called

								        self.chain_of_rag._reflect_get_subquery.assert_called_once()

								        self.chain_of_rag._retrieve_and_answer.assert_called_once()

								        self.chain_of_rag._get_supported_docs.assert_called_once()


								        # With early stopping, it should check if we have enough info

								        self.chain_of_rag._check_has_enough_info.assert_called_once()


								        # Check results

								        self.assertEqual(len(results), 1)

								        self.assertEqual(tokens, 25)  # 5 + 10 + 5 + 5

								        self.assertIn("intermediate_context", metadata)


								    def test_query(self):

								        """Test the query method."""

								        query = "What is deep learning?"


								        # Mock the retrieve method

								        retrieved_results = [

								            RetrievalResult(

								                embedding=[0.1] * 8,

								                text=f"Test result {i}",

								                reference="test_reference",

								                metadata={"a": i, "wider_text": f"Wider context for test result {i}"}

								            )

								            for i in range(3)

								        ]


								        self.chain_of_rag.retrieve = MagicMock(

								            return_value=(retrieved_results, 20, {"intermediate_context": ["Some context"]})

								        )


								        # Direct mock for this specific method

								        self.llm.chat = MagicMock(return_value=ChatResponse(

								            content="Deep learning is an advanced subset of machine learning that uses neural networks with multiple layers.",

								            total_tokens=10

								        ))


								        answer, results, tokens = self.chain_of_rag.query(query)


								        # Check if methods were called

								        self.chain_of_rag.retrieve.assert_called_once_with(query)

								        self.assertTrue(self.llm.chat.called)


								        # Check results

								        self.assertEqual(answer, "Deep learning is an advanced subset of machine learning that uses neural networks with multiple layers.")

								        self.assertEqual(results, retrieved_results)

								        self.assertEqual(tokens, 30)  # 20 from retrieve + 10 from LLM


								    def test_format_retrieved_results(self):

								        """Test the _format_retrieved_results method."""

								        retrieved_results = [

								            RetrievalResult(

								                embedding=[0.1] * 8,

								                text="Test result 1",

								                reference="test_reference",

								                metadata={"a": 1, "wider_text": "Wider context for test result 1"}

								            ),

								            RetrievalResult(

								                embedding=[0.1] * 8,

								                text="Test result 2",

								                reference="test_reference",

								                metadata={"a": 2, "wider_text": "Wider context for test result 2"}

								            )

								        ]


								        # Test with text_window_splitter enabled

								        self.chain_of_rag.text_window_splitter = True

								        formatted = self.chain_of_rag._format_retrieved_results(retrieved_results)


								        self.assertIn("Wider context for test result 1", formatted)

								        self.assertIn("Wider context for test result 2", formatted)


								        # Test with text_window_splitter disabled

								        self.chain_of_rag.text_window_splitter = False

								        formatted = self.chain_of_rag._format_retrieved_results(retrieved_results)


								        self.assertIn("Test result 1", formatted)

								        self.assertIn("Test result 2", formatted)

								        self.assertNotIn("Wider context for test result 1", formatted)


								if __name__ == "__main__":

								    import unittest

								    unittest.main()