confident-ai · jwongster2 · Sep 1, 2023 · Aug 31, 2023 · Sep 1, 2023 · Sep 1, 2023
diff --git a/deepeval/dataset.py b/deepeval/dataset.py
@@ -10,6 +10,7 @@
 from .metrics.metric import Metric
 from .query_generator import BEIRQueryGenerator
 from .retry import retry
+import openai
 
 
 class EvaluationDataset(UserList):
@@ -237,7 +238,6 @@ def create_evaluation_dataset_from_raw_text(text: str, output_fn: str = "output.
 
     # NOTE: loading this may take a while as the model used is quite big
     gen = BEIRQueryGenerator()
-    text = "Synthetic queries are useful for scenraios where there is no data."
     queries = gen.generate_queries(texts=[text], num_queries=2)
     test_cases = []
     with open(output_fn, "w") as f:
@@ -249,3 +249,29 @@ def create_evaluation_dataset_from_raw_text(text: str, output_fn: str = "output.
 
     dataset = EvaluationDataset(test_cases=test_cases)
     return dataset
+
+def create_evaluation_query_output_pairs(text: str, n:int = 3):
+    """Utility function to create an evaluation dataset using GPT."""
+
+    prompt = f"""
+        Please generate {n} queries that may lead to the following text as an output. Ensure diversity in the generated queries.
+
+        {text}        
+    """
+
+    queries = openai.Completion.create(
+        engine="gpt-3.5-turbo",
+        prompt=prompt,
+        temperature=0,
+    )
+
+    test_cases = []
+    for query_choice in queries.choices:
+        generated_query = query_choice.message['content']
+        test_case = TestCase(query=generated_query, expected_output=text)
+        test_cases.append(test_case)
+
+    dataset = EvaluationDataset(test_cases=test_cases)
+    return dataset
+
+