Spaces:

DocSA
/

Legal_Position_Generator

Runtime error

App Files Files Community

DocUA commited on Dec 3, 2024

Commit

98000f7

1 Parent(s): 21c8728

Edit JSON format answer

Browse files

Files changed (2) hide show

main.py +80 -31
prompts.py +18 -103

main.py CHANGED Viewed

@@ -33,7 +33,7 @@ from llama_index.core.schema import NodeWithScore
 from llama_index.core.prompts import PromptTemplate
 from llama_index.core.response_synthesizers import ResponseMode, get_response_synthesizer
-from prompts import CITATION_QA_TEMPLATE, CITATION_REFINE_TEMPLATE
 from dotenv import load_dotenv
@@ -98,7 +98,7 @@ def download_s3_folder(bucket_name, prefix, local_dir):
             print(f"Завантажено: {s3_key} -> {local_file_path}")
 # Завантаження всього вмісту папки `Save_Index` з S3 у локальну директорію `Save_Index_Local`
-download_s3_folder(BUCKET_NAME, PREFIX_RETRIEVER, LOCAL_DIR)
@@ -117,40 +117,89 @@ state_nodes = gr.State()
 class CitationQueryEngineWorkflow(Workflow):
     @step
-    async def retrieve(self, ctx: Context, ev: StartEvent) -> Union[RetrieverEvent, None]:
-        query = ev.get("query")
-        question = ev.get("question")
-        nodes = ev.get("nodes")  # Отримуємо nodes з події
-        if not query:
-            return None
-        await ctx.set("query", query)
-        await ctx.set("question", question)
-        if nodes is not None:
-            # Використовуємо передані nodes
-            return RetrieverEvent(nodes=nodes)
-        else:
-            # Якщо nodes не передані, не виконуємо додатковий пошук
-            return None
-    @step
-    async def synthesize(self, ctx: Context, ev: RetrieverEvent) -> StopEvent:
-        query = await ctx.get("query", default=None)
-        question = await ctx.get("question", default=None)
-        llm_answer = OpenAI(model="gpt-4o-mini", temperature=0)
-        synthesizer = get_response_synthesizer(
-            llm=llm_answer,
-            text_qa_template=CITATION_QA_TEMPLATE,
-            refine_template=CITATION_REFINE_TEMPLATE,
-            response_mode=ResponseMode.COMPACT,
-            use_async=True,
         )
-        response = await synthesizer.asynthesize(query=query, question=question, nodes=ev.nodes)
-        return StopEvent(result=response)
 def parse_doc_ids(doc_ids):

 from llama_index.core.prompts import PromptTemplate
 from llama_index.core.response_synthesizers import ResponseMode, get_response_synthesizer
+from prompts import PRECEDENT_ANALYSIS_TEMPLATE
 from dotenv import load_dotenv
             print(f"Завантажено: {s3_key} -> {local_file_path}")
 # Завантаження всього вмісту папки `Save_Index` з S3 у локальну директорію `Save_Index_Local`
+# download_s3_folder(BUCKET_NAME, PREFIX_RETRIEVER, LOCAL_DIR) # !!! тимчасово відключено
 class CitationQueryEngineWorkflow(Workflow):
     @step
+    async def analyze(self, ctx: Context, ev: StartEvent) -> StopEvent:
+        query = ev.get("query")  # нове рішення
+        question = ev.get("question")  # уточнююче питання
+        nodes = ev.get("nodes")  # знайдені правові позиції
+        if not all([query, nodes]):
+            return StopEvent(result="Недостатньо даних для аналізу. Необхідні нове рішення та правові позиції.")
+        llm = OpenAI(model="gpt-4o-mini", temperature=0)
+        # Підготовка контексту та збір ID правових позицій
+        context_parts = []
+        all_lp_ids = []
+        for i, node in enumerate(nodes, 1):
+            # Отримуємо текст з node.node якщо це NodeWithScore
+            node_text = node.node.text if hasattr(node, 'node') else node.text
+            # Отримуємо metadata з node.node якщо це NodeWithScore
+            metadata = node.node.metadata if hasattr(node, 'node') else node.metadata
+            lp_id = metadata.get('lp_id', f'unknown_{i}')
+            all_lp_ids.append(lp_id)
+            context_parts.append(f"Source {lp_id}:\n{node_text}")
+        context_str = "\n\n".join(context_parts)
+        response_format = {
+            "type": "json_schema",
+            "json_schema": {
+                "name": "relevant_positions_schema",
+                "schema": {
+                    "type": "object",
+                    "properties": {
+                        "relevant_positions": {
+                            "type": "array",
+                            "items": {
+                                "type": "object",
+                                "properties": {
+                                    "lp_id": {"type": "string"},
+                                    "description": {"type": "string"}
+                                },
+                                "required": ["lp_id", "description"]
+                            }
+                        }
+                    },
+                    "required": ["relevant_positions"]
+                }
+            }
+        }
+        # Формування промпту та отримання відповіді
+        prompt = PRECEDENT_ANALYSIS_TEMPLATE.format(
+            query=query,
+            question=question if question else "Загальний аналіз релевантності",
+            context_str=context_str
+        )
+        messages = [
+            ChatMessage(role="system", content="Ти - кваліфікований юрист-аналітик."),
+            ChatMessage(role="user", content=prompt)
+        ]
+        response = llm.chat(
+            messages=messages,
+            response_format=response_format
         )
+        try:
+            parsed_response = json.loads(response.message.content)
+            if "relevant_positions" in parsed_response:
+                return StopEvent(result=parsed_response)
+            else:
+                return StopEvent(result={
+                    "error": "Missing required fields in response",
+                    "content": response.message.content
+                })
+        except json.JSONDecodeError:
+            return StopEvent(result={
+                "error": "Error parsing response",
+                "content": response.message.content
+            })
 def parse_doc_ids(doc_ids):

prompts.py CHANGED Viewed

@@ -1,108 +1,23 @@
 from llama_index.core.prompts import PromptTemplate
-CITATION_QA_TEMPLATE = PromptTemplate(
-    "Будь ласка, надайте відповідь, базуючись виключно на наданих правових позиціях Верховного Суду. "
-    "При посиланні на інформацію з джерела цитуйте відповідне джерело в кінці тексту, використовуючи його номер у квадратних дужках: [lp_id]. "
-    "Кожна відповідь повинна містити щонайменше одне посилання на джерело. "
-    "Цитуйте джерело лише тоді, коли ви явно на нього посилаєтеся. "
-    "Якщо жодне з джерел не є корисним, зазначте це. "
-    "Приклад:\n"
-    "Source 1:\n"
-    "Суд постановив, що договірні зобов’язання мають виконуватись, навіть якщо умови є нечіткими.\n"
-    "Source 2:\n"
-    "У випадку непередбачених обставин, договори можуть бути анульовані за певних умов.\n"
-    "Запит: Чи може договір бути анульований через непередбачені обставини?\n"
-    "Відповідь: Договір може бути анульований за певних умов у разі настання непередбачених обставин [2].\n"
-    "Тепер ваша черга. Нижче наведено кілька пронумерованих правових позицій:"
-    "\n------\n"
-    "{context_str}"
-    "\n------\n"
-    "Запит: {query_str}\n"
-    "Відповідь: "
-)
-CITATION_REFINE_TEMPLATE = PromptTemplate(
-    "Будь ласка, надайте відповідь, базуючись виключно на наданих правових позиціях Верховного Суду. "
-    "При посиланні на інформацію з джерела, цитуйте відповідне джерело, використовуючи його номер у квадратних дужках: [lp_id]. "
-    "Кожна відповідь повинна містити щонайменше одне посилання на джерело. "
-    "Цитуйте джерело лише тоді, коли ви явно на нього посилаєтеся. "
-    "Якщо жодне з джерел не є корисним, зазначте це. "
-    "Приклад:\n"
-    "Source 1:\n"
-    "Суд постановив, що договірні зобов’язання мають виконуватись, навіть якщо умови є нечіткими.\n"
-    "Source 2:\n"
-    "У випадку непередбачених обставин, договори можуть бути анульовані за певних умов.\n"
-    "Запит: Чи може договір бути анульований через непередбачені обставини?\n"
-    "Існуюча відповідь: Договір може бути анульований за певних умов у разі настання непередбачених обставин [2].\n"
-    "Тепер ваша черга. "
-    "Ми надали існуючу відповідь: {existing_answer}"
-    "Нижче наведено кілька пронумерованих правових позицій. "
-    "Використовуйте їх для уточнення існуючої відповіді. "
-    "Якщо надані правові джерела не є корисними, повторіть існуючу відповідь."
-    "\nПочинайте уточнення!"
-    "\n------\n"
-    "{context_msg}"
     "\n------\n"
-    "Запит: {query_str}\n"
-    "Відповідь: "
 )
-# CITATION_QA_TEMPLATE = PromptTemplate(
-#     "You are a qualified lawyer. "
-#     "Please provide a legal analysis based solely on the provided legal precedents and positions. "
-#     "When referencing a legal precedent or position, "
-#     "cite the appropriate source(s) using their corresponding numbers. "
-#     "Every answer should include at least one legal source citation relevant to the query. "
-#     "Only cite a source when you are explicitly referencing it. "
-#     "If none of the legal precedents or positions are helpful, you should indicate that. "
-#     "Use only the Ukrainian language to answer. "
-#     "For example:\n"
-#     "Source 1:\n"
-#     "The court ruled that contractual obligations must be fulfilled even if the terms are vague.\n"
-#     "Source 2:\n"
-#     "In case of unforeseen circumstances, contracts may be voided under certain conditions.\n"
-#     "Query: Can a contract be voided due to unforeseen circumstances?\n"
-#     "Answer: A contract may be voided under certain conditions if unforeseen circumstances arise [2]. "
-#     "Now it's your turn. Below are several numbered legal sources and precedents (legal positions):"
-#     "\n------\n"
-#     "{context_str}"
-#     "\n------\n"
-#     "New legal issue: {query_str}\n"
-#     "User question: {question}\n"
-#     "Answer: "
-# )
-# CITATION_REFINE_TEMPLATE = PromptTemplate(
-#     "You are a qualified lawyer. "
-#     "Please refine the legal analysis based solely on the provided legal precedents and positions. "
-#     "When referencing a legal precedent or position, "
-#     "cite the appropriate source(s) using their corresponding numbers. "
-#     "Every refined answer should include at least one relevant legal source citation. "
-#     "Only cite a source when you are explicitly referencing it. "
-#     "If none of the legal precedents or positions are helpful, you should repeat the existing answer. "
-#     "Use only the Ukrainian language to answer."
-#     "For example:\n"
-#     "Source 1:\n"
-#     "The court ruled that contractual obligations must be fulfilled even if the terms are vague.\n"
-#     "Source 2:\n"
-#     "In case of unforeseen circumstances, contracts may be voided under certain conditions.\n"
-#     "Query: Can a contract be voided due to unforeseen circumstances?\n"
-#     "Existing answer: A contract may be voided under certain conditions if unforeseen circumstances arise [2].\n"
-#     "Now it's your turn. "
-#     "We have provided an existing legal analysis: {existing_answer}"
-#     "Below are several numbered legal sources and precedents. "
-#     "Use them to refine the existing legal answer. "
-#     "If the provided legal sources are not helpful, you will repeat the existing answer."
-#     "\nBegin refining!"
-#     "\n------\n"
-#     "{context_msg}"
-#     "\n------\n"
-#     "New legal issue: {query_str}\n"
-#     "User question: {question}\n"
-#     "Answer: "
-# )

 from llama_index.core.prompts import PromptTemplate
+PRECEDENT_ANALYSIS_TEMPLATE = PromptTemplate(
+    "Дій як кваліфікований юрист. Проаналізуй правові позиції Верховного Суду та порівняй їх з новим рішенням.\n\n"
+    "1. Нове рішення:\n{query}\n\n"
+    "2. Уточнююче питання:\n{question}\n\n"
+    "3. Правові позиції для аналізу:\n"
+    "------\n"
+    "{context_str}"
     "\n------\n"
+    "На основі аналізу створи список релевантних правових позицій. "
+    "Кожна позиція повинна містити ID та короткий опис її суті. "
+    "Результат надай у такому форматі JSON:\n\n"
+    "{{\n"
+    "    \"relevant_positions\": [\n"
+    "        {{\n"
+    "            \"lp_id\": \"ID позиції\",\n"
+    "            \"description\": \"Короткий опис суті правової позиції\"\n"
+    "        }}\n"
+    "    ]\n"
+    "}}"
 )