Spaces:

DocSA
/

Legal_Position_Generator

Runtime error

App Files Files Community

DocUA commited on Dec 3, 2024

Commit

eba9dcb

1 Parent(s): 98000f7

Edit Output

Browse files

Files changed (3) hide show

config.py +1 -0
main.py +119 -124
prompts.py +42 -1

config.py CHANGED Viewed

@@ -8,3 +8,4 @@ OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
 if not OPENAI_API_KEY:
     raise ValueError("API ключ OpenAI не знайдено. Додайте його в .env файл.")


8
9	if not OPENAI_API_KEY:
10	raise ValueError("API ключ OpenAI не знайдено. Додайте його в .env файл.")
11	+

main.py CHANGED Viewed

@@ -33,7 +33,7 @@ from llama_index.core.schema import NodeWithScore
 from llama_index.core.prompts import PromptTemplate
 from llama_index.core.response_synthesizers import ResponseMode, get_response_synthesizer
-from prompts import PRECEDENT_ANALYSIS_TEMPLATE
 from dotenv import load_dotenv
@@ -115,7 +115,7 @@ state_lp_json = gr.State()
 state_nodes = gr.State()
-class CitationQueryEngineWorkflow(Workflow):
     @step
     async def analyze(self, ctx: Context, ev: StartEvent) -> StopEvent:
         query = ev.get("query")  # нове рішення
@@ -125,11 +125,11 @@ class CitationQueryEngineWorkflow(Workflow):
         if not all([query, nodes]):
             return StopEvent(result="Недостатньо даних для аналізу. Необхідні нове рішення та правові позиції.")
-        llm = OpenAI(model="gpt-4o-mini", temperature=0)
         # Підготовка контексту та збір ID правових позицій
         context_parts = []
-        all_lp_ids = []
         for i, node in enumerate(nodes, 1):
             # Отримуємо текст з node.node якщо це NodeWithScore
@@ -138,9 +138,9 @@ class CitationQueryEngineWorkflow(Workflow):
             metadata = node.node.metadata if hasattr(node, 'node') else node.metadata
             lp_id = metadata.get('lp_id', f'unknown_{i}')
-            all_lp_ids.append(lp_id)
-            context_parts.append(f"Source {lp_id}:\n{node_text}")
         context_str = "\n\n".join(context_parts)
@@ -157,9 +157,10 @@ class CitationQueryEngineWorkflow(Workflow):
                                 "type": "object",
                                 "properties": {
                                     "lp_id": {"type": "string"},
                                     "description": {"type": "string"}
                                 },
-                                "required": ["lp_id", "description"]
                             }
                         }
                     },
@@ -180,7 +181,7 @@ class CitationQueryEngineWorkflow(Workflow):
             ChatMessage(role="user", content=prompt)
         ]
-        response = llm.chat(
             messages=messages,
             response_format=response_format
         )
@@ -188,18 +189,22 @@ class CitationQueryEngineWorkflow(Workflow):
         try:
             parsed_response = json.loads(response.message.content)
             if "relevant_positions" in parsed_response:
-                return StopEvent(result=parsed_response)
             else:
-                return StopEvent(result={
-                    "error": "Missing required fields in response",
-                    "content": response.message.content
-                })
         except json.JSONDecodeError:
-            return StopEvent(result={
-                "error": "Error parsing response",
-                "content": response.message.content
-            })
 def parse_doc_ids(doc_ids):
@@ -295,92 +300,84 @@ def extract_court_decision_text(url):
     return decision_text.strip()
-def generate_legal_position(court_decision_text, user_question):
-    # llm_lp = OpenAI(model="gpt-4o-mini", temperature=0)
-    # llm_lp = OpenAI(model="ft:gpt-4o-mini-2024-07-18:personal:legal-position-100:ASPFc3vF", temperature=0)
-    llm_lp = OpenAI(model="ft:gpt-4o-mini-2024-07-18:personal:legal-position-400:AT3wvKsU", temperature=0)
-    response_format = {
-        "type": "json_schema",
-        "json_schema": {
-            "name": "lp_schema",
-            "schema": {
-                "type": "object",
-                "properties": {
-                    "title": {"type": "string", "description": "Title of the legal position"},
-                    "text": {"type": "string", "description": "Text of the legal position"},
-                    "proceeding": {"type": "string", "description": "Type of court proceedings"},
-                    "category": {"type": "string", "description": "Category of the legal position"},
-                },
-                "required": ["title", "text", "proceeding", "category"],
-                "additionalProperties": False
             },
-            "strict": True
-        }
     }
-    system_prompt = """
-    Дій як кваліфікований юрист. :
-    """
-    prompt = f"""Дотримуйся цих інструкцій.
-    1. Спочатку вам буде надано текст судового рішення:
-    <court_decision>
-    {court_decision_text}
-    </court_decision>
-    2. Уважно прочитай та проаналізуй текст наданого судового рішення. Зверни увагу на:
-       - Юридичну суть рішення
-       - Основне правове обґрунтування
-       - Головні юридичні міркування
-    3. На основі аналізу сформулюй короткий зміст позиції суду, дотримуючись таких вказівок:
-       - Будь чіткими, точними та обґрунтованими
-       - Використовуй відповідну юридичну термінологію
-       - Зберігай стислість, але повністю передай суть судового рішення
-       - Уникай додаткових пояснень чи коментарів
-       - Спробуй узагальнювати та уникати специфічної інформації (наприклад, імен або назв) під час подачі результатів
-       - Використовуйте лише українську мову
-    4. Створи короткий заголовок, який відображає основну суть судового рішення та зазнач його категорію.
-    5. Додатково визнач тип судочинства, до якої відноситься дане рішення.
-        Використовуй лише один із цих типів: 'Адміністративне судочинство', 'Кримінальне судочинство', 'Цивільне судочинство', 'Господарське судочинство'
-    6. Відформатуй відповідь у форматі JSON:
-    {{
-        "title": "Заголовок судового рішення",
-        "text": "Текст короткого змісту позиції суду",
-        "proceeding": "Тип судочинства",
-        "category": "Категорія судового рішення"
-    }}
     """
-    messages = [
-        ChatMessage(role="system", content=system_prompt),
-        ChatMessage(role="user", content=prompt),
-    ]
-    response = llm_lp.chat(messages, response_format=response_format)
-    try:
         parsed_response = json.loads(response.message.content)
-        if "title" in parsed_response and "text" in parsed_response:
             return parsed_response
-        else:
-            return {
-                "title": "Error: Missing required fields in response",
-                "text": response.message.content
-            }
     except json.JSONDecodeError:
         return {
             "title": "Error parsing response",
-            "text": response.message.content
         }
@@ -449,57 +446,55 @@ def create_gradio_interface():
             except Exception as e:
                 return f"Error during search: {str(e)}", None
-        import re
-        import re
         async def analyze_action(legal_position_json, question, nodes):
             try:
-                workflow = CitationQueryEngineWorkflow(timeout=600)
-                # Запускаємо workflow і отримуємо об'єкт Response
-                response = await workflow.run(
-                    query=legal_position_json["title"] + ': ' + legal_position_json["text"] + ': ' +
-                          legal_position_json["proceeding"] + ': ' + legal_position_json["category"],
-                    question=question,
-                    nodes=nodes  # Передаємо nodes у workflow
                 )
-                # Отримуємо текст відповіді з об'єкта Response
-                response_text = str(response)
-                # Обробка цитат у тексті відповіді
-                citations = re.findall(r'\[(\d+)\]', response_text)
-                unique_citations = sorted(set(citations), key=int)
                 output = f"**Аналіз Штучного Інтелекту:**\n{response_text}\n\n"
-                output += "**Цитовані джерела існуючих правових позицій Верховного Суду:**\n"
-                # Перевіряємо наявність source_nodes в об'єкті Response
-                source_nodes = getattr(response, 'source_nodes', [])
-                # Проходимо по унікальних цитатах та зіставляємо з `lp_id` у source_nodes
-                for citation in unique_citations:
-                    found = False  # Змінна для відстеження, чи знайдено джерело для lp_id
-                    for index, source_node_with_score in enumerate(source_nodes, start=1):
-                        source_node = source_node_with_score.node
-                        lp_id = source_node.metadata.get('lp_id')  # Отримуємо lp_id із метаданих джерела
-                        # Якщо lp_id збігається з цитатою
-                        if str(lp_id) == citation:
-                            found = True
-                            source_title = source_node.metadata.get('title', 'Невідомий заголовок')
-                            doc_ids = source_node.metadata.get('doc_id')
-                            links = get_links_html(doc_ids)
-                            links_lp = get_links_html_lp(lp_id)
-                            # Використовуємо `index` як номер джерела на початку рядка
-                            output += f"[{index}]: *{source_title}* {links_lp} 👉 Score: {source_node_with_score.score} {links}\n"
-                            break  # Вихід із циклу при знайденому відповідному джерелі
-                    if not found:
-                        output += f"[{citation}]: Немає відповідного джерела для lp_id {citation}\n"
                 return output
             except Exception as e:
                 return f"Error during analysis: {str(e)}"

 from llama_index.core.prompts import PromptTemplate
 from llama_index.core.response_synthesizers import ResponseMode, get_response_synthesizer
+from prompts import SYSTEM_PROMPT, LEGAL_POSITION_PROMPT, PRECEDENT_ANALYSIS_TEMPLATE
 from dotenv import load_dotenv
 state_nodes = gr.State()
+class PrecedentAnalysisWorkflow(Workflow):
     @step
     async def analyze(self, ctx: Context, ev: StartEvent) -> StopEvent:
         query = ev.get("query")  # нове рішення
         if not all([query, nodes]):
             return StopEvent(result="Недостатньо даних для аналізу. Необхідні нове рішення та правові позиції.")
+        llm_analyse = OpenAI(model="gpt-4o", temperature=0)
+        # llm_analyse = OpenAI(model="gpt-4o-mini", temperature=0)
         # Підготовка контексту та збір ID правових позицій
         context_parts = []
         for i, node in enumerate(nodes, 1):
             # Отримуємо текст з node.node якщо це NodeWithScore
             metadata = node.node.metadata if hasattr(node, 'node') else node.metadata
             lp_id = metadata.get('lp_id', f'unknown_{i}')
+            source_index = str(i)
+            context_parts.append(f"Source {source_index} (ID: {lp_id}):\n{node_text}")
         context_str = "\n\n".join(context_parts)
                                 "type": "object",
                                 "properties": {
                                     "lp_id": {"type": "string"},
+                                    "source_index": {"type": "string"},
                                     "description": {"type": "string"}
                                 },
+                                "required": ["lp_id", "source_index", "description"]
                             }
                         }
                     },
             ChatMessage(role="user", content=prompt)
         ]
+        response = llm_analyse.chat(
             messages=messages,
             response_format=response_format
         )
         try:
             parsed_response = json.loads(response.message.content)
             if "relevant_positions" in parsed_response:
+                # Форматуємо результат
+                response_lines = []
+                for position in parsed_response["relevant_positions"]:
+                    position_text = (
+                        f"* [{position['source_index']}] | Висновок: {position['description']} | Правова позиція [{position['lp_id']}]: "
+                    )
+                    response_lines.append(position_text)
+                response_text = "\n".join(response_lines)
+                return StopEvent(result=response_text)
             else:
+                return StopEvent(result="Помилка: відповідь не містить аналізу правових позицій")
         except json.JSONDecodeError:
+            return StopEvent(result="Помилка обробки відповіді від AI")
 def parse_doc_ids(doc_ids):
     return decision_text.strip()
+# Constants for JSON schema
+LEGAL_POSITION_SCHEMA = {
+    "type": "json_schema",
+    "json_schema": {
+        "name": "lp_schema",
+        "schema": {
+            "type": "object",
+            "properties": {
+                "title": {"type": "string", "description": "Title of the legal position"},
+                "text": {"type": "string", "description": "Text of the legal position"},
+                "proceeding": {"type": "string", "description": "Type of court proceedings"},
+                "category": {"type": "string", "description": "Category of the legal position"},
             },
+            "required": ["title", "text", "proceeding", "category"],
+            "additionalProperties": False
+        },
+        "strict": True
     }
+}
+def generate_legal_position(court_decision_text, user_question):
+    """
+    Генерує правову позицію на основі тексту судового рішення.
+    Args:
+        court_decision_text (str): Текст судового рішення для аналізу
+        user_question (str): Питання користувача (наразі не використовується)
+    Returns:
+        dict: Словник з правовою позицією або повідомленням про помилку
     """
+    try:
+        # Ініціалізація моделі
+        llm_lp = OpenAI(
+            model="ft:gpt-4o-mini-2024-07-18:personal:legal-position-400:AT3wvKsU",
+            temperature=0
+        )
+        # Формування повідомлень для чату
+        messages = [
+            ChatMessage(role="system", content=SYSTEM_PROMPT),
+            ChatMessage(
+                role="user",
+                content=LEGAL_POSITION_PROMPT.format(court_decision_text=court_decision_text)
+            ),
+        ]
+        # Отримання відповіді від моделі
+        response = llm_lp.chat(messages, response_format=LEGAL_POSITION_SCHEMA)
+        # Обробка відповіді
         parsed_response = json.loads(response.message.content)
+        # Перевірка наявності обов'язкових полів
+        if all(field in parsed_response for field in ["title", "text", "proceeding", "category"]):
             return parsed_response
+        return {
+            "title": "Error: Missing required fields in response",
+            "text": response.message.content,
+            "proceeding": "Unknown",
+            "category": "Error"
+        }
     except json.JSONDecodeError:
         return {
             "title": "Error parsing response",
+            "text": response.message.content,
+            "proceeding": "Unknown",
+            "category": "Error"
+        }
+    except Exception as e:
+        return {
+            "title": "Unexpected error",
+            "text": str(e),
+            "proceeding": "Unknown",
+            "category": "Error"
         }
             except Exception as e:
                 return f"Error during search: {str(e)}", None
         async def analyze_action(legal_position_json, question, nodes):
             try:
+                workflow = PrecedentAnalysisWorkflow(timeout=600)
+                # Формуємо єдиний текст запиту з legal_position_json
+                query = (
+                    f"{legal_position_json['title']}: "
+                    f"{legal_position_json['text']}: "
+                    f"{legal_position_json['proceeding']}: "
+                    f"{legal_position_json['category']}"
                 )
+                # Запускаємо workflow і отримуємо текст аналізу
+                response_text = await workflow.run(
+                    query=query,
+                    question=question,
+                    nodes=nodes
+                )
+                # Формуємо вивід
                 output = f"**Аналіз Штучного Інтелекту:**\n{response_text}\n\n"
+                output += "**Цитовані джерела існуючих правових позицій Верховного Суду:**\n\n"
+                # Розбиваємо текст відповіді на рядки
+                analysis_lines = response_text.split('\n')
+                # Проходимо по кожному рядку аналізу
+                for line in analysis_lines:
+                    if line.startswith('* ['):
+                        # З кожного рядка отримуємо індекс
+                        index = line[3:line.index(']')]  # Витягуємо індекс з "* [X]"
+                        # Знаходимо відповідний node за індексом
+                        node = nodes[int(index) - 1]
+                        source_node = node.node
+                        source_title = source_node.metadata.get('title', 'Невідомий заголовок')
+                        source_text_lp = node.text
+                        doc_ids = source_node.metadata.get('doc_id')
+                        lp_id = source_node.metadata.get('lp_id')
+                        links = get_links_html(doc_ids)
+                        links_lp = get_links_html_lp(lp_id)
+                        output += f"[{index}]: *{source_title}* | {source_text_lp} | {links_lp} | {links}\n\n"
                 return output
             except Exception as e:
                 return f"Error during analysis: {str(e)}"

prompts.py CHANGED Viewed

@@ -1,8 +1,47 @@
 from llama_index.core.prompts import PromptTemplate
 PRECEDENT_ANALYSIS_TEMPLATE = PromptTemplate(
-    "Дій як кваліфікований юрист. Проаналізуй правові позиції Верховного Суду та порівняй їх з новим рішенням.\n\n"
     "1. Нове рішення:\n{query}\n\n"
     "2. Уточнююче питання:\n{question}\n\n"
     "3. Правові позиції для аналізу:\n"
@@ -11,11 +50,13 @@ PRECEDENT_ANALYSIS_TEMPLATE = PromptTemplate(
     "\n------\n"
     "На основі аналізу створи список релевантних правових позицій. "
     "Кожна позиція повинна містити ID та короткий опис її суті. "
     "Результат надай у такому форматі JSON:\n\n"
     "{{\n"
     "    \"relevant_positions\": [\n"
     "        {{\n"
     "            \"lp_id\": \"ID позиції\",\n"
     "            \"description\": \"Короткий опис суті правової позиції\"\n"
     "        }}\n"
     "    ]\n"

 from llama_index.core.prompts import PromptTemplate
+# System prompt
+SYSTEM_PROMPT = """Дій як кваліфікований юрист."""
+# Main prompt template
+LEGAL_POSITION_PROMPT = """Дотримуйся цих інструкцій.
+1. Спочатку вам буде надано текст судового рішення:
+<court_decision>
+{court_decision_text}
+</court_decision>
+2. Уважно прочитай та проаналізуй текст наданого судового рішення. Зверни увагу на:
+   - Юридичну суть рішення
+   - Основне правове обґрунтування
+   - Головні юридичні міркування
+3. На основі аналізу сформулюй короткий зміст позиції суду, дотримуючись таких вказівок:
+   - Будь чіткими, точними та обґрунтованими
+   - Використовуй відповідну юридичну термінологію
+   - Зберігай стислість, але повністю передай суть судового рішення
+   - Уникай додаткових пояснень чи коментарів
+   - Спробуй узагальнювати та уникати специфічної інформації (наприклад, імен або назв) під час подачі результатів
+   - Використовуйте лише українську мову
+4. Створи короткий заголовок, який відображає основну суть судового рішення та зазнач його категорію.
+5. Додатково визнач тип судочинства, до якої відноситься дане рішення.
+    Використовуй лише один із цих типів: 'Адміністративне судочинство', 'Кримінальне судочинство', 'Цивільне судочинство', 'Господарське судочинство'
+6. Відформатуй відповідь у форматі JSON:
+{{
+    "title": "Заголовок судового рішення",
+    "text": "Текст короткого змісту позиції суду",
+    "proceeding": "Тип судочинства",
+    "category": "Категорія судового рішення"
+}}
+"""
 PRECEDENT_ANALYSIS_TEMPLATE = PromptTemplate(
+    "Проаналізуй правові позиції Верховного Суду та порівняй їх з новим рішенням.\n\n"
     "1. Нове рішення:\n{query}\n\n"
     "2. Уточнююче питання:\n{question}\n\n"
     "3. Правові позиції для аналізу:\n"
     "\n------\n"
     "На основі аналізу створи список релевантних правових позицій. "
     "Кожна позиція повинна містити ID та короткий опис її суті. "
+    "В описі також ОБОВ'ЯЗКОВО вкажи порядковий номер позиції зі списку наданих правових позицій. "
     "Результат надай у такому форматі JSON:\n\n"
     "{{\n"
     "    \"relevant_positions\": [\n"
     "        {{\n"
     "            \"lp_id\": \"ID позиції\",\n"
+    "            \"source_index\": \"Номер позиції у списку\",\n"
     "            \"description\": \"Короткий опис суті правової позиції\"\n"
     "        }}\n"
     "    ]\n"