AGENT_ANALYSE_RAG_dev

Running

App Files Files Community

Ilyas KHIAT commited on Aug 5, 2024

Commit

7b897df

1 Parent(s): c80303c

chatbot

Browse files

Files changed (3) hide show

audit_page/knowledge_graph.py +97 -8
utils/audit/response_llm.py +3 -3
utils/kg/construct_kg.py +1 -1

audit_page/knowledge_graph.py CHANGED Viewed

@@ -2,6 +2,9 @@ import streamlit as st
 from utils.kg.construct_kg import get_graph
 from utils.audit.rag import get_text_from_content_for_doc,get_text_from_content_for_audio
 from streamlit_agraph import agraph, Node, Edge, Config
 def if_node_exists(nodes, node_id):
     """
@@ -19,7 +22,51 @@ def if_node_exists(nodes, node_id):
             return True
     return False
-def convert_neo4j_to_agraph(neo4j_graph):
     """
     Converts a Neo4j graph into an Agraph format.
@@ -39,11 +86,12 @@ def convert_neo4j_to_agraph(neo4j_graph):
         # Use the node id as the Agraph node id
         node_id = node.id.replace(" ", "_")  # Replace spaces with underscores for ids
         label = node.id
         size = 25  # Default size, can be customized
         shape = "circle"  # Default shape, can be customized
         # For example purposes, no images are added, but you can set 'image' if needed.
-        nodes.append(Node(id=node_id, label=label, size=size, shape=shape))
     # Creating Agraph edges
     for relationship in neo4j_graph.relationships:
@@ -51,18 +99,20 @@ def convert_neo4j_to_agraph(neo4j_graph):
         shape = "circle"  # Default shape, can be customized
         source = relationship.source
         source_id = source.id.replace(" ", "_")
         label_source = source.id
-        source_node = Node(id=source_id, label=label_source, size=size, shape=shape)
         if not if_node_exists(nodes, source_node.id):
             nodes.append(source_node)
         target = relationship.target
         target_id = target.id.replace(" ", "_")
         label_target = target.id
-        target_node = Node(id=target_id, label=label_target, size=size, shape=shape)
         if not if_node_exists(nodes, target_node.id):
             nodes.append(target_node)
@@ -74,9 +124,19 @@ def convert_neo4j_to_agraph(neo4j_graph):
     config = Config(width=1200, height=950, directed=True, physics=False, hierarchical=False, nodeSpacing=500)
     # Create the Agraph visualization
-    return_value = agraph(nodes=nodes, edges=edges, config=config)
-    return return_value
 def kg_main():
@@ -85,6 +145,13 @@ def kg_main():
         st.session_state.graph = None
     st.title("Graphe de connaissance")
     if "audit" not in st.session_state or st.session_state.audit == {}:
         st.error("Veuillez d'abord effectuer un audit pour obtenir des recommandations d'agents.")
         return
@@ -96,18 +163,40 @@ def kg_main():
         text = get_text_from_content_for_doc(content)
     elif audit["type de fichier"] == "audio":
         text = get_text_from_content_for_audio(content)
     if st.button("Générer le graphe"):
         with st.spinner("Génération du graphe..."):
             graph = get_graph(text)
-        st.session_state.graph = graph
     else:
         graph = st.session_state.graph
     if graph is not None:
         #st.write(graph)
-        agraph_obj = convert_neo4j_to_agraph(graph[0])
 kg_main()

 from utils.kg.construct_kg import get_graph
 from utils.audit.rag import get_text_from_content_for_doc,get_text_from_content_for_audio
 from streamlit_agraph import agraph, Node, Edge, Config
+import random
+import math
+from utils.audit.response_llm import generate_response_openai
 def if_node_exists(nodes, node_id):
     """
             return True
     return False
+def generate_random_color():
+    r = random.randint(180, 255)
+    g = random.randint(180, 255)
+    b = random.randint(180, 255)
+    return (r, g, b)
+def rgb_to_hex(rgb):
+    return '#{:02x}{:02x}{:02x}'.format(rgb[0], rgb[1], rgb[2])
+def get_node_types(graph):
+    node_types = set()
+    for node in graph.nodes:
+        node_types.add(node.type)
+    for relationship in graph.relationships:
+        source = relationship.source
+        target = relationship.target
+        node_types.add(source.type)
+        node_types.add(target.type)
+    return node_types
+def color_distance(color1, color2):
+    # Calculate Euclidean distance between two RGB colors
+    return math.sqrt((color1[0] - color2[0]) ** 2 + (color1[1] - color2[1]) ** 2 + (color1[2] - color2[2]) ** 2)
+def generate_distinct_colors(num_colors, min_distance=30):
+    colors = []
+    while len(colors) < num_colors:
+        new_color = generate_random_color()
+        if all(color_distance(new_color, existing_color) >= min_distance for existing_color in colors):
+            colors.append(new_color)
+    return [rgb_to_hex(color) for color in colors]
+def list_to_dict_colors(node_types:set):
+    number_of_colors = len(node_types)
+    colors = generate_distinct_colors(number_of_colors)
+    node_colors = {}
+    for i, node_type in enumerate(node_types):
+        node_colors[node_type] = colors[i]
+    return node_colors
+def convert_neo4j_to_agraph(neo4j_graph, node_colors):
     """
     Converts a Neo4j graph into an Agraph format.
         # Use the node id as the Agraph node id
         node_id = node.id.replace(" ", "_")  # Replace spaces with underscores for ids
         label = node.id
+        type = node.type
         size = 25  # Default size, can be customized
         shape = "circle"  # Default shape, can be customized
         # For example purposes, no images are added, but you can set 'image' if needed.
+        nodes.append(Node(id=node_id,title=type, label=label, size=size, shape=shape,color=node_colors[type]))
     # Creating Agraph edges
     for relationship in neo4j_graph.relationships:
         shape = "circle"  # Default shape, can be customized
         source = relationship.source
+        source_type = source.type
         source_id = source.id.replace(" ", "_")
         label_source = source.id
+        source_node = Node(id=source_id,title=source_type, label=label_source, size=size, shape=shape,color=node_colors[source_type])
         if not if_node_exists(nodes, source_node.id):
             nodes.append(source_node)
         target = relationship.target
+        target_type = target.type
         target_id = target.id.replace(" ", "_")
         label_target = target.id
+        target_node = Node(id=target_id,title=target_type, label=label_target, size=size, shape=shape,color=node_colors[target_type])
         if not if_node_exists(nodes, target_node.id):
             nodes.append(target_node)
     config = Config(width=1200, height=950, directed=True, physics=False, hierarchical=False, nodeSpacing=500)
     # Create the Agraph visualization
+    return edges, nodes, config
+def display_graph(edges, nodes, config):
+    # Display the Agraph visualization
+    agraph(edges=edges, nodes=nodes, config=config)
+def filter_nodes_by_types(nodes:list[Node], node_types_filter:list) -> list[Node]:
+    filtered_nodes = []
+    for node in nodes:
+        if node.title in node_types_filter: #the title represents the type of the node
+            filtered_nodes.append(node)
+    return filtered_nodes
 def kg_main():
         st.session_state.graph = None
     st.title("Graphe de connaissance")
+    if "node_types" not in st.session_state:
+        st.session_state.node_types = None
+    if "summary" not in st.session_state:
+        st.session_state.summary = None
     if "audit" not in st.session_state or st.session_state.audit == {}:
         st.error("Veuillez d'abord effectuer un audit pour obtenir des recommandations d'agents.")
         return
         text = get_text_from_content_for_doc(content)
     elif audit["type de fichier"] == "audio":
         text = get_text_from_content_for_audio(content)
+    #summary_prompt = f"Voici un ensemble de documents : {text}. À partir de ces documents, veuillez fournir des résumés concis en vous concentrant sur l'extraction des relations essentielles et des événements. Il est crucial d'inclure les dates des actions ou des événements, car elles seront utilisées pour l'analyse chronologique. Par exemple : 'Sam a été licencié par le conseil d'administration d'OpenAI le 17 novembre 2023 (17 novembre, vendredi)', ce qui illustre la relation entre Sam et OpenAI ainsi que la date de l'événement."
     if st.button("Générer le graphe"):
+        # with st.spinner("Extractions des relations..."):
+        #     sum = generate_response_openai(summary_prompt,model="gpt-4o")
+        #     st.session_state.summary = sum
         with st.spinner("Génération du graphe..."):
             graph = get_graph(text)
+            st.session_state.graph = graph
+        node_types = get_node_types(graph[0])
+        nodes_type_dict = list_to_dict_colors(node_types)
+        st.session_state.node_types = nodes_type_dict
     else:
         graph = st.session_state.graph
     if graph is not None:
         #st.write(graph)
+        edges,nodes,config = convert_neo4j_to_agraph(graph[0],st.session_state.node_types)
+        filter = st.multiselect("Filtrer selon l'étiquette",st.session_state.node_types.keys(),placeholder="Sélectionner une ou plusieurs étiquettes")
+        if filter:
+            nodes = filter_nodes_by_types(nodes,filter)
+        display_graph(edges,nodes,config)
+    node_types = st.session_state.node_types
 kg_main()

utils/audit/response_llm.py CHANGED Viewed

@@ -3,10 +3,10 @@ from langchain_openai import ChatOpenAI
 from langchain_core.output_parsers import StrOutputParser
 from langchain_core.prompts import PromptTemplate
-def generate_response_openai(prompt: str,stream:bool = False) -> str:
     client = OpenAI()
     response = client.chat.completions.create(
-        model="gpt-4o-mini",
         messages=[
             {"role": "user", "content": prompt}
         ],
@@ -18,7 +18,7 @@ def generate_response_openai(prompt: str,stream:bool = False) -> str:
 def generate_response_via_langchain(query: str, stream: bool = False, model: str = "gpt-4o-mini") :
     # Define the prompt template
-    template = "You are an agent designer expert: {query}"
     prompt = PromptTemplate.from_template(template)
     # Initialize the OpenAI LLM with the specified model

 from langchain_core.output_parsers import StrOutputParser
 from langchain_core.prompts import PromptTemplate
+def generate_response_openai(prompt: str,stream:bool = False,model = "gpt-4o-mini") -> str:
     client = OpenAI()
     response = client.chat.completions.create(
+        model=model,
         messages=[
             {"role": "user", "content": prompt}
         ],
 def generate_response_via_langchain(query: str, stream: bool = False, model: str = "gpt-4o-mini") :
     # Define the prompt template
+    template = "{query}"
     prompt = PromptTemplate.from_template(template)
     # Initialize the OpenAI LLM with the specified model

utils/kg/construct_kg.py CHANGED Viewed

@@ -5,13 +5,13 @@ from langchain_core.documents import Document
 def get_graph(text):
-    graph = Neo4jGraph()
     llm = ChatOpenAI(temperature=0, model_name="gpt-4o")
     llm_transformer = LLMGraphTransformer(llm=llm)
     documents = [Document(page_content=text)]
     graph_documents = llm_transformer.convert_to_graph_documents(documents)
     return graph_documents

 def get_graph(text):
     llm = ChatOpenAI(temperature=0, model_name="gpt-4o")
     llm_transformer = LLMGraphTransformer(llm=llm)
     documents = [Document(page_content=text)]
     graph_documents = llm_transformer.convert_to_graph_documents(documents)
     return graph_documents