Spaces:

cjber
/

planning-ai

Build error

App Files Files Community

cjber commited on Jan 17

Commit

134bc43

1 Parent(s): 999a3f7

feat: swap to gpt4o

Browse files

Files changed (4) hide show

planning_ai/graph.py +0 -4
planning_ai/llms/llm.py +1 -1
planning_ai/main.py +22 -4
planning_ai/preprocessing/geo.py +3 -0

planning_ai/graph.py CHANGED Viewed

@@ -10,7 +10,6 @@ from planning_ai.nodes.hallucination_node import (
 from planning_ai.nodes.map_node import (
     add_entities,
     generate_summary,
-    map_retrieve_themes,
     map_summaries,
     retrieve_themes,
 )
@@ -33,9 +32,6 @@ def create_graph():
         map_summaries,
         ["generate_summary"],
     )
-    graph.add_conditional_edges(
-        "retrieve_themes",
-    )
     graph.add_conditional_edges(
         "generate_summary",
         map_hallucinations,

 from planning_ai.nodes.map_node import (
     add_entities,
     generate_summary,
     map_summaries,
     retrieve_themes,
 )
         map_summaries,
         ["generate_summary"],
     )
     graph.add_conditional_edges(
         "generate_summary",
         map_hallucinations,

planning_ai/llms/llm.py CHANGED Viewed

@@ -3,4 +3,4 @@ from langchain_openai import ChatOpenAI
 load_dotenv()
-LLM = ChatOpenAI(temperature=0, model="gpt-4o-mini")


3
4	load_dotenv()
5
6	+ LLM = ChatOpenAI(temperature=0, model="gpt-4o")

planning_ai/main.py CHANGED Viewed

@@ -58,7 +58,7 @@ def read_docs():
         int(pdf.stem) if pdf.stem.isdigit() else 0
         for pdf in (Paths.STAGING / "pdfs_azure").glob("*.pdf")
     ]
-    pdf_loader = PyPDFDirectoryLoader(Paths.STAGING / "pdfs_azure")
     out = pdf_loader.load()
     pdfs_combined = {}
@@ -129,12 +129,30 @@ def wards_pop(postcodes):
     ward_boundaries = gpd.read_file(
         Paths.RAW / "Wards_December_2021_GB_BFE_2022_7523259277605796091.zip"
     )
-    ward_boundaries = ward_boundaries.merge(
         postcodes.to_pandas(), left_on="WD21CD", right_on="OSWARD"
     )
     _, ax = plt.subplots()
-    ward_boundaries.plot(ax=ax, column="prop", legend=True)
     plt.axis("off")
     plt.savefig(Paths.SUMMARY / "figs" / "wards.png")
@@ -180,7 +198,7 @@ def imd_bar(postcodes):
 def main():
-    docs = read_docs()
     n_docs = len(docs)
     logging.warning(f"{n_docs} documents being processed!")

         int(pdf.stem) if pdf.stem.isdigit() else 0
         for pdf in (Paths.STAGING / "pdfs_azure").glob("*.pdf")
     ]
+    pdf_loader = PyPDFDirectoryLoader(Paths.STAGING / "pdfs_azure", silent_errors=True)
     out = pdf_loader.load()
     pdfs_combined = {}
     ward_boundaries = gpd.read_file(
         Paths.RAW / "Wards_December_2021_GB_BFE_2022_7523259277605796091.zip"
     )
+    camb_ward_codes = (
+        wards.filter(pl.col("Electoral wards and divisions").str.contains("Cambridge"))[
+            "Electoral wards and divisions Code"
+        ]
+        .unique()
+        .to_list()
+    )
+    camb_ward_boundaries = ward_boundaries[
+        ward_boundaries["WD21CD"].isin(camb_ward_codes)
+    ]
+    ward_boundaries_prop = ward_boundaries.merge(
         postcodes.to_pandas(), left_on="WD21CD", right_on="OSWARD"
     )
     _, ax = plt.subplots()
+    ward_boundaries.plot(ax=ax, color="white", edgecolor="gray")
+    camb_ward_boundaries.plot(ax=ax, color="white", edgecolor="black")
+    ward_boundaries_prop.plot(ax=ax, column="prop", legend=True)
+    __import__("ipdb").set_trace()
+    bounds = camb_ward_boundaries.total_bounds
+    buffer = 0.1
+    ax.set_xlim([bounds[0] - buffer, bounds[2] + buffer])
+    ax.set_ylim([bounds[1] - buffer, bounds[3] + buffer])
     plt.axis("off")
     plt.savefig(Paths.SUMMARY / "figs" / "wards.png")
 def main():
+    docs = read_docs()[:5]
     n_docs = len(docs)
     logging.warning(f"{n_docs} documents being processed!")

planning_ai/preprocessing/geo.py ADDED Viewed

	@@ -0,0 +1,3 @@


1	+ import polars as pl
2	+
3	+ df = pl.read_parquet("./data/staging/gcpt3.parquet")