Spaces:

cfahlgren1
/

datasets-ai

Runtime error

Caleb Fahlgren commited on Jun 5, 2024

Commit

91c3a02

1 Parent(s): 6d4f7ef

use smaller dataset, improve graph

Files changed (1) hide show

app.py CHANGED Viewed

@@ -86,7 +86,7 @@ def generate_query(dataset_id: str, query: str) -> str:
     ddl = get_dataset_ddl(dataset_id)
     system_prompt = f"""
-    You are an expert SQL assistant with access to the following DuckDB Table:
     ```sql
     {ddl}
@@ -116,18 +116,24 @@ def generate_query(dataset_id: str, query: str) -> str:
 def query_dataset(dataset_id: str, query: str) -> Tuple[pd.DataFrame, str, plt.Figure]:
     response: SQLResponse = generate_query(dataset_id, query)
     df = conn.execute(response.sql).fetchdf()
     plot = None
     if response.visualization_type == OutputTypes.LINECHART:
         plot = df.plot(
-            kind="line", x=response.data_key, y=response.label_key
         ).get_figure()
     elif response.visualization_type == OutputTypes.BARCHART:
         plot = df.plot(
-            kind="bar", x=response.data_key, y=response.label_key
         ).get_figure()
     markdown_output = f"""```sql\n{response.sql}\n```"""
     return df, markdown_output, plot
@@ -139,7 +145,7 @@ with gr.Blocks() as demo:
         label="Hub Dataset ID",
         placeholder="Find your favorite dataset...",
         search_type="dataset",
-        value="teknium/OpenHermes-2.5",
     )
     user_query = gr.Textbox("", label="Ask anything...")

     ddl = get_dataset_ddl(dataset_id)
     system_prompt = f"""
+    You are an expert SQL assistant with access to the following PostgreSQL Table:
     ```sql
     {ddl}
 def query_dataset(dataset_id: str, query: str) -> Tuple[pd.DataFrame, str, plt.Figure]:
     response: SQLResponse = generate_query(dataset_id, query)
+    print("Querying Parquet...")
     df = conn.execute(response.sql).fetchdf()
     plot = None
     if response.visualization_type == OutputTypes.LINECHART:
         plot = df.plot(
+            kind="line", x=response.label_key, y=response.data_key
         ).get_figure()
+        plt.xticks(rotation=45, ha="right")
+        plt.tight_layout()
     elif response.visualization_type == OutputTypes.BARCHART:
         plot = df.plot(
+            kind="bar", x=response.label_key, y=response.data_key
         ).get_figure()
+        plt.xticks(rotation=45, ha="right")
+        plt.tight_layout()
     markdown_output = f"""```sql\n{response.sql}\n```"""
     return df, markdown_output, plot
         label="Hub Dataset ID",
         placeholder="Find your favorite dataset...",
         search_type="dataset",
+        value="gretelai/synthetic_text_to_sql",
     )
     user_query = gr.Textbox("", label="Ask anything...")