Spaces:

iberbench
/

leaderboard

Running

App Files Files Community

Alvaro Romo commited on Jan 15

Commit

b7f9bcb

1 Parent(s): c2f297a

Added filter data

Browse files

Files changed (1) hide show

app.py +51 -17

app.py CHANGED Viewed

@@ -19,6 +19,19 @@ HF_TOKEN = os.environ.get("HF_TOKEN", None)
 request_file = Path("user_request/") / f"data_{uuid.uuid4()}.json"
 request_folder = request_file.parent
 scheduler = CommitScheduler(
     repo_id="iberbench/ivace-user-request",
     repo_type="dataset",
@@ -52,17 +65,6 @@ def get_url(html_content: str) -> str:
 @st.cache_data
 def load_data() -> pd.DataFrame:
     try:
-        columns = [
-            "eval_name",
-            "Model",
-            "Type",
-            "Average ⬆️",
-            "IFEval",
-            "MMLU-PRO",
-            "GPQA",
-            "MUSR",
-            "CO₂ cost (kg)",
-        ]
         data = (
             load_dataset("open-llm-leaderboard/contents")["train"]
             .to_pandas()
@@ -72,14 +74,39 @@ def load_data() -> pd.DataFrame:
         data["Model"] = data["Model"].apply(get_url)
         data.sort_values(by="Average ⬆️", ascending=False, inplace=True)
         data.reset_index(drop=True, inplace=True)
         return data
     except FileNotFoundError:
         st.error("open-llm-leaderboard/contents was not found in the hub")
         return pd.DataFrame()
 # streamlit UI
 leaderboard_data = load_data()
 tabs = st.tabs(["Leaderboard", "Submit model"])
 with tabs[0]:
@@ -101,13 +128,20 @@ with tabs[0]:
         """,
         unsafe_allow_html=True,
     )
-    # leaderboard_cols = st.columns([0.1, 0.8, 0.1], vertical_alignment="center")
-    # with leaderboard_cols[1]:
-    if not leaderboard_data.empty:
-        st.data_editor(
-            leaderboard_data,
             column_config={"Model": st.column_config.LinkColumn("Model")},
-            hide_index=False,
         )
     else:
         st.write("No data found to display on leaderboard.")

 request_file = Path("user_request/") / f"data_{uuid.uuid4()}.json"
 request_folder = request_file.parent
+# column order
+columns = [
+    "eval_name",
+    "Model",
+    "Type",
+    "Average ⬆️",
+    "IFEval",
+    "MMLU-PRO",
+    "GPQA",
+    "MUSR",
+    "CO₂ cost (kg)",
+]
 scheduler = CommitScheduler(
     repo_id="iberbench/ivace-user-request",
     repo_type="dataset",
 @st.cache_data
 def load_data() -> pd.DataFrame:
     try:
         data = (
             load_dataset("open-llm-leaderboard/contents")["train"]
             .to_pandas()
         data["Model"] = data["Model"].apply(get_url)
         data.sort_values(by="Average ⬆️", ascending=False, inplace=True)
         data.reset_index(drop=True, inplace=True)
+        # add column to apply filtering
+        data["Active"] = False
         return data
     except FileNotFoundError:
         st.error("open-llm-leaderboard/contents was not found in the hub")
         return pd.DataFrame()
+# functions to create filter
+def active_data() -> pd.DataFrame:
+    """Change all records as active"""
+    return st.session_state["leaderboard_data"][st.session_state["leaderboard_data"]["Active"] == True].copy()
+def get_index(row) -> pd.Series:
+    """Get index of the row"""
+    return active_data().iloc[row].name
+def commit() -> None:
+    """Commit changes to the session state"""
+    for row in st.session_state.editor["edited_rows"]:
+        row_index = get_index(row)
+        for key, value in st.session_state.editor["edited_rows"][row].items():
+            st.session_state["leaderboard_data"].at[row_index, key] = value
 # streamlit UI
 leaderboard_data = load_data()
+if "leaderboard_data" not in st.session_state:
+    st.session_state["leaderboard_data"] = leaderboard_data
 tabs = st.tabs(["Leaderboard", "Submit model"])
 with tabs[0]:
         """,
         unsafe_allow_html=True,
     )
+    if not st.session_state["leaderboard_data"].empty:
+        name = st.text_input("Search for ...", on_change=commit)
+        if name == "":
+            st.session_state["leaderboard_data"].Active = True
+        else:
+            st.session_state["leaderboard_data"].Active = False
+            st.session_state["leaderboard_data"].loc[
+                st.session_state["leaderboard_data"]["Model"].str.contains(name, case=False), "Active"
+            ] = True
+        edited_data = st.data_editor(
+            active_data(), column_order=columns, key="editor", hide_index=False,
             column_config={"Model": st.column_config.LinkColumn("Model")},
         )
     else:
         st.write("No data found to display on leaderboard.")